elaborado por: guillermo baquerizo i término 2012-2013

Post on 22-Jan-2016

227 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Elaborado por: Guillermo BaquerizoI Término 2012-2013

Bases de Datos IIOLAP

Online Analytical Processing

ObjetivosEl estudiante será capaz de aprender:

el propósito del procesamiento analítico en línea.

las relaciones entre OLAP y los almacenes de datos (DATA WAREHOUSE).

las características clave de las aplicaciones OLAP.

cómo representar cubos multidimensionales.las categorías de las herramientas OLAP.

ConceptosOLAP.- Se refiere a la síntesis, análisis y

consolidación de grandes volúmenes de datos multidimensionales. Es una solución utilizada en el campo BI (Business Intelligence), para lo cual utiliza cubos de información y puede ser utilizado en DATA MINING (Minería de Datos).

ConceptosLas bases de datos relacionales se utilizan

principalmente para soportar sistemas de procesamiento de transacciones en línea (OLTP, Online Transaction Processing).

Los DBMS (DataBase Management System) relacionales se han desarrollado para permitir la ejecución eficiente de un gran número de transacciones relativamente simples.

ConceptosLos DBMS relacionales han tratado de

dirigirse al mercado de los almacenes de datos y han promocionado sus sistemas como herramientas para construir este tipo de almacenes.

Para consultas más avanzadas se requiere el OLAP.

Esquema

ETL

ExtractionTransformatio

nLoading

Sistemas Operacional

es

Metadatos

Datos resumidos

ERP

CRM

Archivosplanos Data WareHouse

OLAP

Reportes

Minería de datos

AplicacionesÁrea funcional

Ejemplos de aplicaciones OLAP

Finanzas Presupuestos, desgloses de costos por actividad, análisis de rendimiento financiero y modelado financiero.

Ventas Análisis de ventas y previsiones de ventas.

Marketing Análisis de investigación de mercados, previsiones de ventas, análisis de promociones, análisis y segmentación de clientes.

Fabricación Planificación de la producción y análisis de defectos.

Cubos multidimensionalesConsidere un ejemplo con los datos

multidimensionales vistos desde:Una tabla de 3 camposUna matriz bidimensionalUn cubo tridimensional

CategoríasLas herramientas OLAP pueden clasificarse

de acuerdo con la arquitectura utilizada para almacenar y procesar los datos multidimensionales. Hay cuatro categorías principales:MOLAPROLAPHOLAPDOLAP

OLAP Multidimensional (MOLAP)Las estructuras de datos MOLAP utilizan

tecnología matricial y técnicas eficientes de almacenamiento que minimizan las necesidades de espacio en disco, gracias a la gestión de datos dispersos.

Se suelen centrar en datos para una aplicación específica de ayuda a la toma de decisiones.

OLAP Multidimensional (MOLAP)Problemas:

Sólo pueden almacenarse y analizarse de manera eficiente una cantidad limitada de datos.

La navegación y el análisis de los datos están limitados, porque los datos se diseñan de acuerdo a requisitos previamente determinados.

Los productos MOLAP requieren un conjunto diferente de capacidades y herramientas para construir y mantener la base de datos, incrementándose el costo y la complejidad de las tareas de soporte.

OLAP Multidimensional (MOLAP)

Servidor de base de datos relacional y/o sistemas

heredados

Carga

Servidor MOLAP Solicitud de datos

Herramientas de acceso de

usuario final

Conjunto de resultados

OLAP Relacional (ROLAP)Soportan los productos RDBMS mediantes el

uso de un nivel de metadatos, evitando así la necesidad de crear una estructura de datos mutidimensional estática. Esto facilita la creación de múltiples vistas multidimensionales de la relación bidimensional.

Para mejorar las prestaciones, algunos productos ROLAP disponen de motores SQL mejorados para soportar la compeljidad del análisis multidimensional.

OLAP Relacional (ROLAP)Problemas:

Rendimiento asociado con el procesamiento de consultas complejas que requieran efectuar múltiples pasadas a través de los datos relacionales.

Desarrollo de middleware para facilitar el desarrollo de aplicaciones multidimensionales, es decir, software que convierta la relación bidimensional en una estructura multidimensional.

Desarrollo de una opción para crear estructuras multidimensionales persistentes, junto con las funciones para ayudar en la administración de estas estructuras.

OLAP Relacional (ROLAP)

Servidor de base de datos relacional

Conjunto de resultados

Servidor ROLAP Solicitud de datos

Herramientas de acceso de

usuario final

Conjunto de resultados

SQL

OLAP híbrido (HOLAP)Proporcionan capacidades limitadas de

análisis, bien sobre productos SGBDR o bien utilizando un servidor MOLAP intermedio.

Las herramientas HOLAP suministran a la máquina de escritorio los datos seleccionados en la forma de un cubo de datos, el cual se almacena, analiza y mantiene localmente.

OLAP híbrido (HOLAP)Problemas:

La arquitectura provoca una significativa redundancia de los datos y puede causar problemas en las redes que soporten muchos usuarios.

La capacidad de cada usuario para construir un cubo de datos personalizado puede provocar una falta de coherencia entre los datos de los diferentes usuarios.

Sólo puede mantenerse de manera eficiente una cantidad limitada de datos.

OLAP híbrido (HOLAP)Servidor de base de datos

relacional

Carga

Servidor MOLAP

Solicitud de datos

Conjunto de resultados

Herramientas de acceso de

usuario final

SQL

Conjunto de resultados

OLAP de Escritorio (DOLAP)Almacenan los datos OLAP en archivos

situados en la plataforma del cliente y soportan el procesamiento multidimensional del lado del cliente.

Estos datos pueden distribuirse por adelantado o bajo petición, posiblemente a través de la web.

Aunque también se pueden mantener en el disco o la RAM, algunos productos DOLAP sólo permiten acceso de lectura.

OLAP de Escritorio (DOLAP)Problemas:

Provisión de controles de seguridad apropiados para soportar todos los entornos.

Hace falta reducir el esfuerzo necesario para implantar y mantener las herramientas DOLAP.

Las formas existentes son: correo electrónico, web o la tradicional arquitectura cliente-servidor.

Las tendencias actuales apuntan hacia la utilización de máquinas cliente simples.

OLAP de Escritorio (DOLAP)

Servidor de base de datos relacional

Servidor MOLAP

La distribución de los datos OLAP desde una base de datos

relacional o desde un servidor MOLAP hasta el PC de

escritorio o portátil se realiza utilizando

correo electrónico, la web o una

arquitectura tradicional cliente-

servidor.

Extensiones al lenguaje SQLSe pueden realizar cálculos utilizando

agregación del tipo de SUM, COUNT, MAX, MIN, AVG

Capacidades de agrupamiento ampliadas:Rollup: Niveles crecientes de agregación

desde el más detallado hasta el más general. La instrucción es:

SELECT … GROUP BY (ListaDeColumnas) WITH ROLLUP

Cube: Similar a Rollup, pero permite todas las posibles combinaciones de agregaciones.

La instrucción es: SELECT … GROUP BY (ListaDeColumnas) WITH

CUBE

top related