aprovechar los cada vez más numerosos ... - bases de datos · empresas han creado almacenes de...

32

Upload: vuongxuyen

Post on 15-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Las empresas han comenzado a

aprovechar los cada vez más numerosos

datos en línea para tomar mejores

decisiones sobre sus actividades.

Para ejecutar de manera eficiente las

consultas sobre datos tan diferentes las

empresas han creado almacenes de

datos (Date Warehouse).

El término OLAP fue introducido en

Agosto de 1993 por el Dr. E.F. Codd y

apoyado por Arbor Software

Corporation.

Definición de Codd: OLAP es un tipo de

procesamiento de datos que se

caracteriza, entre otras cosas, por

permitir el análisis multidimensional

Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.

Dedicado a implementaciones de

procesamiento analítico en línea que no

dependen de bases de datos

relacionales.

Consultas rápidas.

Ocupa menor tamaño en disco en comparación con los datos almacenados en base de datos relacional

Automatización del procesamiento de los datos agregados de mayor nivel.

Muy compacto para conjuntos de datos de pocas dimensiones.

Eficaz extracción de datos lograda gracias a la pre-estructuración de los datos agregados

La etapa de procesamiento (carga de

datos) puede ser bastante larga.

Algunas herramientas MOLAP tienen

dificultades para actualizar y consultar

los modelos con hasta cierto número de

dimensiones.

El enfoque MOLAP introduce

redundancia en los datos

realiza un análisis dinámico

multidimensional de los datos

almacenados en una base de datos

relacional

El usuario envía una solicitud de análisis

multidimensional y el motor ROLAP

convierte la solicitud a SQL para su

presentación a la base de datos. A

continuación, la operación se realiza a

la inversa: el motor convierte los datos

resultantes de SQL a un formato

multidimensional antes de que se

devuelve al cliente para su visualización.

ROLAP se considera más escalable para

manejar grandes volúmenes de datos.

Hay disponible una gran variedad de

herramientas de carga de datos para

sistemas relacionales

Los datos se almacenan en una base de

datos relacional estándar que puede ser

accedida por cualquier herramienta de

generación de informes SQL.

El proceso de carga de tablas agregadas debe ser gestionado por código ETL personalizado

Muchos desarrolladores de modelos dimensionales ROLAP ignoran el paso de crear tablas agregadas.

Los sistemas ROLAP se construyen sobre bases de datos de propósito general, por lo que hay algunas funcionalidades especiales propias de las herramientas MOLAP que no están disponibles en los sistemas ROLAP.

Combina los atributos de MOLAP y

ROLAP. En el caso de HOLAP las

agregaciones se almacenen en una

estructura multidimensional y los datos a

nivel detalle se realiza el

almacenamiento en una base de datos

relacional.

Los datos suelen ser datos

multidimensionales, con atributos de

dimensión y atributos de medida

Es la tabla

principal en

un modelo

dimensional

donde se

almacena las

medidas de

rendimiento

numéricos de

la empresa

Las tablas de

dimensiones

contienen las

descripciones

textuales de

los negocios

Consta de

una tabla de

hechos

central y de

varias tablas

de

dimensiones

relacionadas

a esta

Posee los mejores tiempos de respuesta.

Su diseño es fácilmente modificable.

Existe paralelismo entre su diseño y la

forma en que los usuarios visualizan y

manipulan los datos.

Simplifica el análisis.

Facilita la interacción con herramientas

de consulta y análisis

Consta una tabla de hechos central que está relacionada con una o más tablas de dimensiones, quienes a su vez pueden estar relacionadas o no con una o más tablas de dimensiones

Posee mayor complejidad en su

estructura.

Hace una mejor utilización del espacio.

Es muy útil en tablas de dimensiones de

muchas tuplas.

Las tablas de dimensiones están

normalizadas, por lo que requiere menos

esfuerzo de diseño

Si se poseen múltiples tablas de

dimensiones, cada una de ellas con

varias jerarquías, se creará un número

de tablas bastante considerable, que

pueden llegar al punto de ser

inmanejables.

Al existir muchas uniones y relaciones

entre tablas, el desempeño puede verse

reducido

Este modelo está compuesto por una

serie de esquemas en estrella, está

formado por una tabla de hechos

principal (“HECHOS_A”) y por una o más

tablas de hechos auxiliares

(“HECHOS_B”), las cuales pueden ser

sumarizaciones de la principal

Permite tener más de una tabla de

hechos, por lo cual se podrán analizar

más aspectos claves del negocio.

Contribuye a la reutilización de las tablas

de dimensiones.

No es soportado por todas las

herramientas de consulta y análisis

Representa una relación lógica entre

dos o más atributos pertenecientes a un

cubo multidimensional; siempre y

cuando posean su correspondiente

relación “padre-hijo”

Slice(Corte). Es el acto de elegir un

subconjunto de un cubo rectangular

eligiendo un único valor para una de sus

dimensiones, la creación de un nuevo

cubo con una dimensión menos.

Dice. Esta operación produce un

subcubo que permite al analista tomar

valores específicos de múltiples

dimensiones

Drill Down / Up. Permite al usuario

navegar entre los niveles de datos que

van desde el más resumido (arriba)

hasta los más detallados (abajo)

Pivot. Permite al analista rotar el cubo en

el espacio para ver sus caras distintas

Kimball Ralph, Ross Margy, The Data Warehouse Toolkit 2da. Edición, The Complete Guide to Dimensional Modeling, John Wiley & Sons, Inc., 2002.

Thomsen Erik, OLAP Solutions Building Multidimensional Information

Systems 2da. Edición, The Complete Guide to Dimensional Modeling, John Wiley & Sons, Inc., 2002.

Silberschatz Abraham, F. Korth Henry, Sudarshan S., Fundamentos de

Bases de Datos 4ta. Edición, Mc. Graw. Hill, 2002. Date, C. J., Introducción a los sistemas de bases de datos., Prentice Hall,

2001. http://www.dssresources.com/glossary/olaptrms.html http://searchsqlserver.techtarget.com/definition/MOLAP http://www.dataprix.com/datawarehouse-manager

http://en.wikipedia.org/wiki/OLAP_cube#Hierarchy http://es.wikipedia.org/wiki/Cubo_OLAP