diseño de almacenes de datos

14
ESCUELA: NOMBRES: BASE DE DATOS AVANZADAS Ciencias de la Computación 1 Ing. Juan Carlos Morocho Unidad 8: Diseño de almacenes de datos

Upload: utpl-utpl

Post on 26-Jun-2015

223 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Diseño de almacenes de datos

ESCUELA:

NOMBRES:

BASE DE DATOS AVANZADAS

Ciencias de la Computación

1

Ing. Juan Carlos Morocho

Unidad 8: Diseño de almacenes de datos

Page 2: Diseño de almacenes de datos

Emprender en el diseño de un almacén de datos no es tarea fácil, pero la utilización de una metodología adecuada será clave.

Considerando que un almacén de datos tiene un alcance corporativo, a veces resulta mejor empezar por mercados de datos, pero hay que tener en cuenta que el fin último es un almacén de datos que soporte las necesidades de toda la organización en forma integrada.

Diseño de almacenes de datos

Page 3: Diseño de almacenes de datos

Metodología de diseño

1. Selección del proceso

Ejemplo: Cadena de supermercados.Cadena de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos.

Actividad: Ventas.La actividad a modelar son las ventas de productos en los almacenes de la cadena

Page 4: Diseño de almacenes de datos

Metodología de diseño

2. Selección de la granularidadEjemplo: Cadena de supermercados.Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada almacén de la cadena”.Gránulo: • Define el significado de las tuplas de la tabla de hechos.• Determina las dimensiones básicas del esquema

Page 5: Diseño de almacenes de datos

Metodología de diseño

3. Identificación y conformación de las dimensiones

Ejemplo: Cadena de supermercados.

Definición de gránulo

Dimensiones básicas

•Tiempo•Producto•Establecimiento

Page 6: Diseño de almacenes de datos

Metodología de diseño

4. Selección de los hechosEjemplo: Cadena de supermercados.Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada establecimiento de la cadena”.

• Importe total de las ventas del producto en el día.• Número total de unidades vendidas del producto en el día.• Número total de clientes distintos que han comprado el producto en el día.

Page 7: Diseño de almacenes de datos

Metodología de diseño

5. Almacenamiento de los valores precalculados en la tabla de hechos.

Valor precalculado

Page 8: Diseño de almacenes de datos

Metodología de diseño

6. Terminación de las tablas de dimensión

La idea es añadir descripciones textuales a las dimensiones hasta ahora definidas, para que sean entendibles para los usuarios.

En lugar de “nro_clientes”, una descripciónmás inituitiva sería “Total de clientes”.

Page 9: Diseño de almacenes de datos

Metodología de diseño

7. Selección de la duración de la base de datos.

Definir la cantidad de tiempo con la cual se va a trabajar o a contrastar los datos de las tablas de hechos. Generalmente se hacen comparaciones de dos años atrás, pero por temas legales en otros casos se trabaja con datos de hasta cinco años atrás.

Page 10: Diseño de almacenes de datos

Metodología de diseño

8. Control de las dimensiones lentamente cambiantes

Tipo 1: Sobreescribe un atributo de dimensión modificado.Tipo 2: Un atributo de dimensión modificado hace que se cree un nuevo registro de dimensión.Tipo 3: Un atributo de dimensión modificado hace que se cree un atributo alternativo.

Page 11: Diseño de almacenes de datos

Metodología de diseño

9. Selección de las prioridades de consulta y de los modos de consulta

Esto es importante ya que hay que considerar que la consultas siempre manejan gran cantidad de datos, calculan subtotales, ordenan resultados, por lo que consume una cantidad considerable de recursos.

Page 12: Diseño de almacenes de datos

Trabajos citados

Hernández Orallo, J. (s.f.). Curso: Análisis y Extracción de Conocimiento en Sistemas de Información. Recuperado el 5 de Marzo de 2012, de Departamento de Sistemas Informáticos y Computación: http://users.dsic.upv.es/~jorallo/cursoDWDM/dwdm-II.pdf

12

Page 13: Diseño de almacenes de datos

Información de contacto:

E-mail: [email protected]

Cuenta en skype: jcmorocho

Page 14: Diseño de almacenes de datos

14