diseño de almacenes de datos
Post on 26-Jun-2015
223 Views
Preview:
TRANSCRIPT
ESCUELA:
NOMBRES:
BASE DE DATOS AVANZADAS
Ciencias de la Computación
1
Ing. Juan Carlos Morocho
Unidad 8: Diseño de almacenes de datos
Emprender en el diseño de un almacén de datos no es tarea fácil, pero la utilización de una metodología adecuada será clave.
Considerando que un almacén de datos tiene un alcance corporativo, a veces resulta mejor empezar por mercados de datos, pero hay que tener en cuenta que el fin último es un almacén de datos que soporte las necesidades de toda la organización en forma integrada.
Diseño de almacenes de datos
Metodología de diseño
1. Selección del proceso
Ejemplo: Cadena de supermercados.Cadena de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos.
Actividad: Ventas.La actividad a modelar son las ventas de productos en los almacenes de la cadena
Metodología de diseño
2. Selección de la granularidadEjemplo: Cadena de supermercados.Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada almacén de la cadena”.Gránulo: • Define el significado de las tuplas de la tabla de hechos.• Determina las dimensiones básicas del esquema
Metodología de diseño
3. Identificación y conformación de las dimensiones
Ejemplo: Cadena de supermercados.
Definición de gránulo
Dimensiones básicas
•Tiempo•Producto•Establecimiento
Metodología de diseño
4. Selección de los hechosEjemplo: Cadena de supermercados.Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada establecimiento de la cadena”.
• Importe total de las ventas del producto en el día.• Número total de unidades vendidas del producto en el día.• Número total de clientes distintos que han comprado el producto en el día.
Metodología de diseño
5. Almacenamiento de los valores precalculados en la tabla de hechos.
Valor precalculado
Metodología de diseño
6. Terminación de las tablas de dimensión
La idea es añadir descripciones textuales a las dimensiones hasta ahora definidas, para que sean entendibles para los usuarios.
En lugar de “nro_clientes”, una descripciónmás inituitiva sería “Total de clientes”.
Metodología de diseño
7. Selección de la duración de la base de datos.
Definir la cantidad de tiempo con la cual se va a trabajar o a contrastar los datos de las tablas de hechos. Generalmente se hacen comparaciones de dos años atrás, pero por temas legales en otros casos se trabaja con datos de hasta cinco años atrás.
Metodología de diseño
8. Control de las dimensiones lentamente cambiantes
Tipo 1: Sobreescribe un atributo de dimensión modificado.Tipo 2: Un atributo de dimensión modificado hace que se cree un nuevo registro de dimensión.Tipo 3: Un atributo de dimensión modificado hace que se cree un atributo alternativo.
Metodología de diseño
9. Selección de las prioridades de consulta y de los modos de consulta
Esto es importante ya que hay que considerar que la consultas siempre manejan gran cantidad de datos, calculan subtotales, ordenan resultados, por lo que consume una cantidad considerable de recursos.
Trabajos citados
Hernández Orallo, J. (s.f.). Curso: Análisis y Extracción de Conocimiento en Sistemas de Información. Recuperado el 5 de Marzo de 2012, de Departamento de Sistemas Informáticos y Computación: http://users.dsic.upv.es/~jorallo/cursoDWDM/dwdm-II.pdf
12
Información de contacto:
E-mail: jcmorocho@utpl.edu.ec
Cuenta en skype: jcmorocho
14
top related