Download - Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan
Juan Alvites
21/04/23
INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS
Semana 6
Alvites Huamaní JuanAlvites Huamaní Juan
Juan Alvites
HERRAMIENTAS DE BUSINESS INTELLIGENCE - DATAWAREHOUSE
Contenido1.Introducción
2.Definición
3.Datawarehouse
4.Estructura del Datawarehouse
2
Juan Alvites
1. Introducción
3
Juan Alvites
2. Definición• Se entiende como herramientas de Business Intelligence
todas las aplicaciones orientadas a convertir datos en conocimiento para la organización, mediante la transformación de datos en información estructurada para su explotación directa por parte de la dirección.
4
Juan Alvites
2. Definición
5
Juan Alvites
3. Datawarehouse• Un Datawarehouse es un gran almacén de datos, en el
que se integran datos procedentes de varias fuentes.
• Además un Datawarehouse debe disponer de una gran capacidad de almacenamiento (gigabytes o terabytes)
6
Juan Alvites
7
Definición• Datawarehouse (Almacén de datos) se define como
una colección de datos que verifican las siguientes propiedades:– Está orientado a objetos (a un tema) – Datos integrados– No volátiles– Variante en el tiempo
que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
Juan Alvites
8
Explicación de la definición• Orientado hacia temas: los datos se almacenan y
agrupan por temas de interés.
Juan Alvites
9
Explicación de la definición• Datos integrados: el almacén de datos integra
datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos.
BD
BD
BD
DW
CARGA
Juan Alvites
10
Explicación de la definición
• No volátiles: son estables, una vez almacenados los datos no se modifican.
BD DWDW
SELECT
INSERT
UPDATE
DELETE
REPORTS SELECT
CARGA
Juan Alvites
11
Explicación de la definición
• Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo
Juan Alvites
12
Características
• Podemos resumir las características de un Datawarehouse:– Trabaja con datos de negocio– Orientado a un sujeto– Almacena datos actuales orientado a un histórico
(actual + histórico)– Datos más bien resumidos (no información
detallada)
Juan Alvites
13
DIFERENCIAS
BD OPERACIONAL- Datos operacionales- Orientado a
aplicaciones- Datos Actuales- Datos Detallados- Datos en continuo
cambio
DATAWAREHOUSE- Datos de negocio- Orientado al sujeto- Actuales + Histórico- Datos Resumidos- Datos Estables
Juan Alvites
Almacenes y Minería de Datos 14
ARQUITECTURA DATAWAREHOUSE
GESTORCARGA
GESTOR ALMACENAMIENTO GESTOR
CONSULTAS
BDoperacional
Partimos de una BD operacional y se basa en 3 módulos
Juan Alvites
15
GESTOR DE CARGA
• Permite hacer la carga. Como dificultades nos podemos encontrar:– La integración de los datos– Elección del momento de la carga– El tiempo de carga sea el mínimo posible– Buen diccionario de datos o METADATA (para evitar
cometer errores en la carga)– Diseño de procedimientos PL/SQL
Juan Alvites
16
GESTOR DE ALMACENAMIENTO
• Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas
llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele
haber relaciones 1:N Este modelo tiene forma de estrella por eso se
denomina MODELO STAR
Juan Alvites
17
MODELO ESTRELLA - STAR
FACT
DIM_1
DIM_2
DIM_TIEMPO
DIM_3
# PK4
# PK1
# PK2# PK3
# PK1# PK2# PK3# PK4*campoA*campoB
Juan Alvites
18
GESTOR DE CONSULTAS
• Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.
Juan Alvites
19
Ejemplo 1:CATEGORIAS_PROF
# c_categoria* descripción* salario_min* salario_max
USUARIOS
# c_usuario* nombre* apellido1* apellido2* c_categoria* direccion
USU_OFERTAS
# c_categoria# c_oferta* salario_deseado
OFERTAS
# c_oferta* descripción* salario_min* salario_max* fx_alta
1
n
11nn
Juan Alvites
20
Ejemplo 1:CATEGORIAS_PROF# c_categoria* descripción* salario_min* salario_max
USUARIOS# c_usuario* nombre* apellido1* apellido2* c_categoria* direccion
OFERTAS# c_oferta* descripción* salario_min* salario_max* fx_alta
TIEMPO# c_tiempo* descripcion
USU_OFERTAS# c_usuario# c_categoria# c_oferta* salario_deseado
Juan Alvites
21
REPORTS
• ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero?SELECT count(*)FROM USUARIOS_OFERTAS U, OFERTAS OWHERE U.c_oferta=o.c_ofertaAND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
Juan Alvites
Ejemplos Arquitectura de Datawarehouse
22
Juan Alvites