sesion2-introduccionbi
DESCRIPTION
paperTRANSCRIPT
Inteligencia de Negocios Introducción
Por Elizabeth León Guzmán, Ph.D.
Profesora Ingeniería de Sistemas
Grupo de Investigación MIDAS
Agenda
1.Introducción
2.Definición
3.ETL
4.Bodega de Datos
5.Data Mart
No solo intuición para que el negocio crezca
Necesidad de los datos de todas las funciones del negocio
Necesidad de almacenar y relacionar los datos para obtener información y conocimiento
Introducción
Datos transformados en Conocimiento que permita actuar en forma rápida y eficiente
Datos
Ventaja Competitiva
Toma de Decisiones
Conocimiento
Información
Intelig
encia
de N
ego
cios
Inteligencia de negocios
¿Por qué?
Inteligencia de Negocios Definición
“Es el proceso de integración y
tratamiento de los datos para
convertirlos en información que
permita apoyar a los tomadores
de decisiones en la organización”
Inteligencia de Negocios Definición
Es una alternativa tecnológica que permite generar conocimiento a la empresa
Es el uso de tecnologías para descubrir conocimiento a partir de los datos que posee la empresa
Aplica el proceso KDD (Knowledge Discovery Databases) (Descubrir conocimiento en bases de datos)
Proceso KDD: Knowledge Dicovery
Databases Process
Inteligencia de Negocios Características
La solución es un sistema:
Para soporte de toma de decisiones (nivel gerencial)
Con capacidades de análisis de alcance empresarial global
Integración y análisis de la información desde fuentes de datos heterogéneas
Inteligencia de Negocios Características
Plataforma integrada
Herramientas ETL de gestión, administración
y carga, el almacenamiento de datos y las funciones relacionadas con informes, servicios
Procedimientos analíticos integrados (OLAP)
Minería de datos (Uso de métodos inteligentes para extraer conocimiento )
Inteligencia de Negocios Características
Servicios de Análisis
Entorno en tiempo real
Indicadores claves de desempeño
Servicios de Reporte
Creación, administración y visualización de informes
Motor para alojar y procesar informes
Inteligencia de Negocios Características
Inteligencia de negocios provee soluciones a nivel empresarial que permiten a los tomadores de decisiones transformar información clave de su negocio en acciones concretas traduciéndose en beneficios tangibles:
Reducción de costos
Mayor rentabilidad
Mejores relaciones comerciales
La Inteligencia de Negocios Características Deseables
Minería de Datos
Consultas
Análisis
Dashboards
Reportes
Man. Eventos
Entrega de Información
Consultas y Reportes
Tablero instrumentos (dashboard)
Distribución información (autom.)
Manejo de eventos
Integración con otras herramientas
de cálculo(Ej: excel)
Facilidades de Análisis
Análisis multidimensional (OLAP)
Cálculos y Modelamiento (What-if)
Análisis avanzado y Minería
Visualización avanzada
Plataforma para Desarrollo e Integración
ETL – DQ – Seguridad - Metadata
02/06/13 Introducción a la Mineria de Datos y Aplicaciones
15
Fases de una solución de
Inteligencia de Negocios
.
ETL - Extraction, Transformation and
Load
Proceso que permite mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar.
Extracción y Transformación de los datos desde las fuentes: Bases de datos, ERP, excel, archivos texto, etc.
Carga de los datos transformados a la bodega
Extracción
primera parte del proceso ETL
extraer los datos desde los sistemas de origen
Diferente organización, formatos
deja los datos en formato especial para ser transformados
Si existen muchos datos, peligro de colapsar. Se programa en horarios en el que el impacto sea mínimo
Transformación
Aplica reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados
Ejemplos de transformaciones:
Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen).
Traducir códigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M" para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
Transformación
Codificar valores libres (por ejemplo, convertir "Hombre" en "H“).
Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad * precio).
Unir datos de múltiples fuentes (por ejemplo, búsquedas, combinaciones, etc.).
Calcular totales de múltiples filas de datos (por ejemplo, ventas totales por cada producto).
Dividir una columna en varias (por ejemplo, columna "Nombre: Diaz, Maria"; pasa a dos columnas "Nombre: Maria" y "Apellido: Diaz").
Carga
Datos transformados son cargados en la bodega
Interaccion directa con la bodega
Se aplicaran restricciones y triggers que esten definidos:
valores únicos,
integridad referencial,
campos obligatorios,
rangos de valores
Ejemplo ETL
Bodegas de Datos
El objetivo de construir una bodega es centralizar y resumir (agregación) la gran variedad de datos e información.
Arquitectura particular para almacenar datos cuyo diseño no está preparado para soportar el proceso transaccional
Contiene información histórica de la empresa para permitir análisis de su evolución
Estructurada para optimizar consultas, y las actualizaciones se hacen fuera de línea
Fases de una solución de
Inteligencia de Negocios
.
Bodega de Datos Definición
“Es un conjunto de datos integrados o orientados a un objetivo específico, que varían con el tiempo (datos históricos) y que no son transitorios.
Soportan el proceso de toma de decisiones de la administración y está orientada al manejo de grandes volúmenes de datos provenientes de diversas fuentes o diversos tipos” [1]
Bodega de Datos Definición
Una Bodega de Datos es una base de
datos que organiza y almacena una
colección de información derivada
directamente de los sistemas
operacionales y de algunos datos externos
[2].
Bodegas de datos Información
Se apoyan en tres procesos de organización de alto nivel:
Operaciones del negocio: Se refiere a las transacciones cotidianas diarias del negocio.
La inteligencia de negocio: se refiere a la búsqueda de una mejor comprensión de la compañía de sus productos, y sus clientes.
La gerencia de negocio: es la función en la cual el conocimiento nuevo y las acciones determinadas en la inteligencia del negocio se institucionalizan y se introducen en las operaciones diarias del negocio.
Bodega de datos Función
Una Bodega de Datos debe entregar la información correcta a la gente indicada en el momento adecuado en el formato correcto Da respuesta a las necesidades de usuarios conocedores, utilizando Sistemas de Soporte en la decisión (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consultas y reportes Los usuarios finales pueden hacer consultas sobre sus Bodegas de Datos sin tocar o afectar la operación del sistema
Evolución de las Bodegas
Tomado de [1]
Data Mart
Bodegas de datos pequeñas específicas de un departamento o dependencia de la empresa
Utilizados para almacenar particularidades de un sector o para optimizar las consultas
Implementación
Top-down
Bottom-up
Top-down
Bottom-up
Data Warehouse
OLTP
Fuente de datos 1
Fuente de datos 2
Fuente de datos 3
DM1
DM2
DM3
DM4
Cubo
Cliente
Diseño Lógico y Físico de la Bodega
Estos modelos permiten:
Planear la extracción y transformación
Estimar las necesidades de administración del DBMS
Planear prototipos para las aplicaciones finales
El diagrama dimensional del ciclo de vida del
negocio
El diagrama dimensional del ciclo de vida del
negocio
Planeación del proyecto Definición de
Requerimientos del Negocio
Diseño Técnico de la arquitectura
Dimensionar el modelo
Selección e Instalación
del producto
Diseño Físico
Diseño & Desarrollo
del Area de Almacenamiento
Especificaciones de la
Aplicación de Usuario final
Puesta en marcha
Desarrollo de la
Aplicación de Usuario final
Gerencia del proyecto
Mantenimiento &
crecimiento
Tomado de [5]
Planeación del Proyecto
1. Definición del proyecto 1. Asegurar la factibilidad del proyecto
2. Alcance preliminar del proyecto
3. Justificación de negocio
2. Planeación del proyecto 1. Establecer la identidad del proyecto
2. Recursos del proyecto
3. Plan del proyecto
3. Gerencia del proyecto 1. Reunión de lanzamiento (Kick-Off)
2. Monitorear el estado del proyecto
3. Actualización y documentación del Plan del Proyecto
4. Manejo del alcance
5. Plan de comunicaciones
ELEMENTOS BASICOS DE UNA BODEGA DE DATOS
Storage: Archivos planos; RDBMS; Other
Procesando: limpiar, reducir, agrupar, eliminar duplicados; almacenar; standarizar; se conforma la dimensión; almacenar aguardando réplica; archivo; exportación a los Data Marts
Sin servicio de consulta a los usuarios
Data Mart #1: OLAP (ROLAP and/or MOLAP) Servicios de consulta; Dimensional Orientado a tema de negocio Puesto en ejecución Local; Grupo de usuarios; Puede almacenar datos atómicos; Puede ser refrescada frecuentemente;
Conforme a DW
Data Mart #2:
Data Mart #3:
Conformed dimensions Conformed facts
Conformed dimensions Conformed facts
populate, replicate, recover
populate, replicate, recover
populate, replicate, recover
DW BUS
DW BUS
extraer
Herramientas específicas de consulta
Informes escritos
Aplicaciones de usuario final
alimentar
Modelos: Forecasting Scoring Allocating Minería de datos Otros sistemas en sentido descendente; Otros parámetros especiales UI;
Sistemas Fuentes
(Herencia)
Área de almacenamiento de datos
“The Data Warehouse” Servidores
Datos accesados por el usuario final
Resultados del Modelo de transmisión
Transmisión Limpió
dimensiones
extraer
extraer
alimentar
alimentar
alimentar
Área de presentación
Área de Herramientas de acceso
Referencias
[1] Wiley - Mastering Data Warehouse Design - Relational And Dimensional Techniques – 2003.
[2] Wiley - Data Analysis -The Data Warehouse Toolkit - Second Edition.
[3] Wiley - Building The Data Warehouse - Third Edition
[4] Wiley - The Data Warehouse ETL Toolkit -2005.
[5] Wiley - The Data Warehouse Lifecycle Toolkit 1998
[6] MicroStrategy - Business Intelligence - 2006.