clase01 ein 945

Post on 09-Jul-2016

240 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

BI

TRANSCRIPT

EIN945-Inteligencia de Negocios

Unidad Nº 1: Introducción a la Inteligencia de NegociosClase Nº01: Introducción

Presentación Profesor

Gabriel Vergara Butrón

MBA (Magíster en Gestión y Dirección de Empresas)

Ingeniero Civil Industrial

Coordenadas:

Móvil: 56-9-97487207E-mail: gavergar22@gmail.com

Programa del Curso

Teórico-Estratégico

Programa del Curso

Práctico

Evaluaciones

• Cátedra I = 30% (80% teórico, 20% práctico)

• Cátedra II = 30% (Actividades y Controles de Lectura)

• Examen = 40%

Características:

• Sin eximición.

Agenda

• La motivación del problema

• ¿Qué es el Business Intelligence?

• El Proceso KDD

• Las aplicaciones de Data Mining

• Data Warehouse

• Principales Modelos de Data Mining

• Algunas Aplicaciones

A cerca de Leyes, Monstruos y Gigantes

• Ley de Moore: “La capacidad de procesamiento se duplica cada 18 meses”

• Su primo más agresivo: “La capacidad de almacenamiento se duplica cada9 meses”

• La brecha entre capacidad de procesar y lo que almacenamos, aumentacon el tiempo.

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

0

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

1988 1990 1992 1994

Disk

Processing

A cerca de Leyes, Monstruos y Gigantes

• La librería del US Congress tiene 10 Teras de texto

• Fuentes multimedia: video, audio almacenan menos de 3 Petas.– Gigabyte (109) viene del latín Gigas, para “gigante”

– Terabyte (1012) viene del griego Teras para Monstruo (terabytes: terror bytes)

– Vienen otros como: Peta, Exa, Zetta, etc

• Trabajar con estos “monstruos” es cosa sería.

• El año 2000 se analizó que el 11% de todo el conocimiento humano se generó durante 1999.

“La necesidad es la madre de la invención”

• Problema de Explosión de Datos:

– Sistema automáticos de captura de información,

madurez en la tecnología de bases de datos e Internet

llevan a importantes cantidades de datos almacenados

en las bases de datos, data warehouses y otros

repositorios de información.

• Enfoque competitivo.

• Bajo costo de computadores.

• Fuertes bases teóricas/Data matemáticas.

Nos ahogamos en información, pero estamos

hambrientos por conocimiento!

Yo manejo un supermercado (restaurant, tienda de videos o libros) y mi

registro de cajas (o website) almacena transacciones en la Base de Datos.

• Puede ayudarme a visualizar las ventas?

• Puede generar perfiles de clientes?

• Dónde estoy ganando o perdiendo plata?

• Cómo los usuarios visitan mi website?

• Dígame algún patrón interesante

Yo no sé nada de Estadística ni Data Mining, tampoco tengo estadísticos ni

analistas dedicados!!!

Pero ya tengo la Base de Datos…

• Muchos análisis de consultas interesantes son difíciles de precisar

• Por ejemplo:– Qué registros son transacciones fraudulentas?

– Cuáles clientes son más probables de elegir una Ford sobre una Toyota?

– Quiénes son buenos clientes en términos de riesgo en mi base de datos?

• La base de Datos contiene información – bueno/mal cliente, rentabilidad

– respondió/no respondió la encuesta

Business Intelligence y Bases de Datos

• Aumento explosivo de bases de datos.

• Los datos parecen siempre crecer y llenar el

repositorio:

– Alta dimensionalidad

– Gran número de registros

– Nuevas Fuentes

• Las herramientas de análisis actuales no soportan

los nuevos requerimientos y escalas.

• El usuario final no es un estadístico.

¿Por qué Business Intelligence?

Acceso a Datos

• Buscar algunos registros

• Reportes estándarSQL

SQL/OLAP

• Optimizar Procesos de Negocios

• Ubicar un problema/ entender algo

nuevo

• Responder una pregunta difícil

BI

Definición de Business Intelligence

• “Business intelligence es el proceso de extracción de datosdesde una BD y luego el análisis de esos datos para extraerinformación susceptible de usar para tomar decisiones yacciones de negocios informadas”.

• Preguntas a responder por aplicaciones de BusinessIntelligence:

– ¿Como comparar las ventas totales de todos los productos del2013, con las ventas totales del 2012?

– ¿Cómo está la rentabilidad a la fecha comparado con igual períododurante los últimos cinco años?

– ¿Cuánto gastaron nuestros clientes sobre 35 años durante elúltimo año, y como su comportamiento ha evolucionado en eltiempo?

Definición de Business Intelligence (2)

• Business intelligence (BI): es una amplia categoría de

aplicaciones y tecnologías para extraer, almacenar,

analizar y entregar acceso a datos que ayuden a los

usuarios de negocio, en la toma de decisiones.

Aplicaciones BI applications incluyen trabajos en

decision support systems (DSS), consultas y reportes,

online analytical processing (OLAP), análisis

estadístico, pronóstico y Data Mining.

Definición de Business Intelligence (3)

Se refiere a los procesos mediante los cuales las

organizaciones reúnen datos y analizan para

poder tomar decisiones centradas en su

estrategia y modelo de negocio

La capacidad de comprender las interrelaciones de los hechos presentados en tal forma como

para orientar la acción hacia una meta deseada

* Hans Peter Luhn (1958)

Inteligencia de Negocios

• Se dice que ha evolucionado desde los sistemas de apoyo a las decisiones, DSSUn Sistema de Soporte a la Decisión (DSS) es una herramienta de Business Intelligence enfocada al análisis de los datos de una organización.En principio, puede parecer que el análisis de datos es un proceso sencillo, y fácil de conseguir mediante una aplicación hecha a medida o un ERP sofisticado. Sin embargo, no es así: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la información de manera estática, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas... etc.

• Los datos son la fuente principal para realizar el análisis detrás de este concepto

• Se busca ir más allá en la presentación de la información, de manera que los usuarios tengan acceso a herramientas de análisis

Inteligencia de Negocios

Inteligencia de Negocios

Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos

Información• X vive en Z• S tiene Y años• X y S se cambiaron• W tiene dinero en Z

Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D

Decisiones• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C

Inteligencia de Negocios

Data Warehouse Data Mart

Data Mining

MarketingCliente

• Datos Superficiales• Datos SuperficialesSe extraen con consultas tipo

SQL

• Datos Multi-Dimensionales • Datos Multi-Dimensionales Se extraen con

OLAP

• Datos Escondidos• Datos EscondidosSe extraen con procesos

KDD

• Datos Profundos• Datos ProfundosSe extraen con uso de la

Intuición

Inteligencia de Negocios

Datos en la WebSe extraen con Web Mining

* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.

AnalíticaSe utilizan técnicas de

Investigación Operativa

Gráficamente

�Empresas y Organizaciones tienen

gran cantidad de datos almacenados.

�Los datos disponibles contienen

información importante.

�La información está escondida en los datos.

�BI puede encontrar información

nueva y potencialmente útil en los datos

¿Qué es Business Intelligence?

Business Intelligence involucra muchos términos

• Data Warehouse

• OLAP

• Data Mining

• Knowledge Discovery in Databases (KDD)

• Customer Relationship Management

• Database Marketing

• Balance Scorecard

¿Qué es Data Mining?

Proceso para encontrar estructura interesante en

los datos

– Estructura se refiere a patrones, modelos predictivos,

relaciones ocultas, interesantes o susceptibles de

generar margen para la empresa

• Ejemplos de tareas realizadas por Data Mining

– Modelos Predictivos (Clasificación y Regresión)

– Segmentación (Clustering)

– Afinidad de Datos (Summarization)• relaciones entre campos, asociaciones, visualización de datos

Data Mining

2.Selección y Preprocesamiento

4.Interpretación y Evaluación

Knowledge

p(x)=0.02

Warehouse

Patrones y Modelos

Datos preparados

Datos Consolidados

3.Data Mining

1.Consolidaciónde los Datos

Conocimiento

p(x)=0.02

DW

2.Selección y Preprocesamiento

4.Interpretación y Evaluación

Knowledge

p(x)=0.02

Warehouse

Patrones y Modelos

Datos preparados

Datos Consolidados

3.Data Mining

1.Consolidaciónde los Datos

Conocimiento

p(x)=0.02

DW

6. Apoyo a la Toma de Decisiones

5. Visualizacióndel conocimiento

6. Apoyo a la Toma de Decisiones

5. Visualizacióndel conocimiento

Herramientas para Data Mining

• Redes Neuronales:

– MLP

– Mapas autoorganizativos

• Árboles de Decisión:

– CART

– ID3, C4.5

– CHAID

• Regresiones: logit, probit

• Reglas de Asociación

• Lógica Difusa

� Customer Relationship Management

Segmentación de clientes

Database Marketing

Predicción de compra

Retención de clientes

Predicción de fuga

� Detección de Fraude

Tarjetas de crédito

Uso de teléfonos (celulares)

� Predicción de series de tiempo

Más Aplicaciones

• Marketing y Ventas: Identificar potenciales clientes; establecer la

efectividad de las campañas de marketing.

• Análisis de Procesos de Manufactura: Identificar las causas de

problemas de manufactura.

• Entendiendo comportamiento de Consumidores: modelos de

retención de clientes, afinidades, clustering.

• Detección de Fraudes: Identificar transacciones fraudulentas.

Aplicaciones de Negocio

• Aprobar Créditos: Establecer Credit Scoring para un cliente a la hora

de pedir un préstamo.

• Gestión de Portfolio: optimizar un portfolio de instrumentos

financieros maximizando el retorno o minimizando el riesgo

• Análisis de websites: modelar preferencias de usuarios desde logs,

filtros colaborativos, caminos preferidos, etc.

Aplicaciones de Negocio

Evolución en distintas industrias

Razones iniciales:

En telecomunicación:En telecomunicación:En telecomunicación:En telecomunicación:

Facturación de llamadas

Potenciales:

En telecomunicaciónEn telecomunicaciónEn telecomunicaciónEn telecomunicación::::

Detección de fraude

En supermercados:En supermercados:En supermercados:En supermercados:

Gestión del inventario

En bancos:En bancos:En bancos:En bancos:

Manejo de cuentas

En supermercados:En supermercados:En supermercados:En supermercados:

Asociación de ventas

En bancos:En bancos:En bancos:En bancos:

Segmentación de clientes

En empresas de producción:En empresas de producción:En empresas de producción:En empresas de producción:

Control de procesos

En empresas de producciónEn empresas de producciónEn empresas de producciónEn empresas de producción: : : :

Mantención preventivo

Estrategia yMarketing

Base de Datos de

Marketing

DataWarehousing

KDD &Data Mining

Aumente el conocimiento sobre las decisiones

Ej: impacto sobre el marketing

Para qué es útil el Data Mining

Data Mining y CRM

• Aplicaciones descriptivas

– Segmentación de clientes

– Análisis de afinidad

• Aplicaciones Predictivas

– Recomendación de productos

– Modelos de scoring

Se optimiza cuando se usan de forma combinanda

Lealtad de clientes

Análisis de procesos

Adquisición de clientes

Detección

de fraude

Business

ChallengesTechnologies

Segmentación

Regresión

Logistica

Genetic

Algorithms

Arboles de

decisión

Chaid

CART

OLAP

Redes

Bayesianas

Redes

Neuronales

Brecha en el Análisis de datos

Desafíos del

NegocioHerramientas

Los Gerentes son incapaces de aplicar el poder de las herramientas de Data

Mining para lograr resultados útiles a sus negocios

Lealtad de clientes

Análisis de procesos

Adquisición de clientes

Detección

de fraude

Business

ChallengesTechnologies

Segmentación

Regresión

Logistica

Genetic

Algorithms

Arboles de

decisión

Chaid

CART

OLAP

Redes

Bayesianas

Redes

Neuronales

Brecha en el análisis de datos

Desafíos del

NegocioHerramientasEspecialistas

Estadísticos

Administradores

y analisitas de DB

Consultores

Data Miners

Los Gerentes son incapaces de aplicar el poder de las herramientas de Data

Mining para lograr resultados útiles a sus negocios

La Cadena de Valor

Datos• Datos Clientes• Datos Tiendas• Datos Demográficos• Datos Geográficos

Información• X vive en Z• S tiene Y anos• X y S se cambiaron• W tiene dinero en Z

Conocimiento• Una cantidad Y del producto A es usada en la región Z• Clientes de la clase P usan x% de producto C en el periodo D

Decisión• Promocione el producto A en la región Z• Mailing a familias del perfil P• Venta cruzada del servicio B a clientes C

Preguntas Claves Para un E-Business

1. ¿Número de nuevos clientesnuevos clientesnuevos clientesnuevos clientes?

2. ¿Cuáles son los caminos de navegación más popularescaminos de navegación más popularescaminos de navegación más popularescaminos de navegación más populares en mi sitio? ¿Son

los caminos diferentes para los clientes nuevos que los de los clientes

frecuentes?

3. ¿Cuáles son las palabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentespalabras de búsqueda más frecuentes?

4. ¿ Cuántas veces clientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraronclientes “primerizos” compraron en el sitio ayer?

5. ¿Cuál fue el producto más rentableproducto más rentableproducto más rentableproducto más rentable ayer?

6. ¿Fue alto o bajo el ratio compra/visitaratio compra/visitaratio compra/visitaratio compra/visita comparado con el mismo día de la

semana pasada?

¿Como puedo generar un mejor retorno sobre la inversión y más ingresos para la compañía?

Inteligencia de Negocios

ProductosProductos

Servicios de Búsqueda

La ruta más corta

Reconocimiento (voz,

imagen)

FinancieroFinanciero

Planificación financiera de la cadena de Suministros

Gestión de Riesgos

Gestión de Recursos Humanos

Gestión de Recursos Humanos

Gestión de talentos

Staffing

Red LogísticaRed Logística

Optimización de Inventarios

Planificación de la

Distribución

Localización de plantas y bodegas

Plan de entrega

Producción y manufacturaProducción y manufactura

Programación de la

Producción

Costeo de Producción

Ventas y CRM

Ventas y CRM

Predicción de la demanda

Pricing

Gestión de Incidentes

Predicción de comportamien

to de ventas

Servicios Corporativos

Servicios Corporativos

Gestión de la calidad

Gestión de proyectos

Nuevos proyectos

* Basado en Clase de Patricio Wolff (2012), MBE, U. de Chile.

Ejemplos de Inteligencia de Negocios

Ejemplos de Inteligencia de Negocios

Ejemplos de Inteligencia de Negocios

* Forbes (2004) Proximity and priority: applying a gene expression algorithm to the TSP

Ejemplos de Inteligencia de Negocios

Ejemplos de Inteligencia de Negocios

*Trabelsi (2012) Heuristics and metaheuristics for mixed blocking constraints flowshop scheduling problems

Ejemplos de Inteligencia de Negocios

Ejemplos de Inteligencia de Negocios

* Miranda et al. (2005) Predicción de Fugas de Clientes para una Institución Financiera mediante Support Vector Machines

Implementación de Inteligencia de Negocios

– Módulos del ERP• Ej: SAP Business Warehouse

– Módulos externos añadidos al ERP• Ej: Jaspersoft

– Capa inteligente• Con orientación a Servicios

• Desarrollo a la medida

Plataformas de Inteligencia de Negocios

* Fuente: Gartner (2009)

Inteligencia de Negocios

• Ventajas de la Inteligencia de negocios

– Mejora en la calidad de las decisiones

– Orienta las decisiones a objetivos generales

– Control de Costos

– Profunda y realista visión del negocio

– Permite planificar y programar el trabajo

– Alinea la estrategia al establecer objetivos claros

– Integración de sistemas y áreas

Inteligencia de Negocios

• Desventajas de la Inteligencia de negocios

– La automatización podría no resultar

– No considera la intuición

– Podría resultar un desastre si operaciones y TI no están alineados

– Lo que se necesita podría no estar en los datos que se tienen

– En algunos casos deja explicito el know-how

– Si no se analizan la estrategia y los procesos “core” podría ser un tanque para matar un mosca

Enterprise Mining Process

KDD Process + Objetivos del Negocio + Eficiencia + Comunicación con el usuario de negocio

• Especificación del problema

– Objetivos y metas del negocio

• Levantamiento de Datos

– Casos a elegir

• Calidad de los datos / Limpieza

• Preprocesamiento de Datos

• Data mining

– Impacto del Negocio

• Gestión del Modelo

Agenda

• Inteligencia de Negocios

– Definición

– Niveles

– Procesos que apoya

– Ejemplos

– Implementación de BI

– Ventajas

Inteligencia de Negocios

• Consultas SQL (Structured Query Language)– Lenguaje declarativo de acceso a bases de datos

relacionales

– Permiten efectuar consultas con el fin de recuperar información de forma sencilla

SELECT c.nombre FROM cliente AS c, pedidos AS pWHERE c.id = p.cliente_id

AND p.npedido = 122;

Inteligencia de Negocios

• Las herramientas OLAP (OnLine AnalyticalProcessing)

– Proporcionan un análisis multidimensional de los datos, es decir, permiten resumir y segmentar los datos.

– Utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos

– Adecuadas para el análisis instantáneo de grandes cantidades de datos.

– Producen otros datos

(más agregados, combinados). Tiem

po

Inteligencia de Negocios

• El proceso KDD ( Knowledge Discovery in Databases)

– Identificación de los Objetivos

– Selección de datos

– Preprocesamiento

– Transformación

– Data Mining (descubrir patrones en los datos)

– Interpretación y Evaluación

– Integración al Negocio

Proceso KDD

Inteligencia de Negocios

• Se puede definir el Web mining en tres variantes:

– Minería del contenido de la Web (contenido de las páginas)

– Minería de la estructura de la Web (Estructura de enlaces)

– Minería de los registro de navegación en la Web

– Ha permitido que el comercio electrónico para hacer marketing personalizado

Inteligencia de Negocios

* Basado en Davenport y Harris (2007) Competing on Analytics

top related