maestria direcciÓn estratÉgica en ingenierÍa de …

76
Presentación Junio 2021 MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE SOFTWARE G estión Tecnológica de la Información y DataWarehouse Msc . Lourdes Bellott Poveda - Conceptos

Upload: others

Post on 15-Jul-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

P r e s e n t a c i ó n

J u n i o 2 0 2 1

MAESTRIA DIRECCIÓN

ESTRATÉGICA EN INGENIERÍA DE

SOFTWARE

Gestión Tecnológica de la

Información y DataWarehouse

Msc. Lourdes Bellott Poveda

- Conceptos

Page 2: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Gestión Tecnológica de la Información

Page 3: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Organización

Las organizaciones son instrumentos sociales que sirven para quemuchas personas combinen sus esfuerzos, talentos y trabajen juntascon el fin de alcanzar objetivos que jamás podrían alcanzar sitrabajaran en forma aislada.

Page 4: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Objetivos de la OrganizaciónProporcionar a los inversionistas utilidades o rendimientos atractivos sobre susaportaciones a la empresa.

Cumplimiento de lo presupuestado y metas trazadas.

Ofrecer al mercado (Clientes) la satisfacción de sus necesidades de manerapermanente.

Proporcionar a los colaboradores de la empresa la mejor calidad de vidaposible.

Crecer y desarrollarse para beneficio de todos: • Inversionistas• Clientes• Colaboradores.

Page 5: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Actualidad - GlobalizaciónCompañías en mercados hipercompetitivos.

Los clientes son más exigentes, mejor informados y demandan productos personalizados.

Las empresas necesitan conocer mejor su información para saber cuál es su fuerte y potenciar sus actividades. Customer Intelligence Maketing Intelligence Business Intelligence DataMining

Nivel de Análisis. Individual Departamento Organización Entorno

La GESTIÓN DE LA INFORMACIÓN se ha convertido en elemento que sirve para marcar diferencias y lograr ventaja competitiva.

Las TECNOLOGÍAS DE LA INFORMACIÓN ofrecen herramientas propicias para salvaguardar el Conocimiento.

Page 6: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Evolución en el Diseño Organizacional -Diferencias de Enfoque

Page 7: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Evolución en el Diseño Organizacional

Page 8: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Evolución en el Diseño Organizacional

Page 9: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Ventajas del Trabajo en Redo Escalabilidad: La red puede incluir tantos componentes como sean necesarios,en un ámbito local o global, para cada operación o transacción que se lleve a cabo.

o Interactividad: Ya sea en tiempo real, o en el intervalo de tiempo que se elijaentre los actores que participan en la actividad de la organización (proveedores,clientes, directivos, empleados).

o Gestión de la flexibilidad: Permite mantener el control sobre el negocio duranteel continuo proceso de expansión y adaptación.

o Branding: Se trata de un elemento esencial como signo reconocido del valor deun negocio, de la capacidad de creación de valor de una organización. En la era deInternet adquiere una dimensión distinta ya que en muchas ocasiones losproyectos son resultado de la cooperación entre múltiples partes.

o Personalización: Internet permite ofrecer un producto personalizado a cadaconsumidor, así como atender nichos de mercado que antes estabandesatendidos, o generar demandas que no existían.

Page 10: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Impacto organizacional de las tecnologías de la información

El uso masivo de las tecnologías de la información y las comunicaciones (TICs) en elfuncionamiento diario de las organizaciones se ha generalizado. Han creado un gran impactoen su funcionamiento, e incluso han alterado su estructura Los clientes son más exigentes,mejor informados y demandan productos personalizados.

Como consecuencia de un contexto sumamente competitivo, principalmente debido a laglobalización y la penetración de las TICs, las empresas cambian su estructura organizacional,desde la clásica estructura jerárquica hacia organizaciones con mayor flexibilidad y capacidad deinnovación, como por ejemplo, organizaciones modulares, u organizaciones basadas en elconocimiento, entre otras.

Page 11: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Las TICs como agentes del cambio organizacionalLa información se haconvertido en el ejepromotor de cambiossociales, económicos yculturales. Los sistemasde informacióninteractúan con lasdiferentes dimensionesde la organización: suestrategia general, suestructura, procesos ycultura.

Estructura

Roles/Cultura Procesos de Negocio

EntornoSocioeconómico

EntornoTecnológico

Page 12: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Sistemas de Información en la Organización

Los sistemas de información soncreados para resolver problemas deadministración y dirección. Puedendefinirse como el conjunto formal deprocesos y recursos que permiten lacaptura, organización,almacenamiento y procesamiento dedatos para la elaboración ydistribución de la información que unaorganización necesita para laadministración, gestión, decisión,planificación y control de susactividades.

Estratégico

Nivel Administrativo

de Gestión

Sistema de Soporte a las Decisiones

Sistemas de Reportes

Gerenciales

Sistemas Transaccionales

Base de Datos Multidimensional

Base de Datos Transaccional

Page 13: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Sistemas de Gestión de Base de datosDBMSEl objetivo general de los SISTEMAS DE GESTION DE BASE DE DATOS (DBMS) es el de administrarde forma clara, sencilla y ordenada un conjunto de datos que en lo posterior se convertirán eninformación relevante para una organización.

Los DBMS's son la herramienta de software más idónea para manejar información debido a quecumplen los siguientes objetivos:

o Abstracción de la información: los DBMS's abstraen a los usuarios de detalles acercadel almacenamiento físico de los datos.

o Independencia: La independencia de los datos consiste en la capacidad de modificarel modelo físico o lógico de una base de datos, sin tener que realizar cambios en las aplicacionesque la consultan.

o Consistencia: los DBMS's garantizan que los datos son siempre guardados de forma coherentecon Modelo de datos.

o Seguridad: Los DBMS's disponen de un complejo sistema de permisos para usuariosy grupos de usuarios, que permiten otorgar diversos perfiles de permisos.

Page 14: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

DBMSo Integridad: los DBMS's adoptan las medidas necesarias para garantizar la validez de los datosalmacenados.

o Respaldo: los DBMS's proporcionan una manera eficaz de realizar copias de respaldo de lainformación almacenada, y de restaurar a partir de estas copias los datos que se hayan podidoperder durante un siniestro.

o Control de la concurrencia: en la mayor parte de los ambientes, lo más habitual es que seanmuchas las personas que intentan ingresar a una base de datos, tanto para recuperarinformación, como para guardarla o modificarla. .

o Manejo de Transacciones: una Transacción es un programa que se ejecuta como una solaoperación.

o Tiempo de respuesta: es deseable minimizar el tiempo que el DBMS tarda en darnos lainformación requerida.

TODO LO QUE TIENE VALOR, NECESITA

SER ALMACENADO Y ADMINISTRADO

Page 15: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Los Sistemas Transaccionales -> De información administrativos integrados

Integración de los subsistemas de Comercialización, Cobranzas,Compras y Pagos.

Comercialización

Cobranzas

Compras

Pagos

Base de Datos

Page 16: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Los Sistemas Transaccionales -> ERPsLos sistemas ERP (enterprise resource planning) se basan en la visiónorganizacional del flujo de actividades por procesos, cada uno de los cualestiene entradas y salidas encadenadas entre sí, en lo que Porter (1985)denominó cadena de valor. Estos sistemas integran los flujos deinformación de cada uno de los procesos organizacionales, y facilitan laejecución y seguimiento de la cadena de valor. Es una visión horizontaldonde cada una de las unidades funcionales de la empresa(departamentos) son consideradas eslabones en la prestación de unservicio o la producción de un bien. Se puede definir un ERP como unsistema integrado de software administrativo empresarial, compuesto porun conjunto de módulos funcionales susceptibles de ser adaptados a lasnecesidades de cada empresa (Gómez Vieites y Suárez Rey, 2010).

Page 17: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Los Sistemas Transaccionales -> ERPs

Page 18: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Introducción a Inteligencia de Negocios

Page 19: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Información y OrganizacionesProblemática: Acceso a la información para la toma de decisiones.

Ventas Marketing FinanzasControl de

GestiónServicio al

Cliente

• Factores Críticos: Tiempo de Acceso Datos existen pero no se acceden fácilmente. Información No Explotada Integración Calidad de la información

Page 20: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es Inteligencia de Negocios?Definiciones:

Michael (2000) afirma que el conjunto de tecnologías que usan Data Warehousingy OLAP (On-lineAnaliticProcesing, procesamiento analítico en línea), combinado con herramientas de reporte, sonreferidas como Business Intelligence, porque ayudan a las compañías a ganar inteligencia enoperaciones y desempeño.

Buksard, Molloty Richards (2000) -Business Intelligenceno es una sola tecnología o aplicación. No esuna "cosa", sino que se trata de un “suite" de productos que trabajan de manera conjunta paraproveer datos, información y reportes analíticos que satisfagan las necesidades de una granvariedad de usuarios finales.

Hackney(2001) nos dice que el Business de todas las actividades relacionadas a la organizaciónentrega de información así como el análisis del negocio.

La Inteligencia de Negocios o Business Intelligence (BI) se puede definer como la habilidad deconsolidar Información y analizarla con la suficiente velocidad y precision para descubrir ventajas ytomar mejores decisions de Negocios.(Cano1999)

Page 21: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es Inteligencia de Negocios?

Conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformardatos de los sistemas transaccionales e información desestructurada (interna y externa a lacompañía) en información estructurada, para su explotación directa (reporting, análisis OLAP…) opara su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.

El término implica tener un entendimiento de todos los factores que afectan la empresa: clientes,competidores, socios de negocio, ambiente económico, operaciones y procesos internos.

Page 22: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es Inteligencia de Negocios?

BI= Rigth Data + Rigth Time + Right Person

Page 23: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es Inteligencia de Negocios?

Es conocida como la habilidad de trasformardatos e información en conocimiento deforma que se pueda optimizar el proceso detoma de decisiones en los negocios.

Intelligence + information = the rightdecision?

Page 24: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Ventajas de la Inteligencia de Negocios

Toda la historia de información se encuentra disponible.

Toda la información está en un solo lugar.

Información Actualizada.

Acceso rápido.

No hay límites de tamaño.

Fácil de comprender.

Definiciones claras y uniformes.

Datos estandarizados.

Page 25: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Desventajas de la Inteligencia de Negocios

Es muy fácil confundirlo con otros desarrollos tecnológicos.

Puede causar Parálisis por Análisis.

Aparentemente es muy costosa.

Mala interpretación de la frase “requiere menos mano de obra” y genera temor.

Si la información fuente es pobre en calidad, los resultados finales no serán de utilidad.

Requiere Mantenimiento.

Page 26: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Datos -> ConocimientoDatos: Pequeño trozo de información que no tiene significado o no nos es útil por si solo.

Muchos datos pueden hacer difícil identificar y dar sentido a los datos que importan

Los datos sólo describen una parte de lo que ocurre, no proporcionan significado, juicio o interpretación.

El dato es la fuente de origen para la toma de decisión pero no puede decirnos que hacer.

Hechos objetivos y discretos sobre eventos.

Registros estructurados de operaciones.

Gestión del Dato: Velocidad, costo y capacidad.

Relevancia y claridad.

Page 27: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Datos -> ConocimientoBodega de Datos: Colección de datos, orientada a temas, integrada, no volátil, y variante en el tiempo que soporta decisiones administrativas.

Información: Es un conjunto organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje.

Datos que son dotados de un sentido y un propósito.

Convierte los datos en útiles para decidir y/o realizar una acción.

La información nos permite responder a preguntas como: • ¿Quién?

• ¿Qué?

• ¿Cómo?

• ¿Cuándo?

• ¿Dónde?

Page 28: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Datos -> ConocimientoTipos de Información:

Técnico Operativa –Hecha por personal operativo, mantiene funcionamiento del negocio.Provista por Sistemas Transaccionales.

Táctica–Usada por coordinadores de área y Directores Operativos.

Estratégica–Usado por altos directivos para direccionar el negocio (objetivos gerenciales). Esasociada al Conocimiento, es provista por sistemas de Inteligencia de Negocios.

Conocimiento: Información que ha sido procesada, organizada y estructura de alguna manera oque ha sido aplicada a una acción. En las organizaciones, a menudo se convierte implícito no sóloen documentos o repositorios sino también en rutinas organizativas, procesos, prácticas ynormas.

Page 29: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Enfoque errado de la Inteligencia de Negocios

Verlo como un asunto tecnológico y no como un asunto institucional.

Las personas que estaban a cargo de las tecnologías de la información se propusieron hacer unData Warehouse, y se lo entregaron a la empresa.

Se esperaba solucionar demasiados problemas de un solo golpe,en lugar de alcanzar lamadurez con las aplicaciones, las herramientas y la metodología.

Cambio de requisitos. Fallas en el análisis de requerimientos.

Diseñar el DW igual que un sistema de producción.

Ignorar la evolutividad del sistema.

Falta de capacitación de los usuarios.

Page 30: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Tomar DecisionesTodas las empresas, pequeñas, medianas y grandes, necesitan tomar a diario decisiones de negocio que afectarán el rumbo y el éxito de la empresa.

Centralizadas: Alta Dirección, Gerencias,

Áreas funcionales o muy especializadas.

Descentralizadas: Sucursales, Jefaturas Operativas,

Agencias.A ciegas?

Es sorprendente el gran número de empresas que lo hacen en base a datos inexactos, obsoletos o, directamente incorrectos.

Sobrevive una compañía a ciegas?

Page 31: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Estrategia BIQueremos ser sostenibles:Rentables y mantenerse así en el tiempo. Transformando la información en dinero.

Responder a los cambios del entorno. A través de la velocidad de la información.

La Estrategia BI permite:

Observar¿qué está ocurriendo?

Comprender¿por qué ocurre?

Predecir¿qué ocurriría?

Colaborar¿qué debería hacer el equipo?

Decidir¿qué camino se debe seguir?

Page 32: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Estrategia BI

Page 33: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP –Perfil UsuarioLos OLTP (Online transaction processing) tienen como objetivos principales asistir a aplicacionesespecíficas, y mantener integridad de los datos. Mientras que los OLAP (Online analyticalprocessing) apuntan a asistir en el análisis del negocio,identificando tendencias, comparandoperíodos, gestiones, mercados, índices, etc. mediante el almacenamiento de datos históricos.

Page 34: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP – Alineación de DatosLos OLTP están alineados por aplicación. Diferentes sistemas tienen distintos tipos de datos, loscuales son estructurados por aplicación. Los sistemas OLAP están alineados por dimensión.Todos los tipos de datos integrados en un solo sistema.

Page 35: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP – Integración de DatosLos sistemas OLAP, los datos deben estar integrados. Son conocidos como datos derivados odatos DSS dado que provienen de sistemas transaccionales o sistemas de archivos maestrospreexistentes en las mismas organizaciones o de sistemas externos de información.

Page 36: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP – Historia, Acceso y Manipulación.Las bases de datos orientadas al análisis siempre contienen el tiempo como clave dado que unade las principales razones para la construcción del warehouse es el almacenamiento de datoshistóricos y el análisis a lo largo del tiempo.

DWs tienen una carga y acceso masivo de datos.

Page 37: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP – Patrones de UsoLos sistemas OLTP mantienen un patrón de uso constante requiriendo grandes cantidades derecursos y consumiendo sólo el tiempo referido a la transacción. En contraposición, los sistemasOLAP tienen un patrón de uso liviano con picos de usos eventuales en el tiempo, afectados porla disponibilidad de los datos y el flujo de trabajo del negocio.

Page 38: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

OLTP vs OLAP – Granulidad de DatosEn los sistemas OLTP se encuentran los datos a nivel detallado o nivel transaccional. Lossistemas OLAP contienen información sumarizada hasta cierto nivel.

Page 39: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Componentes del Entorno de Inteligenciade Negocios

Page 40: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es un Dashboard?Dashboards. Tableros que muestranindicadores estratégicos, valoresactuales, valores históricos yumbrales para evaluar a los mismos.Existen diversas metodologías quepermiten analizar el comportamientoy desempeño de la organizaciónalineando y relacionando losindicadores antes mencionados,como la metodología BSC (BalancedScorecard).

Page 41: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es Minería de Datos?Es el proceso que nos ayuda a descubrir patrones en los datos de los que a simple análisis no esposible detectar.

Es el conjunto de técnicas avanzadas para extraer del data warehouse de la organizacióninformación predecible, detectar patrones de comportamiento y plantear escenarios futuros quepermitan cubrir los objetivos estratégicos a través de la toma de decisiones.

Page 42: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Algoritmos de Data Mining

Page 43: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Proceso de Minería de Datos Add Derived

Variables

Create Model Set

Choose ModelingTechnique

Train Model

Check Performance of Model

Choose Best Model

Identify DataRequirements

Obtain Data

Validates,Explore,

Clean Data

TransposeData

If new

enh

anced

data

Wo

uld

imp

rove p

erform

ance

If ano

ther o

r param

etersW

ou

ld im

pro

ve perfo

rman

ce

If new

segmen

tation

or

oversam

plin

gW

ou

ld im

pro

ve perfo

rman

ce

If t

he

dat

a va

lues

do

n’t

Lo

ok

corr

ect

If d

ata

is n

ot

avai

lab

le

If t

he

dat

a va

lues

do

n’t

Lo

ok

corr

ect

Page 44: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Analytics en la IndustriaMachine Learning

Fraud DetectionRisk Analysis

Customer CareTraffic Analysis

Sales Forecast

Customer Segmentation

Churn Prediction

Decision Tree

Kmeans

Text Mining

Logistic regression

Arima/ Holt Winters ModelsBayesian Networks

Neural Networks

Sentimental Analysis

ANALYTICS INDUSTRY

Page 45: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que podemos hacer con Datamining?

Predecir que producto o servicio comprará?

Predecir si el cliente dejara de ser nuestro cliente (Churn)?

Predecir si el cliente tiene capacidad de pago (Adquirir un crédito, póliza seguro etc.?

Predecir el comportamiento del cliente

Variables de entrada Variable a predecir

Clientes

0.58

0.6

0.8

0.7

0.63

0.40

0.58

0.54

0.52

Page 46: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

CRMCustomer Relationship Management es una metodología que permite conocer, entender e influenciar elcomportamiento de los clientes a través de una comunicación constante que eleve su nivel de compra,garantice la retención del cliente e incremente la utilidad.

Estamos en la era del cliente, de la transformación digital, de las nuevas tecnologías. En ese escenario, larelación también evoluciona, llevando a un nuevo concepto también conocido como experiencia delcliente. El concepto de CRM significa ser centrado en el cliente. Es estrategia, es un proceso, esherramienta y tecnología.

Page 47: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Que es un BPM?Se define como una estrategia para la gestión y mejora del rendimiento de un negocio a través de laoptimización continua de los procesos de negocio en un ciclo repetitivo y cerrado de modelado,ejecución y medición.

Page 48: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Proceso Ejemplo: Ventas

Page 49: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Pasos para elaborar un Proceso

Page 50: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Técnicas de Análisis de Información

Herramientas de Reporteo. Software especializado que permiterealizar análisis OLAP (Online Analytical Procesos), reportes congráficos, exportar datos a hojas de cálculo, presentación de datos enmapas geográficos, realizar simulaciones, etc.

Page 51: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Almacenes de Datos

Page 52: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Data WarehouseEl objetivo de los DWs (almacenamiento de datos) es almacenar los datos de diversos sistemas de información transaccionales en , con el fin de facilitar y agilizar los procesos de toma de decisión por diferentes niveles gerenciales.

Page 53: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Data Lakes y Data WarehousesLos Data Lakes han surgido en el paisaje de Data Management en los últimos años, sin embargo, data lake no es necesariamente un reemplazo del data warehouse. En cambio, complementan los esfuerzos existentes y dan soporte al descubrimiento de nuevas preguntas. Una vez que se descubren esas preguntas se optimizan las respuestas. Y optimizar puede significar moverse fuera del data lake para ir a un data mart o al data warehouse

Page 54: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Diferencias clave entre data lake y data warehouseDatos: Un data warehouse sólo almacena datos que han sido modelados o estructurados, mientras que un Data Lake no hace acepción de datos. Lo almacena todo, estructurado, semiestructurado y no estructurado.

Procesamiento: Antes de que una empresa pueda cargar datos en un data warehouse, primero debe darles forma y estructura, es decir, los datos deben ser modelados. Con un data lake, sólo se cargan los datos sin procesar, tal y como están, y cuando esté listo para usar los datos, es cuando se le da forma y estructura.

Almacenamiento: Una de las principales características de las tecnologías de big data, como Hadoop, es que el coste de almacenamiento de datos es relativamente bajo en comparación con el de un data warehouse. Hay dos razones principales para esto: en primer lugar, Hadoop es software de código abierto, por lo que la concesión de licencias y el soporte de la comunidad es gratuito. Y segundo, Hadoop está diseñado para ser instalado en hardware de bajo coste.

Page 55: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Diferencias clave entre data lake y data warehouseAgilidad: Un almacén de datos es un repositorio altamente estructurado, por definición. No estécnicamente difícil cambiar la estructura, pero puede tomar mucho tiempo dado todos los procesos denegocio que están vinculados a ella. Un data lake, por otro lado, carece de la estructura de un datawarehouse, lo que da a los desarrolladores y a los científicos de datos la capacidad de configurar yreconfigurar fácilmente y en tiempo real sus modelos, consultas y aplicaciones.

Seguridad: La tecnología del data warehouse existe desde hace décadas, mientras que la tecnología de bigdata (la base de un Data Lake) es relativamente nueva. Por lo tanto, la capacidad de asegurar datos en undata warehouse es mucho más madura que asegurar datos en un data lake. Cabe señalar, sin embargo, quese está realizando un importante esfuerzo en materia de seguridad en la actualidad en la industria de BigData.

Page 56: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Data Warehouse en la nubeLos data warehouses están atravesando actualmente dos transformaciones muy importantes.

o 1ra área de transformación es el impulso para aumentar la agilidad general. La gran mayoría de los departamentos de TI están experimentando un rápido aumento de la demanda de datos. Los directivos quieren tener acceso a más y más datos históricos, mientras que al mismo tiempo, los científicos de datos y los analistas de negocios están explorando formas de introducir nuevos flujos de datos en el almacén para enriquecer el análisis existente, así como impulsar nuevas áreas de análisis. Esta rápida expansión de los volúmenes y fuentes de datos significa que los equipos de TI necesitan invertir más tiempo y esfuerzo asegurando que el rendimiento de las consultas permanezca constante y necesitan proporcionar cada vez más entornos para equipos individuales para validar el valor comercial de los nuevos conjuntos de datos.

o 2da Área de transformación gira en torno a la necesidad de mejorar el control de costes. Existe una creciente necesidad de hacer más con cada vez menos recursos, al mismo tiempo que se garantiza que todos los datos sensibles y estratégicos estén completamente asegurados, a lo largo de todo el ciclo de vida, de la manera más rentable.

Page 57: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

¿Por qué migrar a la nube?Las 3 tecnologías que ya tienen y seguirán teniendo un gran impacto en la transformación de negocios son: la nube, datos y análisis, e Internet. Estas tres tecnologías son parte clave del ecosistema del data warehouse actual. Por lo tanto, es posible sacar la conclusión de que el data warehouse en la nube tiene un gran potencial para generar un impacto significativo en los negocios.

La importancia de la nube para el data warehouse está directamente vinculado a tres factores clave:

Mayor agilidad

Mejor control de costes

Co-localización

Page 58: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

¿Por qué migrar a la nube?Mejora de la agilidad - Muchos data warehouses están embarcados en una fase de actualización. Con mucho trabajo puesto ahora en torno al big data, las empresas buscan aprovechar los nuevos flujos de datos y nuevos tipos de análisis más ricos para apoyar e impulsar nuevas áreas, tales como:analítica de clientes de 360°, análisis predictivo, detección de fraude, análisis de IoT y el establecimiento de los datos como centro de beneficio. Muchos de estos proyectos requieren el aprovisionamiento de nuevos entornos de hardware y el despliegue de software. Es más rápido, más fácil y más eficiente iniciar estos nuevos proyectos centrados en los datos utilizando los servicios en la nube.

Mayor control de costes - Muchos equipos de TI están buscando maneras de consolidar los data marts existentes, cada uno ejecutándose en hardware dedicado o incluso en hardware propietario, en un único entorno integrado. Los servicios en la nube de calidad ofrecen la oportunidad perfecta para iniciar este tipo de proyectos. Los activos de datos deben estar protegidos a lo largo de todo el ciclo de vida. Los servicios en la nube deben facilitar todo esto, siendo más rentables ya que todas las características de seguridad se pueden habilitar de forma predeterminada y mejorada, y actualizada de forma transparente.

Co-Localización para una carga más rápida

La mayoría de los data warehouses generan datos directamente desde aplicaciones clave, como

Page 59: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

¿Por qué migrar a la nube?Co-Localización para una carga más rápida - La mayoría de los data warehouses generan datosdirectamente desde aplicaciones clave, como entrada de pedidos, ventas, finanzas y fabricación.Por lo tanto, tiene mucho sentido ubicar conjuntamente el data warehouse junto con lossistemas fuente que ya se estén ejecutándose en la nube. La ubicación conjunta ofrece unacarga de datos más rápida, lo que significa que los usuarios obtienen un acceso más oportuno asus datos.

Page 60: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Data Warehouse vs Big Data vs BILos tres conceptos están interconectados y la perspectiva es que, cada vez más, la mayoría deempresas utilicen el análisis generado por este tipo de tecnologías para tener una visión másanalítica de su negocio y así poder tomar las mejores decisiones para crecer.

Se trata de tres conceptos completamente diferentes que tienen en común una nueva manerade lidiar con los datos, siempre teniendo en cuenta la existencia de una gran volumen deinformación en varios formatos que contribuyen, de forma estructurada o no estructurada, a latoma de decisiones estratégicas. El objetivo final de cualquiera de estas tecnologías es ofreceruna ventaja competitiva a las empresas, pero la forma en que se utiliza es la que marcará ladiferencia.

Page 61: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Data Warehouse vs Big Data vs BIBig Data - Llamamos big data a un gran volumen de datos con una variedad, complejidad y velocidad de crecimiento enorme y que además tienen la característica de no ser estructurados. Eso significa que no son relacionales, estando además fuera del entorno corporativo. Es un tipo de tecnología que te permite analizar los datos en tiempo real y puede provenir de diferentes fuentes y formas, tales como mensajería instantánea, redes sociales, registros de grabaciones, imágenes, mensajes de correo electrónico, etc.

Data Warehouse - Por otro lado, un data warehouse almacena datos consolidados de diversas fuentes o sistemas de la empresa. Se trata de datos estructurados, que tiene como objetivo principal ser precisos y de alta calidad para de esta forma poder dar soporte a la toma de decisiones de la empresa. Se trata de conseguir tener todos los datos juntos para después poder dividirlos para hacer un análisis de determinados sectores o estrategias.

Business Intelligence - Un Business Intelligence (BI) es una especie de “cuello de botella” de los datos recogidos del data warehouse, que llegan de forma exacta y útil para ayudar a la toma de decisiones. Business Intelligence transforma los datos en información útil para analizar no sólo los negocios, sino también las principales estrategias corporativas.

Page 62: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

DatamartLos Datamarts(DMs) son DWs de alcance limitados, dicho de otra manera son pequeños repositorios de datos específicos para cada área de negocios o departamentos de las empresas.

Tanto los DWs como los DMs forman la base a partir de la cual las empresas pueden utilizar las herramientas BI –Business Intelligence -para la extracción de informaciones gerenciales

Page 63: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Componente Data Warehouse

Fuentes de datos

Procedimientos de Extracción

Procedimientos de Transformación

Procedimientos de carga (Loading)

Soporte físico de los datos (DBMS)

Herramientas de explotación : OLAP, reporting, Data Mining, etc.

ETL

Page 64: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

ETLProcedimientos (herramientas) destinados a obtener los datos de las fuentesoperacionales, limpiarlos, convertirlos a los formatos de utilización y cargarlosen el repositorio final.

Page 65: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Integridad de Datos Los datos cumplen condiciones de integridad cuando se ajustan a todos losstándares de valor y completitud.

Todos los datos del DW son correctos.

El DW está completo (no existen más datos fuera de él).

La credibilidad del DW depende de la integridad de sus datos.

El uso del DW depende de la percepción de los usuarios y de la confianza quetengan en su contenido.

De la integridad de datos depende el éxito del proyecto.

Page 66: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo E-R vs Modelo Dimensional

Modelo dimensional

◦ Dimensiones

◦ Hechos

◦ Medidas

Modelo E-R

◦ Entidades

◦ Atributos

◦ Relaciones

Page 67: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo E-R

Page 68: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo Dimensional: Hechos Colección de ítems de datos y datos de contexto. Cada hecho representaun ítem de negocio, una transacción o un evento

Los hechos se registran en las tablas CENTRALES del DW

Page 69: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo Dimensional: Dimensión Una dimensión es una colección de miembros o unidades o individuos del mismo tipo

Cada punto de entrada de la tabla de HECHOS está conectado a una DIMENSION

Determinan el contexto de los HECHOS.

Se utilizan como parámetros para los análisis OLAP

Dimensiones habituales son:◦ Tiempo◦ Geografía◦ Cliente◦ Vendedor

Page 70: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo Dimensional: Dimensión -Miembro

Dimensión Miembro

Tiempo Meses, Trimestre, Años

Geografía País, Región, Ciudad

Cliente Id Cliente

Vendedor Id Vendedor

Page 71: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo Dimensional: Dimensión -Jerarquía

Page 72: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Modelo Dimensional: Medida

Medida : Es un atributo numérico de un hecho que representa la performanceo comportamiento del negocio relativo a la dimensión.

Ejemplos:◦ Ventas en $$

◦ Cantidad de productos

◦ Total de transacciones, etc.

Page 73: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Visualización de un modelo dimensional

Page 74: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

DW - OLAP

El modelo dimensional es ideal para soportar las 4 operaciones básicas de la tecnología OLAP:

◦ Relacionadas con la granularidad: ROLL UP - DRILL DOWN

◦ Navegación por las dimensiones : SLICE - DICE

Page 75: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Matriz – Dimensiones Compartidas

Page 76: MAESTRIA DIRECCIÓN ESTRATÉGICA EN INGENIERÍA DE …

Ciclo de Vida – Solución BI

Project Planning

BusinessRequirements

Definition

BI Application

Specification

DimensionalModeling

TechnicalArchitecture

Design

Product Selection & Installation

Physical Design

BI Application Development

ETL Design Development

Deployment

Growth

Maintenance

Project Management

Business Dimensional Lifecycle – Ralph Kimball