datawarehouse

8
DATAWAREHOUSE Data Warehouse es un conjunto integrado de bases de datos, que están diseñados para el apoyo a la toma de decisiones, y donde cada unidad de datos es relevante en algún momento del tiempo, un datawarehouse es algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. El datawarehouse elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico. Los objetivos del datawarehouse son: Hacer la información de la organización accesible Controlar el acceso efectivo a los datos Generar información de manera flexible Servir de ayuda a la toma de decisiones La importancia de usar un datawarehouse es que mejora la entrada de datos y por ende la entrega de información así como puede ayudar a la toma de decisiones DATA MART Un data mart es una versión especial de un datawarehouse, es una parte del DW que ayuda a una área específica del negocio para que pueda tomar mejores decisiones. Es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. Por otra parte, se conoce como Data Mining al proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil, por ejemplo para realizar clasificaciones o predicciones. Data Mart es un modelo multidimensional basado en tecnología OLAP que representa a un área específica de la empresa, incluyendo las variables claves y los indicadores para el proceso de toma de decisiones. Es una base de datos orientada a un tema específico. En otras palabras es un subconjunto del DataWarehouse Corporativo.

Upload: jorch-mendez

Post on 03-Jul-2015

277 views

Category:

Education


2 download

TRANSCRIPT

Page 1: Datawarehouse

DATAWAREHOUSE

Data Warehouse es un conjunto integrado de bases de datos, que están diseñados para el

apoyo a la toma de decisiones, y donde cada unidad de datos es relevante en algún

momento del tiempo, un datawarehouse es algo que provee dos beneficios empresariales

reales: Integración y Acceso de datos.

El datawarehouse elimina una gran cantidad de datos inútiles y no deseados, como

también el procesamiento desde el ambiente operacional clásico.

Los objetivos del datawarehouse son:

Hacer la información de la organización accesible

Controlar el acceso efectivo a los datos

Generar información de manera flexible

Servir de ayuda a la toma de decisiones

La importancia de usar un datawarehouse es que mejora la entrada de datos y por ende la

entrega de información así como puede ayudar a la toma de decisiones

DATA MART

Un data mart es una versión especial de un datawarehouse, es una parte del DW que

ayuda a una área específica del negocio para que pueda tomar mejores decisiones.

Es un sistema orientado a la consulta, en el que se producen procesos batch de carga de

datos (altas) con una frecuencia baja y conocida. Por otra parte, se conoce como Data

Mining al proceso no trivial de análisis de grandes cantidades de datos con el objetivo de

extraer información útil, por ejemplo para realizar clasificaciones o predicciones.

Data Mart es un modelo multidimensional basado en tecnología OLAP que representa a un área específica de la empresa, incluyendo las variables claves y los indicadores para el proceso de toma de decisiones.

Es una base de datos orientada a un tema específico. En otras palabras es un subconjunto del DataWarehouse Corporativo.

Page 2: Datawarehouse

Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un DataWareHouse, o integrar por sí mismo un compendio de distintas fuentes de información.

Componentes del Datamart

1.- Fuentes de Datos

Son las que alimentan de información al DataMart, están diseñadas para registrar grandes cantidades de transacciones. Entre ella tenemos la base de datos OLTP (Una base de datos para soportar procesos transaccionales). Características:

Son pobladas por usuarios finales.

Se optimizan en función a procesos transaccionales.

Se actualizan constantemente.

Contienen mucha información de detalle.

2.- Procesos de extracción, transformación y carga de datos (ETL) Los datos se encuentran almacenados en base de datos destinados al registro de transacciones. Es necesario extraer y transformar los datos antes de cargar los resultados en el Datamart. Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por diferentes software DBMS, pueden definirse al usar nombres de elementos

Page 3: Datawarehouse

inconsistentes, que tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el Datamart. Uno de los desafíos de cualquier implementación de DataWarehouse o Datamart, es el problema de transformar los datos. La transformación se encarga de las inconsistencias en los formatos de datos y la codificación, que pueden existir dentro de una base de datos única y que casi siempre existen cuando múltiples bases de datos contribuyen al Datamart. Un Datamart almacena la información de un área o departamento específico y un conjunto de Datamart forman un DataWarehouse Un Datamart es una solución que, compartiendo tecnología con el DataWarehouse (pero con contenidos específicos, volumen de datos más limitado y un alcance histórico menor), permita dar soporte a una empresa pequeña, un departamento o área de negocio de una empresa grande. El Datamart cubre de manera óptima las necesidades de informes. No es conveniente efectuar consultas sobre los sistemas transaccionales, debido a que hay que integrar datos de diversas OLTP.

Herramientas de Explotación El Datamart está orientado a la toma de decisiones. Un buen diseño de la base de datos favorece el análisis y la recuperación de datos para obtener una ventaja estratégica y para facilitar la toma de decisiones. El Datamart no está orientado a procesos relacionados con la operatividad del área determinada. El Datamart está preparado para ser explotado mediante herramientas específicas que permiten la extracción de información significativa y patrones de comportamiento que permanecen ocultos en un enorme repositorio de datos. Veamos las herramientas software que existen: Herramienta de consulta y reporte

Las herramientas de consulta al igual que la mayoría de herramientas visuales, permiten apuntar y dar un click a los menús y botones para especificar los elementos de datos, condiciones, criterios de agrupación y otros atributos de una solicitud de información. La herramienta de consulta genera entonces un llamado a una base de datos, extrae los datos pertinentes, efectúa cálculos adicionales, manipula los datos si es necesario y

Page 4: Datawarehouse

presenta los resultados en un formato claro. Se puede almacenar las consultas y los pedidos de reporte para trabajos subsiguientes, como está o con modificaciones.

Herramientas de base de datos multidimensionales / OLAP

Las primeras soluciones OLAP estuvieron basadas en bases de datos multidimensionales (MDDBS). Un cubo estructural (dos veces un hipercubo o un arreglo multidimensional) almacenaba los datos para que se puedan manipular intuitivamente y claramente ver las asociaciones a través de dimensiones múltiples Pero este enfoque tiene varias limitaciones: Las nuevas estructuras de almacenamiento de datos requieren bases de datos propietarias. No hay realmente estándares disponibles para acceder a los datos multidimensionales. La segunda limitación de un MDDB concierne al desarrollo de una estructura de datos. Las compañías generalmente almacenan los datos de la empresa en bases de datos relacionales, lo que significa que alguien tiene que extraer, transformar y cargar estos datos en el hipercubo.

Sistemas de información ejecutivos

Las herramientas de sistemas de información ejecutivos proporcionan medios sumamente fáciles de usar para consulta y análisis de la información confiable. Generalmente se diseñan para el usuario que necesita conseguir los datos rápidamente, pero quiere utilizar el menor tiempo posible para comprender el uso de la herramienta. El precio de esta facilidad de uso es que por lo general existen algunas limitaciones sobre las capacidades analíticas disponibles con el sistema de información ejecutivo. Además, muchas de las herramientas de consulta/reporte y OLAP/multidimensional, pueden usarse para desarrollar sistemas de información ejecutivos. El concepto de sistema de información ejecutivo es simple: los ejecutivos no tienen mucho tiempo, ni la habilidad en muchos casos, para efectuar el análisis de grandes volúmenes de datos. El EIS presenta vistas de los datos simplificados, altamente consolidados y mayormente estáticas.

Page 5: Datawarehouse

Herramientas de Data Mining

Data Mining es una categoría de herramientas de análisis open-end. En lugar de hacer preguntas, se toma estas herramientas y se pregunta algo "interesante", una tendencia o una agrupación peculiar, por ejemplo. El proceso de Data Mining extrae los conocimientos guardados o información predictiva desde el Datamart sin requerir pedidos o preguntas específicas. Las herramientas Mining usan algunas de las técnicas de computación más avanzadas para generar modelos y asociaciones como redes neuronales, detección de desviación, modelamiento predictivo y programación genética. Data Mining es un dato-conducido, no una aplicación-conducida.

CUADRO DE MANDO INTEGRAL

El concepto de Cuadro de Mando Integral es un método para medir las actividades de una

compañía en términos de su visión y estrategia. Proporciona a los gerentes una mirada

global del desempeño del negocio.

Es una herramienta de administración de empresas que muestra continuamente cuándo

una compañía y sus empleados alcanzan los resultados definidos por el plan estratégico.

También es una herramienta que ayuda a la compañía a expresar los objetivos e iniciativas

necesarias para cumplir con la estrategia.

Perspectiva financiera

Los indicadores financieros están basados en la contabilidad de la compañía, y muestran

el pasado de la misma. El motivo se debe a que la contabilidad no es inmediata.

Esta perspectiva abarca el área de las necesidades de los accionistas. Esta parte del BSC se

enfoca a los requerimientos de crear valor para el accionista como: las ganancias,

rendimiento económico, desarrollo de la compañía y rentabilidad de la misma.

Valor Económico Agregado, Retorno sobre Capital Empleado, Margen de Operación,

Ingresos, Rotación de Activos son algunos indicadores de esta perspectiva.

Algunos indicadores frecuentemente utilizados son:

Índice de liquidez.

Índice de endeudamiento.

Metodología DuPont.

Índice de rendimiento del capital invertido

Perspectiva del cliente

Para lograr el desempeño financiero que una empresa desea, es fundamental que posea

clientes leales y satisfechos, con ese objetivo en esta perspectiva se miden las relaciones

Page 6: Datawarehouse

con los clientes y las expectativas que los mismos tienen sobre los negocios. Además, en

esta perspectiva se toman en cuenta los principales elementos que generan valor para los

clientes integrándolos en una propuesta de valor, para poder así centrarse en los procesos

que para ellos son más importantes y que más los satisfacen.

La Perspectiva de Clientes, como su nombre lo dice está enfocada a la parte más

importante de una empresa, sus clientes; sin consumidores no existe ningún tipo de

mercado. Por consiguiente, se deberán cubrir las necesidades de los compradores entre

las que se encuentran los precios, la calidad del producto o servicio, tiempo, función,

imagen y relación. Cabe mencionar que todas las perspectivas están unidas entre sí, esto

significa que para cubrir las expectativas de los accionistas también se debe cubrir las de

los consumidores para que compren y se genere una ganancia. Algunos indicadores de

esta perspectiva son: Satisfacción de clientes, desviaciones en acuerdos de servicio,

reclamos resueltos del total de reclamos, incorporación y retención de clientes.

SISTEMA DE INFORMACION EJECUTIVA

Un Sistema de Información Ejecutiva es una herramienta de Inteligencia empresarial

(Business Intelligence, BI), orientada a usuarios de nivel gerencial, que permite monitorear

el estado de las variables de un área o unidad de la empresa a partir de información

interna y externa a la misma.

Se puede considerar que un EIS es un tipo de Sistema de Soporte a la Decisión (DSS) cuya

finalidad principal es que el responsable de un departamento o compañía tenga acceso,

de manera instantánea, al estado de los indicadores de negocio que le afectan, con la

posibilidad de estudiar con detalle aquellos aspectos que no estén cumpliendo con los

objetivos establecidos en su plan estratégico u operativo, y así determinar las medidas de

contingencia más adecuadas. Una de las características más importantes de un EIS es que

permite a usuarios con perfil no técnico construir nuevos informes y navegar por los datos

de la compañía, con el objetivo de descubrir información que les resulte relevante. Esto se

debe, entre otras cosas, a que la interfaz gráfica de estas aplicaciones suele ser muy

atractiva e intuitiva. El EIS suele incluir también alertas de negocio, informes históricos

comparativos y análisis de tendencias. Por otro lado, es común que se puedan realizar

subscripciones a los informes o listados más significativos.

Un EIS suele necesitar de la implantación de un data Warehouse o data mart que actúe

como fuente central de información, unificando, depurando e integrando las distintas

bases de datos operacionales de la compañía. Por otro lado, es posible adaptar la

estructura del EIS a la teoría de Balanced Scorecard o Cuadro de Mando

Integral impulsada por Kaplan y Norton, o bien a cualquier otro modelo de seguimiento de

indicadores que maneje la organización.

Page 7: Datawarehouse

SISTEMA DE SOPORTE DE DECISIONES

Un sistema de soporte a las decisiones es muy amplio, debido a que hay muchos enfoques

para la toma de decisiones y debido a la extensa gama de ámbitos en los cuales se toman.

Estos sistemas de apoyo son del tipo OLAP o de minería de datos, que proporcionan

información y soporte para tomar una decisión.

Un DSS puede adoptar muchas formas diferentes. En general, podemos decir que un DSS

es un sistema informático utilizado para servir de apoyo, más que automatizar, el proceso

de toma de decisiones. La decisión es una elección entre alternativas basadas en

estimaciones de los valores de esas alternativas. El apoyo a una decisión significa ayudar a

las personas que trabajan solas o en grupo a reunir inteligencia, generar alternativas y

tomar decisiones. Apoyar el proceso de toma de decisión implica el apoyo a la estimación,

la evaluación y/o la comparación de alternativas. En la práctica, las referencias a DSS

suelen ser referencias a aplicaciones informáticas que realizan una función de apoyo.

Un DSS, en términos muy generales, es "un sistema basado en computador que ayuda en el proceso de toma de decisiones" En términos bastante más específicos, un DSS es "un sistema de información basado en un computador interactivo, flexible y adaptable, especialmente desarrollado para apoyar la solución de un problema de gestión no estructurado para mejorar la toma de decisiones. Utiliza datos, proporciona una interfaz amigable y permite la toma de decisiones en el propio análisis de la situación" Un DSS es un "conjunto de procedimientos basados en modelos para procesar datos y juicios para asistir a un gerente en su toma de decisiones"

Los DSS son herramientas de mucha utilidad en Inteligencia empresarial (Business

Intelligence), permiten realizar el análisis de las diferentes variables de negocio para

apoyar el proceso de toma de decisiones de los directivos:

Permite extraer y manipular información de una manera flexible.

Ayuda en decisiones no estructuradas.

Permite al usuario definir interactivamente qué información necesita y cómo combinarla.

Suele incluir herramientas de simulación, modelización, etc.

Puede combinar información de los sistemas transaccionales internos de la empresa con

los de otra empresa externa.

Su principal característica es la capacidad de análisis multidimensional (OLAP) que permite

profundizar en la información hasta llegar a un alto nivel de detalle, analizar datos desde

diferentes perspectivas, realizar proyecciones de información para pronosticar lo que

puede ocurrir en el futuro, análisis de tendencias, análisis prospectivo, etc.

Page 8: Datawarehouse

Un DSS da soporte a las personas que tienen que tomar decisiones en cualquier nivel de

gestión, ya sean individuos o grupos, tanto en situaciones semiestructuradas como en no

estructuradas, a través de la combinación del juicio humano e información objetiva:

Soporta varias decisiones interdependientes o secuenciales.

Ofrece ayuda en todas las fases del proceso de toma de decisiones -inteligencia,

diseño, selección, e implementación- así como también en una variedad de procesos y

estilos de toma de decisiones.

Es adaptable por el usuario en el tiempo para lidiar con condiciones cambiantes.

Genera aprendizaje, dando como resultado nuevas demandas y refinamiento de la

aplicación, que a su vez da como resultado un aprendizaje adicional.

Generalmente utiliza modelos cuantitativos (estándar o hechos a la medida).

Los DSS avanzados están equipados con un componente

de administración del conocimiento que permite una solución eficaz y eficiente de

problemas muy complejos.

Puede ser implantado para su uso en Web, en entornos de escritorio o en dispositivos

móviles (PDA).

Permite la ejecución fácil de los análisis de sensibilidad.