1.8 - topicos selectos - santiago legaspi isaac david

8

Click here to load reader

Upload: isaac-david-santiago-legaspi

Post on 09-Aug-2015

618 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

Semestre:

4to

Materia:Fundamentos de Base de Datos

Grupo:

ISD

Tema:1.8.- Tópicos Selectos De Base de Datos

Catedrático:CASTAÑON OLGUIN EDUARDO

Alumno:Santiago Legaspi Isaac David

Número de Control:

11161087

Page 2: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

1.8.- Tópicos Selectos de Bases de Datos

ETL

Cuando hablábamos de Data Warehousing, pasamos por encima de las herramientas ETL, considerándolas un elemento fundamental en la construcción, explotación y evolución de nuestro Data Warehouse (DW).

Esquema Tipico de Herramienta ETL

Decíamos que las herramientas ETL, deberían de proporcionar, de forma general,  las siguientes funcionalidades:

• Control de la extracción de los datos y su automatización, disminuyendo el tiempo empleado en el descubrimiento de procesos no documentados, minimizando el margen de error y permitiendo mayor flexibilidad.

• Acceso a diferentes tecnologías, haciendo un uso efectivo del hardware, software, datos y recursos humanos existentes.

• Proporcionar la gestión integrada del Data Warehouse y los Data Marts existente, integrando la extracción, transformación y carga para la construcción del Data Warehouse corporativo y de los Data Marts.

• Uso de la arquitectura de metadatos, facilitando la definición de los objetos de negocio y las reglas de consolidación.

• Acceso a una gran variedad de fuentes de datos diferentes.

• Manejo de excepciones.

• Planificación, logs, interfaces a schedulers de terceros, que nos permitirán llevan una gestión de la planificación de todos los procesos necesarios para la carga del DW.

• Interfaz independiente de hardware.

Page 3: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

• Soporte en la explotación del Data Warehouse.

 

Es hora de ampliar las definiciones y entrar un poco mas a fondo en lo que son realmente las ETL´s:

 

Definición de ETL

Si ampliamos las definiciones, en la Wikipedia se dice lo siguiente de las herramientas ETL:

ETL son las siglas en inglés de Extraer, Transformar y Cargar (Extract, Transform and Load). Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos,data mart, o data warehouse   para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Los procesos ETL también se pueden utilizar para la integración con sistemas heredados   (aplicaciones antiguas existentes en las organizaciones que se han de integrar con los nuevos aplicativos, por ejemplo, ERP´s. La tecnología utilizada en dichas aplicaciones puede hacer dificil la integración con los nuevos programas).

(Roberto, 2010)

ERP

Como indica google en su wikipedia. ERP son las siglas de Enterprise Resource Planning o Planificación de Recursos de la Empresa y básicamente es una arquitectura de software para empresas que facilita e integra la información entre las funciones de manifactura, logística, finanzas y recursos humanos de una empresa.

Algunas Características de los Software ERP

- Base de datos centralizada

- Componentes de un Erp interactúan entre si consolidando todas las operaciones.

- En un software ERP los datos se ingresan una sola vez (ya les gustaría). Datos deben ser completos consistentes y comunes

(Bueno esto es lo ideal pero todavía me acuerdo de una vez que encontramos un pedido de compra con tan solo la cabecera y sin datos de posición en las tablas ¿? )

- Las empresas deben de modificar algunos de sus procesos para alinearlos con los del sistema ERP.

Page 4: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

Principales Software ERP:

SAP (15,6%) - Me ha sorprendido este porcentaje creía que era más alto

PeopleSoft (4,9%)

Oracle(4,8%)

Bann(3,0%)

J.D.Ewards(2,2%)

(tracer, 2006)

Data WareHouse

Oracle también posee una herramienta de desarrollo de aplicaciones para el almacén de datos. Oracle Warehouse Builder. Warehouse Builder es una herramienta para el diseño e implantación de todos los aspectos de un almacén de datos, incluyendo el diseño del esquema, asignaciones de datos y transformaciones, procesamiento de carga de datos y gestión de metadatos. Oracle Warehouse Builder soporta los esquemas 3FN y en estrella y puede también importar diseños desde Oracle Designer.

(Silberschatz, Korth, & Sudarshan, 2002)

Elementos básicos de un Data WareHouse

Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.

Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse.

Servidor de presentación: la maquina física objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones.

Modelo dimensional: una disciplina específica para el modelado de datos que es una alternativa para los modelos de entidad – relación.

Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse.

Page 5: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

Data Mart: un subgrupo lógico del Data WareHouse completo.

Data WareHouse: búsquedas fuentes de datos de la empresa. Y es la unión de todos los data marts que la constituyen.

Almacenamiento operacional de datos: es el punto de integración por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos.

OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información y que es ejemplificada por vendedores de OLAP.

ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.

MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional.

Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio.

Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse.

Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones.

Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas que transforma o digiere las salidas del Data WareHouse.

Meta Data: toda la información en el ambiente del Data WareHouse que no son así mismo los datos actuales.

Page 6: 1.8 - Topicos Selectos - Santiago Legaspi Isaac David

Los procesos básicos del Data WareHouse (ETL)

Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.

Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.

Carga: al final del proceso de transformación, los datos están en forma para ser cargados.

(drgutierrez, 2008)

Utilidad de los tópicos selectos de base de datos

La utilidad que tienen las herramientas ETR y ERP son indispensables para el manejo de las bases de datos, ya que de esta forma podemos extraer, transformar y cargar los datos. Un data warehouse es un sistema de almacen que nos permite trabajar con diversas bases de datos y actuar en conjunto entre ellas mismas. Nos permiten una gran flexibilidad para almacenar datos de diferentes conceptos y entornos.

Bibliografía:

drgutierrez. (2008). monografias. Obtenido de http://www.monografias.com/trabajos17/data-warehouse/data-warehouse.shtml

Roberto, E. (febrero de 2010). Data PRIX. Obtenido de http://www.dataprix.com/blogs/respinosamilla/herramientas-etl-que-son-para-que-valen-productos-mas-conocidos-etl-s-open-sour

Silberschatz, A., Korth, H., & Sudarshan, S. (2002). Fundamentos de Base de Datos. Madrid: McGRAW-HILL/INTERAMERICANA DE ESPAÑA.

tracer. (04 de 2006). Mundo SAP. Obtenido de http://www.mundosap.com/foro/showthread.php?t=424