algunas herramientas del mercadooracle warehouse builder 10g release 2 es una herramienta sencilla...

9
Sistemas 49 L as empresas se están enfrentando al creci- miento de datos y al manejo de grandes vo- lúmenes de información; datos obtenidos desde diferentes fuen- tes dentro de la organización, aplicaciones, archivos, procesos, correos electrónicos, páginas Web, imágenes, entre otros, e in- formación generada a partir de dichos datos utilizada en los pro- cesos para la toma de decisiones, indicadores, estadísticas, pro- yecciones, etc. Las soluciones de base de datos que utilizan los sistemas de información, en su mayoría son relacionales y almacenan los datos de forma consistente, efi- ciente y confiable. Pero además, las empresas tienden a almace- nar otros tipos de documentos como imágenes, texto, sonidos, archivos lo que hace necesario guardarlos en documentos XML que son en sí una recopilación de datos. Estos documentos XML requieren que las base de datos los manejen en forma nativa sin requerir la complejidad del pro- cesamiento para convertirlos en estructuras relacionales. Para la generación de informa- ción, las empresas almacenan los Algunas herramientas del mercado Camilo Cañón C. Yamile Osma S. Revisión a las soluciones de varios proveedores. dos PARTE B.qxp 27/03/2007 19:53 PÆgina 49

Upload: others

Post on 31-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • Sistemas 49

    Las empresas se estánenfrentando al creci-miento de datos y almanejo de grandes vo-lúmenes de información; datosobtenidos desde diferentes fuen-tes dentro de la organización,aplicaciones, archivos, procesos,correos electrónicos, páginasWeb, imágenes, entre otros, e in-formación generada a partir dedichos datos utilizada en los pro-cesos para la toma de decisiones,indicadores, estadísticas, pro-yecciones, etc.

    Las soluciones de base de datosque utilizan los sistemas deinformación, en su mayoría sonrelacionales y almacenan losdatos de forma consistente, efi-ciente y confiable. Pero además,las empresas tienden a almace-nar otros tipos de documentos

    como imágenes, texto, sonidos,archivos lo que hace necesarioguardarlos en documentos XMLque son en sí una recopilación dedatos. Estos documentos XMLrequieren que las base de datoslos manejen en forma nativa sinrequerir la complejidad del pro-cesamiento para convertirlos enestructuras relacionales.

    Para la generación de informa-ción, las empresas almacenan los

    Algunas herramientas delmercadoCamilo Cañón C.Yamile Osma S.

    Revisión a las soluciones de varios proveedores.

    d o s

    PARTE B.qxp 27/03/2007 19:53 PÆgina 49

  • 50 Sistemas

    datos utilizando Data Warehou-sing, buscando la integración ycalidad de datos por medio delimpieza y transformación deestos, logrando que con la utili-zación de los datos se identifi-quen tendencias, estadísticas,soluciones para el negocio y seencuentre un significado real delos contenidos. Es decir, obtenerinformación para apoyar lasdecisiones de la organizaciónpor medio de herramientas quefaciliten la consulta y el análisisde los datos, de manera lógica ycoherente.

    Lo más importante es que todaempresa debe encontrar la estra-tegia y el sistema que se acople asus necesidades de almacena-miento e integración de losdatos, toda vez que esto puedellegar a ser una barrera para eléxito.

    A continuación veremos algunasherramientas que se encuentranen el mercado para almacena-miento de datos, tendiendo a lamayor utilización de informa-ción por medio de Bodegas deDatos y la mejora en almacena-miento de datos a través deXML.

    Almacenamiento de XML

    El uso de documentos XML havenido creciendo en las empre-

    sas porque estos permiten elmanejo de datos estructurados yno estructurados. Existen variasestrategias de almacenamientoXML, procesos de transforma-ción y niveles de soporte paraXML en los productos de basesde datos que se encuentran en elmercado.

    Algunas de las empresas quecrean bases de datos están incor-porando tipos de datos XML ensus productos y proveen herra-mientas para la manipulación deeste tipo de datos. Entre ellosestán Oracle, Microsoft e IBM,con características comunes entérminos de soporte a XML.Estas empresas ofrecen similarescaracterísticas para el manejo deXML. Adicionalmente, Oracleofrece a una rica interfaz de pro-gramación para datos XMLusando las clases, servlets y uti-lidades Java. SQL Server deMicrosoft ofrece la mayor flexi-bilidad para la obtención de

    PARTE B.qxp 27/03/2007 19:53 PÆgina 50

  • Sistemas 51

    estructuración de los datosXML.

    Los productos permiten almace-nar un documento XML comouna única columna en la base dedatos con indexamiento y bús-queda. Además, se puede parti-cionar el documento XML encolumnas y tablas en la base dedatos. Las técnicas ofrecidaspara lograr la consulta y almace-namiento de datos XML varían,así como la facilidad para tradu-cir datos XML a una estructurarelacional.

    Oracle

    La estrategia del uso de XML esOracle XML DB, característicade la base de datos Oracle 10gque permite generar, almacenar,recuperar, consultar y adminis-trar volúmenes masivos de datosXML.

    Oracle creo el objeto XMLTypepara procesar los documentos ymensajes XML, tanto para alma-cenamiento de datos estructura-dos y no estructurados. En labase de datos Oracle 10g release2, se adicionan estándares basa-dos en capacidades XQuery, unesquema de utilización de meta-datos, un conjunto de funcionesSQL para operaciones de mani-pulación de datos XML, entreotras funciones.

    Utilizando el tipo de datoXMLType se pueden ejecutaroperaciones SQL que consulten,invoquen funciones OLAP odatos XML, realizar operacionescon los datos XML, realizar bús-quedas XPath, transformacionesXSL. Además, tiene un altodesempeño por ser tecnología dealmacenamiento nativo de XML.

    IBM

    El producto de base de datosDB2 de IBM ofrece soporteXML mediante su producto inte-grado, DB2 XML Extender.XML Extender permite almace-nar y manipular documentosXML completos. DB2 adminis-tra los documentos XML y losalmacena como datos carácter oarchivos externos. Permite recu-perar todo el documento o ele-mentos individuales quecomponen el documento.

    Las características principalesque tiene la base de datos es quepermite extraer elementos y atri-butos XML utilizando los tiposde datos tradicionales de SQL ytiene un sofisticado modelo deindexación. Almacena, recuperay actualiza documentos XML enuna columna, almacena losdocumentos XML como unacolección de datos DB2, múlti-ples columnas o tablas. El pro-ducto XML Extender funciona

    PARTE B.qxp 27/03/2007 19:53 PÆgina 51

  • 52 Sistemas

    como repositorio para la admi-nistración de DTD y contieneopciones de búsqueda dentro delos documentos XML.

    Microsoft

    El tipo de datos XML es un tiponativo en SQL Server 2005, conel mismo tratamiento de losotros tipos incorporados comopor ejemplo varchar o int y seobserva como una columna alcrear una tabla.

    SQL Server 2005 permite inde-xar columnas de tipo XML.Existen dos tipos de índicesXML: el índice primario, queincluye funcionalidad para con-sultas XQuery con base en cami-nos de los elementos XML,búsqueda de valores en los ele-mentos o búsquedas en las pro-piedades y el índice secundarioque contribuyen a mejorar elrendimiento.

    Las características principalespermiten ejecutar consultasXPath, obtener y guardar datosXML. Utiliza sentencias SQLpropias para realizar diferentesconsultas a los datos XML.

    Las organizaciones continuaránutilizando XML para el almace-namiento de datos, de modo quelas bases de datos deben tender asatisfacer estas necesidades y a

    facilitar la administración ymanipulación de los datos dentrode los sistemas de tecnología deinformación, en forma nativa.

    Generación de información

    Teniendo en cuenta el gran volu-men de datos administrados ygenerados por las organizacionesy el aumento en las necesidadesde obtener información relevantepara la toma de decisiones, lasempresas con mayor frecuenciaestán organizando sus datos ensistemas Data Warehousing, a-fianzando la utilización de estossistemas para inteligencia denegocio, en lugar de obtenerinformación por medio de con-sultas complejas en la base de

    PARTE B.qxp 27/03/2007 19:53 PÆgina 52

  • Sistemas 53

    datos corporativa, compuesta enmuchos casos por varias fuentesde datos.

    El Data Warehousing y OLAPsurgieron a principios de los 90,pero a medida que pasa el tiem-po se van incluyendo nuevascaracterísticas, de acuerdo conlas necesidades de los negociosactuales y los retos para mejorarestos sistemas aumentan, frentea la exigencia de rapidez y efi-ciencia en la obtención de infor-mación y una alta calidad de losdatos procesados.

    El proceso de selección de unproducto en particular, comosolución a la necesidad de obte-ner información que apoye a latoma de decisiones, deberá estarregida por ciertos criterios talescomo costo, facilidad de uso,curva de aprendizaje, integra-ción con los sistemas existentes,sumados al soporte y asesoríapara la implantación de una

    bodega de datos, entre otros. Asícomo la importancia que cadaorganización le otorgue a cadacriterio en particular, de acuerdocon sus intereses y restricciones.

    Algunos de los productos líderesque se encuentran en el mercadopara Data Warehouse son Oracle,Teradata, IBM y Microsoft.

    Oracle

    Oracle Warehouse Builder per-mite trabajar diferentes tipos deformatos y de Fuentes de datosdispersas, además, ayuda en latransformación de datos en in-formación de alta calidad opti-mizada para la organización demodo que se puedan generar re-portes del negocio y realizar unanálisis adecuado de esos datos.

    Oracle Warehouse Builder 10gRelease 2 es una herramientasencilla para la administracióncompleta del ciclo de vida de losdatos y metadatos, además, pro-vee una alta calidad de datos,auditoria sobre datos, completaintegración relacional y modela-miento dimensional. Provee unainterface fácil de utilizar y per-mite el diseño de procesos ETL,donde intervienen el data ware-house, las fuentes de almacena-miento y los usuarios finales.Soporta integración de datos yadministra las actividades pro-

    PARTE B.qxp 27/03/2007 19:53 PÆgina 53

  • 54 Sistemas

    pias de un data warehouse, comoproveer ETL (extracción, trans-formación y carga), consolida-ción de datos de fuentes dis-persas dentro de los sistemas quemaneja la organización, migra-ción de datos de sistemas legacy,diseño y manejo corporativo demetadata, limpieza de datos paramantener la calidad de la infor-mación y auditoría en la calidadde datos.

    IBM

    DB2 Data Warehouse Editionintegra y simplifica el ambientede data warehouse para hacerlomás dinámico. Este sistema ofre-ce todas las capacidades paraconsolidar efectivamente loscostos, transformar, administrar,entregar y analizar la informa-ción del negocio; es decir, sacar-le provecho a los datos.

    DB2 ofrece alta flexibilidad y unframewok de data warehousingescalable, combina herramientasde diseño, tecnología avanzadade compresión, capacidad deanálisis en línea y minería pre-construida. Mejora los tiemposde desarrollo y el mantenimientode datos estructurados y noestructurados disminuyendo elesfuerzo realizado por las áreasde tecnología.

    La solución esta enfocada a lautilización de estándares abier-

    tos que permiten una implemen-tación rápida y ofrece un altodesempeño.

    Microsoft

    Microsoft Data WarehousingFramework es una arquitecturaabierta que permite la integra-ción con otros sistemas utiliza-dos en la empresa. La he-rramienta DTS de MicrosoftSQL Server es utilizada comoETL que permite transformar,cargar, exportar y limpiar losdatos.

    El Data Warehousing Frameworktiene una interfaz de programa-ción orientada a objetos utiliza-da para implementar de formapersonalizada, el diseño realiza-do por la empresa para almace-namiento de datos, de acuerdo alas necesidades identificas. Adi-cionalmente, contiene el Micro-soft SQL Server Analysis Servi-ces Manager, utilizado para con-figurar repositorios de datos quepermiten crear y administrar elcontenido de los cubos; tambiénse emplea para planear tareasrelacionadas con el data ware-house, administrar y controlar eldesempeño y realizar consultasdel repositorio.

    Teradata

    Teradata es la empresa líder enData Warehouse según el cua-

    PARTE B.qxp 27/03/2007 19:53 PÆgina 54

  • drante mágico de Gartner1 , com-pitiendo con las empresas ante-riormente mencionadas. Con suproducto Teradata Datawarehou-se 8.0 ofrece a las empresas unmejor rendimiento, integracióncon diferentes plataformas, unainterfaz web útil para el usuarioy funcionalidad de Dual Activedatawarehousig o replicaciónautomática.

    Teradata Datawarehouse permiteanalizar las operaciones delnegocio y administrarlas mejor,ofreciendo una completa vistadel negocio y dando flexibilidady agilidad para la toma rápida dedecisiones, por medio de tecno-logía integrada, optimizada yescalable. Provee servicios parael manejo de un repositorio dedatos actuales e históricos.

    Este sistema, tiene característi-cas avanzadas en alto desempe-

    ño, herramientas completas deadministración y acceso a datosy un software para minería dedatos. Dentro de las herramien-tas el Active Enterprise Intelli-gence, sirve para interactuar conlas fuentes de datos de los clien-tes, incorporando estos datosconsultados al sistema de laempresa, funcionando con acce-so en tiempo real a la informa-ción para realizar análisis ypredicciones encaminadas atomar decisiones tácticas ade-cuadas.

    Con mayor frecuencia, lasempresas van a seguir utilizandolos datos para generar informa-ción dentro de la organización;por ello es adecuado que lascompañías enfoquen sus esfuer-zos en el mejor almacenamientode datos y en la utilización de lascaracterísticas que están ofre-ciendo tanto las bases de datostradicionales como los datawarehouse existentes en el mer-cado. Es de vital importanciatener seguridad sobre los datosen que se está basando la tomade decisiones y la disponibilidadde la información cuando senecesita realmente.

    Notas

    1 Tomado de [9] Figura 1. Magic Qua-drant for Data Warehouse DatabaseManagment systems, 2006.

    Sistemas 55

    PARTE B.qxp 27/03/2007 19:53 PÆgina 55

  • 56 Sistemas

    Tabla 1. Inteligencia de negocios, una solución de varios componentes.

    PARTE B.qxp 27/03/2007 19:53 PÆgina 56

  • Sistemas 57

    http://www. sybase.com/con-tent/1043869/GartnerPublishes_DW_MQ-092506.pdf 2 Tomado de [1] Oracle WarehouseBuilder3 Tomado de [8] Data Warehouse Edi-tion4 Tomado de [3] Business Intelligenceand Data Warehousing in SQL Server20055 Tomado de [7] Teradata WarehouseTechnical Overview

    Referencias

    [1]Oracle Data Warehousing. The Glo-bal Data Warehouse Market Leader.http://www.oracle.com/solutions/busi-ness_intelligence/dw_home.html.[2]Web Site Microsoft. www.micro-soft.com[3]http://www.microsoft.com/technet/p

    rodtechnol/sql/2005/dwsqlsy.mspx[4]Web Site Teradata. http://www.tera-data.com/t/ , [5]http://www.teradata.com/t/page/163190/index.html[6]http://mediaproducts.gartner.com/reprints/ncr/vol3/article4/article4.html [7]http://www.teradata.com/t/pdf.aspx?a=83673&b=84876[8]DB2 Data Warehouse Edition. Thetop of the line IBM DB2 Edition fordata warehousing, OLTP, and mixedworkloads. http://www-306.ibm.com/software/data/db2/dwe/features.html?S_CMP=wspace [9] Magic Quadrant for Data Ware-house Database Managment systems,2006. Garner RAS Core Research NoteG00138797, Donald Feinberg, Mark A.Beyer, 12 September 2006, R198409122007.

    Camilo Cañón Correa. Ingeniero de Sistemas de la Pontificia Universidad Javeriana.Especialista en Finanzas. Ingeniero Especializado del Banco de la República. Docente de laPontificia Universidad Javeriana

    Yamile Osma Sandoval. Ingeniera de Sistemas de la Universidad Industrial de San-tander. Candidata a Magíster de la Universidad de los Andes.

    PARTE B.qxp 27/03/2007 19:53 PÆgina 57