análisis de las soluciones y herramientas tecnológicas disponibles parte 2
DESCRIPTION
ANÁLISIS DE LAS SOLUCIONES Y HERRAMIENTAS TECNOLÓGICAS DISPONIBLES parte 1TRANSCRIPT
![Page 1: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/1.jpg)
Etapas de construcción de un datawarehouse
Captura o exhibición de los datos de las fuentes seleccionadas Se utilizan herramientas de extracción que soportan múltiples formatos de almacenamiento, para luego incorporarlos en el datawarehouse.
![Page 2: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/2.jpg)
Tratamiento, conversión y transformación de los datosDetectar y corregir errores
Eliminar duplicadosDetectar y eliminar datos sin sentidos
Analizar la consistencia en el uso de los valoresCodificar sexoUtilizar mismas unidades de medidasFormatos de fechasDirecciones
![Page 3: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/3.jpg)
Añadir la referencia temporal a los datos capturados
Tratamiento de la ausencia de los valoresAsignar valores por defecto a determinados campos
Eliminar campos no significativosReestructurar y añadir nuevos campos
Enriquecer los datos con mas información fundamental
Incorporar datos estadísticos de institucionesCualificar la base de datos por variables socio-
demográficos o información adicional sobre empresas.
![Page 4: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/4.jpg)
Normalizar determinados camposNormalización de nombre de clientesNormalización de nombre de ciudades,
países, etc.Codificar campos para facilitar su
tratamiento estadísticoConvertir direcciones en códigos de areaTraducir fechas de nacimiento en intervalos
de edadesCodificar al actividad empresarial o
profesional de los clientes
![Page 5: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/5.jpg)
Calculo de campos derivadosCalculo de subtotales y datos contables
Filtrado y depuración de registrosDepurar a clientes y clientes potenciales de
acuerdo con la relación que tienen ante la empresa
![Page 6: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/6.jpg)
Carga en el sistema gestor de datos del Datawarehouse
![Page 7: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/7.jpg)
Administración
- Código de pedido.- Código de cliente.- Fecha.- referencias de productos, cantidades y precios.- Importe total.
Marketing
- Identificador del cliente.- Perfil del cliente.- Historial de quejas y reclamaciones. - Solicitudes de información.
Producción
-Referencia de producto.- Stock.- Unidades producidas.- Unidades demandadas.- Coste.- Precio de venta.
Data Warehouse
Clientes. Productos. Ventas. Inventarios. Precio.
Extracción, transformació
n y carga
![Page 8: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/8.jpg)
Sistema Gestor de Datos en un Datawarehouse
Capacidad para recibir o enviar datos.Capacidad para gestionar varios
volúmenes de datos.Registro de metadatos que faciliten la
explotación del sistema.Registro de datos con varios niveles de
detalle.
![Page 9: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/9.jpg)
Utilización eficaz de gran cantidad de índices.
Optimización del espacio de almacenamiento disponible.
Interfaz con multitud de herramientas y lenguajes de consulta.
![Page 10: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/10.jpg)
Tipos de sistemas de gestión de base de datos.
Base de datos relacional tradicional.
Base de datos relacional con un diseño en estrella.
Base de datos multidimensional.
![Page 11: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/11.jpg)
Base de Datos Relacional tradicional.
Se usa para construir Datawarehouse de tamaño relativamente pequeño.
Limitación al numero de índices creados en la base de datos.
Datos no volátiles. No es posible optimizar el
almacenamiento físico de los datos.
![Page 12: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/12.jpg)
Base de datos relacional con un diseño en estrella.
Consiste básicamente en utilizar estructuras de datos no normalizadas.
Esto ayuda a agilizar consultas y operaciones.
![Page 13: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/13.jpg)
Base de Datos MultidimensionalSe almacenan los datos en cubos
multidimensionales.Ocupan gran espacio.
![Page 14: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/14.jpg)
![Page 15: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/15.jpg)
Explotación del DatawarehouseHerramientas de generación de consultas
(“Queries and Reporting”)
Análisis Multidimensional (OLAP: On Line Analytical Processing)
Herramientas de Datamining
![Page 16: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/16.jpg)
Herramientas de generación de consultas (“Queries and Reporting”)
Son las clásicas herramientas de generación de consultas e informes de los sistemas de base de datos.
![Page 17: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/17.jpg)
Análisis Multidimensional (OLAP: On Line Analytical Processing)
Son herramientas que facilitan el análisis de los datos a través de dimensiones y de jerarquías.
![Page 18: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/18.jpg)
Herramientas de Datamining
Son técnicas avanzadas que permiten detectar y modelizar relaciones entre datos y obtener información no evidente.
![Page 19: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/19.jpg)
Tecnología necesarias para los sistemas de Datawarehousing
Requieren equipos de altas prestaciones para poder manejar grandes volúmenes de datos con rapidez y eficacia.
Existen 2 tipos de arquitecturas de servidores:
SMP (Symmetric Multiprocessing)MPP (Massively Parallel)
![Page 20: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/20.jpg)
Arquitectura SMP ( Symmetric Multiprocessing)
![Page 21: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/21.jpg)
Arquitectura MPP (Massively Parallel)
![Page 22: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/22.jpg)
Herramientas de análisis de datos OLAP
Dimensiones: grupos conceptuales que permiten analizar o consolidad datos.
Medidas o indicadores: valores numéricos que se guardan en la base da datos.
Jerarquía de dimensiones: distintos niveles de agregación.
![Page 23: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/23.jpg)
Herramientas de DataminingConstituyen métodos avanzados para
explorar y modelizar relaciones en grandes volúmenes de datos.
Muestreo.Exploración.Modificación.Modelización del comportamiento.Evaluación.Presentación grafica de los resultados.
![Page 24: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/24.jpg)
Herramientas estadisticas Calculo de distintos parámetros
estadísticos. Técnicas bayesianas.Hipótesis. Técnicas de regresión lineal.Análisis multivariante.
![Page 25: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/25.jpg)
Análisis cluster: agrupación de datos para poder llevar a cabo la segmentación de clientes.
![Page 26: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/26.jpg)
Técnicas de inteligencia artificial Algoritmos genéticos.
Redes neuronales.
![Page 27: Análisis de las soluciones y herramientas tecnológicas disponibles parte 2](https://reader035.vdocumento.com/reader035/viewer/2022062419/5587383cd8b42a18238b46f7/html5/thumbnails/27.jpg)
Herramientas simbólicasArboles de decisión.Reglas de asociación.Identificación de patrones secuenciales.