universidad regional autÓnoma de los...
Post on 27-Sep-2018
226 Views
Preview:
TRANSCRIPT
UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS ANDES
UNIANDES
FACULTAD DE SISTEMAS MERCANTILES
PROGRAMA DE MAESTRÍA EN INGENIERÍA Y SISTEMAS DE
COMPUTACIÓN
PROYECTO DE EXAMEN COMPLEXIVO PREVIO A LA OBTENCIÓN DEL
GRADO ACADÉMICO DE MAGISTER EN INGENIERÍA Y SISTEMAS DE
COMPUTACIÓN
TEMA:
DESARROLLO DE UN DATAWAREHOUSE PARA EL TRATAMIENTO DE LA
INFORMACIÓN Y LA TOMA DE DECISIONES EN EL SISTEMA EDUCATIVO
DE LA CIUDAD DE LATACUNGA.
AUTOR: ING. MULLO CASNANZUELA PEDRO PABLO
ASESOR: ING. MARTÍNEZ CAMPAÑA CARLOS EDUARDO, MSC.
AMBATO – ECUADOR
2017
APROBACIÓN DEL ASESOR DEL TRABAJO DE TITULACIÓN
CERTIFICACIÓN:
Quien suscribe, legalmente CERTIFICA QUE: El presente Trabajo de Titulación
realizado por el señor PEDRO PABLO MULLO CASNANZUELA, estudiante de la
MAESTRÍA EN INGENIERÍA Y SISTEMAS DE COMPUTACIÓN, Facultad de
Sistemas Mercantiles, con el tema “Desarrollo de un datawarehouse para el
tratamiento de la información y la toma de decisiones en el sistema educativo de la
ciudad de Latacunga”, ha sido prolijamente revisado, y cumple con todos los requisitos
establecidos en la normativa pertinente de conformidad con el Reglamento de Graduación
de Postgrado de la Universidad Regional Autónoma de los Andes – UNIANDES, por lo
que apruebo su presentación.
Ambato, Agosto de 2017
Ing. Carlos Eduardo Martínez Msc.
ASESOR
DECLARACIÓN DE AUTENTICIDAD
Yo, Pedro Pablo Mullo Casnanzuela, estudiante de la Maestría en Ingeniería de Sistemas,
Facultad de Sistemas Mercantiles, declaro que todos los resultados obtenidos en el presente
trabajo de investigación, previo a la obtención del grado académico de MÁGISTER EN
INGENIERÍA Y SISTEMAS DE COMPUTACIÓN, son absolutamente originales,
auténticos y personales; a excepción de las citas, por lo que son de mi exclusiva
responsabilidad.
Ambato, Agosto de 2017
Pedro Pablo Mullo Casnanzuela
C.I. 0502040843
AUTOR
DERECHOS DEL AUTOR
Yo, Pedro Pablo Mullo Casnanzuela, declaro que conozco y acepto la disposición
constante en el literal d) del Art. 85 del Estatuto de la Universidad Regional Autónoma de
los Andes, que en su parte pertinente textualmente dice: El Patrimonio de la UNIANDES,
está constituido por: La propiedad intelectual sobre las investigaciones, trabajos científicos
o técnicos, proyectos profesionales y consultoría que se realicen en la Universidad o por
cuenta de ella.
Ambato, Agosto de 2017
Pedro Pablo Mullo Casnanzuela
C.I. 0502040843
AUTOR
DEDICATORIA
Dedico este trabajo a Dios por ser mi fortaleza ante mis debilidades; a mis padres por ser
mis guías, quienes me enseñaron a dar mis primeros pasos por los senderos de la vida, a
mis hermanas y demás familiares por tenerme siempre presente en todo momento y lugar;
y a todas las personas que con su ejemplo fueron motivo de mi inspiración para ser mejor
cada día, planteándome retos cada vez más prometedores y que es mi deber alcanzarlos.
A todos ellos les dedico mi esfuerzo…
Pedro Mullo
AGRADECIMIENTO
Agradezco a Dios por sembrar en mi mente esa idea de enfrentarme a nuevos retos,
difíciles pero con la esperanza de alcanzarlo. A la Universidad Regional Autónoma de los
Andes “UNIANDES”, por brindarme la oportunidad de alcanzar una nueva meta, a sus
autoridades, personal administrativo, docentes y de servicio. De manera especial al Msc.
Carlos Martínez, asesor del presente trabajo, por su guía y paciencia demostrada en todo
este proceso.
Pedro Mullo
ÍNDICE GENERAL
PORTADA
APROBACIÓN DEL ASESOR DEL TRABAJO DE TITULACIÓN
DECLARACIÓN DE AUTENTICIDAD
DERECHOS DEL AUTOR
CERTIFICACIÓN DEL LECTOR DEL TRABAJO DE TITULACIÓN
DEDICATORIA
AGRADECIMIENTO
ÍNDICE GENERAL
LISTADO DE TABLAS
LISTADO DE FIGURAS
RESUMEN EJECUTIVO
ABSTRACT
INTRODUCCIÓN ................................................................................................................. 1
ANTECEDENTES DE LA INVESTIGACIÓN.................................................................... 1
PLANTEAMIENTO DEL PROBLEMA .............................................................................. 2
FORMULACIÓN DEL PROBLEMA ................................................................................... 3
DELIMITACIÓN DEL PROBLEMA ................................................................................... 3
OBJETO DE INVESTIGACIÓN Y CAMPO DE ACCIÓN ................................................ 3
Objeto de Investigación ......................................................................................................... 3
Campo de acción .................................................................................................................... 3
IDENTIFICACIÓN DE LA LÍNEA DE INVESTIGACIÓN ............................................... 3
OBJETIVOS .......................................................................................................................... 4
Objetivo General .................................................................................................................... 4
Objetivos Específicos ............................................................................................................ 4
Idea a defender ..................................................................................................................... 4
JUSTIFICACIÓN DEL TEMA ............................................................................................. 4
CAPÍTULO I ......................................................................................................................... 6
1. MARCO TEÓRICO ................................................................................................ 6
1.1. Marco Referencial ...................................................................................................... 6
1.1.1. Introducción ............................................................................................................... 6
1.1.2. Origen del sistema educativo Latacunga ................................................................. 7
1.1.3. Niveles administrativos de planificación ................................................................. 8
1.1.4. Beneficios de las zonas, distritos y circuitos ......................................................... 10
1.1.5. Códigos de identificación de los distritos y circuitos ............................................ 11
1.1.6. Disposiciones Generales ........................................................................................ 11
1.2. Business intelligence – Inteligencia de negocios .................................................. 12
1.2.1. Historia de la inteligencia de negocios ................................................................ 13
1.2.2. Características de Business intelligence .............................................................. 14
1.2.3. Ventajas de inteligencia de negocios................................................................... 15
1.2.4. Desventajas de inteligencia de negocios ............................................................. 15
1.2.5. Niveles de realización de BI ................................................................................ 16
1.2.5.1.1. Informes ..................................................................................................... 16
1.2.5.1.2. Análisis ....................................................................................................... 16
1.2.6. Sistemas de Información ....................................................................................... 16
1.2.6.1. Funciones de un sistema de información ............................................................ 18
1.2.6.1.1. Procesamiento de transacciones ................................................................. 18
1.2.6.1.2. Definición de archivos ............................................................................... 18
1.2.6.1.3. Mantenimiento de archivos ........................................................................ 18
1.2.6.1.4. Generación de reportes ............................................................................... 18
1.2.6.1.5. Procesamientos de consultas ...................................................................... 19
1.2.6.1.6. Mantenimiento e integridad de datos ......................................................... 19
1.2.6.2. Sistemas de soporte a decisiones ......................................................................... 19
1.2.6.2.1. Sistemas de información gerencial (MIS) ........................................................... 19
1.2.6.2.2. Sistemas de información ejecutiva (EIS) ............................................................ 20
1.2.6.2.3. Sistemas expertos basados en inteligencia artificial (SSEE)............................... 20
1.2.6.2.4. Sistemas de apoyo a decisión del grupo (GDSS) ................................................ 21
1.2.7. Datos, información, conocimiento ......................................................................... 21
1.2.7.1. Datos. ................................................................................................................... 21
1.2.7.2. Información. ........................................................................................................ 22
1.2.7.3. Conocimiento. ..................................................................................................... 23
1.2.8. Arquitectura de solución de la inteligencia de negocios. ...................................... 23
1.2.8.1. Capa de integración ............................................................................................. 23
1.2.8.2. Capa de análisis ................................................................................................... 24
1.2.8.3. Capa de visualización .......................................................................................... 24
1.2.9. Cuadro de Mando Integral o Dashboard ................................................................ 25
1.2.10. Esquemas multidimensionales ............................................................................... 26
1.2.10.1. Esquema estrella .................................................................................................. 27
1.2.10.2. Esquema Copo de Nieve ..................................................................................... 27
1.2.11. Base de Datos ........................................................................................................ 28
1.2.12. Microsoft SQL Server ........................................................................................... 30
1.2.12.1. Motor de bases de datos ...................................................................................... 30
1.2.12.2. Integration services (SSIS) .................................................................................. 30
1.2.12.3. Analysis services ................................................................................................. 31
1.2.13. Los datamart .......................................................................................................... 32
1.2.14. Tecnología OLTP (On-Line Transaction Processing) ........................................... 32
1.2.15. Tecnología OLAP (On-Line Analytical Processing) ............................................. 33
1.2.16. Tipos de sistemas OLAP ....................................................................................... 34
1.2.16.1. ROLAP (Relational OLAP) ................................................................................ 34
1.2.16.2. MOLAP (Multidimensional OLAP) ................................................................... 35
1.2.16.3. HOLAP (Hybrid OLAP) ..................................................................................... 35
1.2.16.4. Otros tipos ........................................................................................................... 35
1.2.17. Diferencias entre un sistema OLTP y OLAP ........................................................ 35
1.2.18. Datawarehouse o almacén de datos ....................................................................... 37
1.2.19. Metodología de diseño del datawarehouse ............................................................ 37
1.2.19.1. Metodología de Bill Inmon ................................................................................. 37
1.2.19.2. Metodología Ralph Kimball ................................................................................ 38
1.2.20. Comparación de Metodologías .............................................................................. 39
1.2.21. Aplicación de la metodología de Kimball ............................................................. 39
1.2.21.1. Planificación ........................................................................................................ 39
1.2.21.2. Análisis de requerimientos .................................................................................. 39
1.2.21.3. Modelado Dimensional ....................................................................................... 40
1.2.21.4. Diseño físico ........................................................................................................ 40
1.2.21.5. Extracción, transformación y carga (ETL) .......................................................... 40
1.2.21.6. Especificación y desarrollo de aplicaciones de BI .............................................. 41
1.2.21.7. Despliegue ........................................................................................................... 41
1.2.21.8. Dashboard (Microsoft Excel) .............................................................................. 41
1.2.22. Características de un datawarehouse ..................................................................... 41
1.2.23. Estructura del datawarehouse ................................................................................ 42
1.2.24. Herramientas para la Implantación del datawarehouse ......................................... 43
1.3. Valoración Crítica .................................................................................................... 44
1.4. Análisis Crítico ........................................................................................................ 44
1.5. Conclusiones parciales del Capítulo ........................................................................ 45
CAPÍTULO II ...................................................................................................................... 46
2. METODOLOGÍA .................................................................................................... 46
2.1. Caracterización del sector ...................................................................................... 46
2.2. Descripción del procedimiento metodológico ....................................................... 47
2.2.1. Modalidad Básica de la Investigación ................................................................... 47
2.3. Tipos de Investigación ........................................................................................... 47
2.4. Población y Muestra .............................................................................................. 48
2.5. Métodos, Técnicas e Instrumentos de Investigación ............................................. 48
2.5.1. Procesamiento de la información........................................................................... 49
2.5.2. Resumen de la Interpretación de Resultados ......................................................... 57
2.6. Conclusiones parciales del Capítulo ........................................................................ 58
CAPÍTULO III ..................................................................................................................... 59
3. MARCO PROPOSITIVO ..................................................................................... 59
3.1. Tema: ..................................................................................................................... 59
3.2. Fundamentación ..................................................................................................... 59
3.3. Objetivos ................................................................................................................ 59
3.3.1. Objetivo general .................................................................................................. 59
3.3.2. Objetivos específicos ........................................................................................... 60
3.4. Descripción de la propuesta ..................................................................................... 60
3.5. Metodología de Desarrollo ....................................................................................... 60
3.5.1. Planificación............................................................................................................. 60
3.5.2. Análisis de Requerimientos ..................................................................................... 62
3.5.2.1. Preparar la entrevista ........................................................................................... 63
3.5.2.2. Proceder con la entrevista.................................................................................... 63
3.5.2.3. Revisar el resultado de la entrevista y analizarlo ................................................ 63
3.5.2.4. Requerimientos Institucionales ........................................................................... 63
3.5.2.5. Requerimientos Humanos ................................................................................... 63
3.5.2.6. Requerimientos Tecnológicos ............................................................................. 64
3.5.2.7. Requerimientos Económicos ............................................................................... 64
3.5.3. Modelado Dimensional ............................................................................................ 65
3.5.3.1. Elección del proceso de negocio............................................................................ 65
3.5.3.2. Dimensiones .......................................................................................................... 65
3.5.3.3. Establecimiento del nivel de granularidad ............................................................. 67
3.5.3.4. Tablas de hechos y medidas .................................................................................. 68
3.5.3.5. Bus matrix .............................................................................................................. 68
3.5.4. Diseño Físico............................................................................................................ 69
3.5.5. Extracción, transformación y carga (ETL). ............................................................. 70
3.5.5.1. Creación de cubos .................................................................................................. 72
3.5.6. Especificación y desarrollo de aplicaciones de BI ................................................... 73
3.5.6.1. Aplicación de cálculos ........................................................................................... 73
3.5.7. Despliegue ................................................................................................................ 74
3.5.8. Dashboard (Microsoft Excel) ................................................................................ 75
3.6. Conclusiones parciales del capítulo ......................................................................... 77
CONCLUSIONES Y RECOMENDACIONES .................................................................. 78
Conclusiones ........................................................................................................................ 78
Recomendaciones ................................................................................................................ 80
BIBLIOGRAFIA
ANEXOS
LISTADO DE TABLAS
Tabla 1.- Estructura Distrito - Latacunga .............................................................................. 9
Tabla 2.- Diferencia entre sistemas OLTP y OLAP ........................................................... 36
Tabla 3.- Personal involucrado ............................................................................................ 48
Tabla 4.- Volumen de datos procesados .............................................................................. 50
Tabla 5.- Frecuencia de ingreso de información .................................................................. 51
Tabla 6.- Nivel de dificultad para elaborar informe ............................................................ 52
Tabla 7.- Demoras y errores en informes ............................................................................ 53
Tabla 8.- Herramienta de optimización ............................................................................... 54
Tabla 9.- Representación de datos ....................................................................................... 55
Tabla 10.- Información para toma de decisiones ................................................................. 56
Tabla 11.- Tecnológicos ...................................................................................................... 64
Tabla 12.- Económicos ........................................................................................................ 64
Tabla 13.- Dimensión DANIOEDUC .................................................................................. 65
Tabla 14.- Dimensión DDOCENTES .................................................................................. 66
Tabla 15.- Dimensión DESTUDIANTES ........................................................................... 66
Tabla 16.- Dimensión DUBICA .......................................................................................... 66
Tabla 17.- Dimensión DPERIODOS ................................................................................... 67
Tabla 18.- Dimensión DMATERIAS .................................................................................. 67
Tabla 19.- Nivel de Granularidad ........................................................................................ 67
Tabla 20.- Tablas de Hechos y medidas FactNotas ............................................................. 68
Tabla 21.- Bus Matrix .......................................................................................................... 69
LISTADO DE FIGURAS
Figura Nº 1.- BI – Inteligencia De Negocios ....................................................................... 14
Figura Nº 2.- Datos – Información– Conocimiento ............................................................. 21
Figura Nº 3.- Capa de Visualización .................................................................................... 25
Figura Nº 4.- Cuadro de Mando Integral (CMI) .................................................................. 26
Figura Nº 5.- Esquema Estrella ............................................................................................ 27
Figura Nº 6.- Esquema Copo de Nieve ................................................................................ 28
Figura Nº 7.- Estructura de un Datawarehouse .................................................................... 43
Figura Nº 8.- Volumen de datos procesados ........................................................................ 50
Figura Nº 9.- Frecuencia de ingreso de información ........................................................... 51
Figura Nº 10.- Nivel de dificultad para elaborar informe .................................................... 52
Figura Nº 11.- Demoras y errores en informes .................................................................... 53
Figura Nº 12.- Herramienta de optimización ....................................................................... 54
Figura Nº 13.- Representación de datos ............................................................................... 55
Figura Nº 14.- Información para toma de decisiones .......................................................... 56
Figura Nº 15.- Diseño Físico ............................................................................................... 69
Figura Nº 16.- Diseño del ETL ............................................................................................ 72
Figura Nº 17.- Creación de Cubos ....................................................................................... 73
Figura Nº 18.- Aplicación de Cálculos ................................................................................ 74
Figura Nº 19.- Despliegue .................................................................................................... 75
Figura Nº 20.- Cuadro de Mando ......................................................................................... 76
RESUMEN EJECUTIVO
En la actualidad las empresas están en constante evolución tecnológica, esto se debe al
sinnúmero de aplicaciones que se pueden obtener de los sistemas informáticos, basado en
este aspecto el presente proyecto se enfoca a proporcionar una herramienta informática
mediante la generación de la información específica con el desarrollo de un
datawarehouse/ business intelligence para el sistema educativo de la ciudad de Latacunga.
Para llevar a cabo el proyecto se realizó una investigación exhaustiva en el distrito
educativo Latacunga, para encontrar la solución a los diferentes inconvenientes,
obteniendo toda la información, cubriendo las necesidades que se requieren y con ello
aportar a la toma de decisiones, simplificar tareas de emisión de informes permitiendo
gestionar otros procesos; implementar la herramienta y asesorar al usuario final,
reduciendo el tiempo de respuesta en cada proceso que se realiza.
En efecto para la consecución del mismo se determinó la aplicación de la metodología de
Ralph Kimball, ya que permite su desarrollo a través de todo el ciclo de vida del
datawarehouse, iniciando desde la planificación hasta su finalización incluyendo el
mantenimiento y su administración.
Se determinó como plataforma de base de datos SQL Server 2008r, para el proceso ETL
Integration Services, para el diseño analítico Analysis Services y para la interfaz mediante
Microsoft Excel, con ello se agiliza el desarrollo de las actividades en un ambiente
gerencial dentro de la institución para una administración eficaz.
ABSTRACT
Nowadays, companies are in constant technological evolution due to the various available
applications that can be obtained from the information systems. Based on this, this project
aims to provide an information tool by generating specific information with the
development of data warehouse business intelligence for the educational system of
Latacunga.
In order to develop this project an exhaustive research was carried out in the education
district of Latacunga in order to find solutions to the different problems, by obtaining all
the information, meeting all the required needs in order to contribute to the right decision
making, simplify tasks of emission of reports allowing, to manage other processes,
implement the tool and advice the final user by reducing the feedback time in each process
that is carried out.
In fact, for the development of the project the application of the methodology by Ralph
Kimball was determined because it allows its development through all the life cycle of the
data warehouse since the planning until the ending, including the maintenance and its
management.
SLQ Database Server 2008r was determined as platform for the ELT Integration Services
process, for the analytic design Analysis Services and for the interface through Microsoft
Excel. Thus, the development of activities is speeded in a management atmosphere inside
the institution for an effective management.
1
INTRODUCCIÓN
ANTECEDENTES DE LA INVESTIGACIÓN
La interpretación de datos en los actuales momentos se ha vuelto una estrategia muy
eficiente para promover un mejor tratamiento de la información en el campo productivo,
especialmente en las empresas públicas y privadas que manejan grandes cantidades de
información, lo que les permite enfocar a un mejor desarrollo organizacional, vista de esta
manera se evidencian entidades altamente competitivas.
Que, el Art. 27 de la Constitución de la República establecen que la educación debe estar
centrada en el ser humano y garantizará su desarrollo holístico, en el marco del respeto a
los derechos humanos, al medio ambiente sustentable y a la democracia; será participativa,
obligatoria, intercultural, democrática, incluyente y diversa, de calidad y calidez, impulsará
la equidad de género, la justicia, la solidaridad y la paz, estimulará el sentido crítico, el arte
y la cultura física, la iniciativa individual y comunitaria; y el desarrollo de competencias y
capacidades para crear y trabajar.
Art. 38.- Sistema Nacional de Evaluación y sus componentes.- El Instituto realizará la
evaluación integral interna y externa del Sistema Nacional de Educación y establecerá los
indicadores de la calidad de la educación que se aplicarán a través de la evaluación
continua de los siguientes componentes: gestión educativa de las autoridades educativas,
desempeño del rendimiento académico de las y los estudiantes, desempeño de los
directivos y docentes, gestión escolar, desempeño institucional, aplicación del currículo,
entre otros, siempre de acuerdo a los estándares de evaluación definidos por la Autoridad
2
Educativa nacional y otros que el Instituto considere técnicamente pertinentes.
(SENPLADES, Sistema Nacional de Información (SNI), 2010)
El registro de la información en la actualidad inicia con la recopilación de datos en muchos
casos manualmente y en otros con herramientas comunes específicamente el utilitario
Microsoft Excel, las mismas que consiste en llenar los registros y documentos que
consecutivamente son guardados en los archivadores para el uso posterior, así cuando lo
requieren se ven en la necesidad de acudir hacia dichos repositorios involucrando de esta
manera una demora en la obtención de la información requerida.
PLANTEAMIENTO DEL PROBLEMA
La interpretación de la información se muestra dificultosa al momento de ser requerido
por las mismas autoridades como los Directores Circuitales, Distritales y Zonales del
Ministerio de Educación, lo cual dicha información al hallarse dispersa e incluso en fuentes
manuales imposibilitan un adecuado tratamiento de los datos.
Actualmente no existe una herramienta informática que permita su manipulación, ya que la
mayor parte del proceso se lleva a cabo manualmente o mediante el uso de hojas
electrónicas básicas, razón por las que no se puede ofrecer dicha información en el
momento requerido. La demora en la obtención de datos, los errores en la información
proporcionada, la falta de un esquema gráfico adecuado para su interpretación no nos
permite tener una definición precisa del procesamiento de datos.
El proceso realizado manualmente provoca la pérdida de tiempo de las personas
3
responsables de emitir la información requerida, generar un informe confiable y evidenciar
los aspectos esenciales que se involucran en un mejor rendimiento de los estudiantes, las
mismas que son requeridas por los organismos antes mencionados.
FORMULACIÓN DEL PROBLEMA
¿Cómo un datawarehouse ayudará a mejorar el tratamiento de la información y la toma de
decisiones en el sistema educativo de la ciudad de Latacunga?
DELIMITACIÓN DEL PROBLEMA
Desarrollo de un Datawarehouse para el tratamiento de la información en el sistema
Educativo de la ciudad de Latacunga, basado en la Tecnología de Business Intelligence.
OBJETO DE INVESTIGACIÓN Y CAMPO DE ACCIÓN
Objeto de Investigación
Gestión de la Información para la toma de Decisiones del actual sistema educativo de la
ciudad de Latacunga.
Campo de acción
Sistemas Informáticos
IDENTIFICACIÓN DE LA LÍNEA DE INVESTIGACIÓN
Tecnologías de la Información y Comunicaciones
4
OBJETIVOS
Objetivo General
Desarrollar un datawarehouse para el tratamiento de la información y la toma de
decisiones en el Sistema Educativo de la ciudad de Latacunga.
Objetivos Específicos
Realizar el estudio del tratamiento de la información actual del sistema educativo de la
ciudad de Latacunga.
Fundamentar el estudio bibliográfico de las aplicaciones informáticas, el proceso y las
herramientas de desarrollo; y el tratamiento de la información.
Diseñar un datawarehouse como una herramienta óptima para la toma de decisiones en
el sistema educativo.
Idea a defender
Con la implementación de un datawarehouse, se mejorará el tratamiento de la información
y con ello la toma de decisiones será más adecuada, ya que las autoridades tendrán más
elementos en base a la información presentada en los reportes.
JUSTIFICACIÓN DEL TEMA
Las instituciones educativas del país y por consiguiente de la ciudad de Latacunga, son el
pilar fundamental de la educación en todos sus niveles, es precisamente por ello que son
clasificadas y evaluadas no únicamente por la calidad de su infraestructura o servicios, sino
también por el grado en el que manejan, procesan y comparten la información con los entes
involucrados.
5
El distrito educativo Latacunga, no dispone de una herramienta que facilite la toma de
decisiones ni el acceso a reportes de forma inmediata, dando lugar a la generación de
información errónea, no tanto por las deficiencias administrativas, sino más bien por la
falta de datos oportunos al momento que se requiera procesarlos.
Es por ello que la metodología de business intelligence, permitirá unificar todos los
sistemas de la institución para obtener no solo la información, sino también el desarrollo de
una infalible inteligencia de negocio, siendo esta una ventaja significativa sobre los
principales competidores, de ahí que se tiene previsto como meta obtener resultados
beneficiosos, tales como:
Crear escenarios y mejorar la estructura de toma de decisiones.
Generar información entendible por el usuario.
La Investigación promoverá la colaboración e interés del personal involucrado, de ahí la
importancia para la institución ya que será de mucha utilidad con la implementación de
esta herramienta. Además cabe resaltar que las áreas mencionados seguirán aportando con
su labor y trabajando de manera más eficiente ya que se agilita el trabajo al momento de
tomar decisiones con la utilización de la información generada por la herramienta de
business intelligence, enfocadas a un mejor desarrollo del sistema académico.
6
CAPÍTULO I
1. MARCO TEÓRICO
1.1. Marco Referencial
1.1.1. Introducción
A través de los años el mundo ha dado grandes cambios en el campo tecnológico y
educativo, haciendo que todo el trabajo que realizaban varias personas hoy la realiza una
sola persona con la ayuda de la computadora, es decir que la tecnología está tomando una
parte muy significativa en la educación y en otras ciencias, modificando y aportando a la
calidad de vida de los individuos.
Considerando que dichos avances científicos y tecnológicos en la actualidad suceden a
pasos acelerados, la educación de nivel medio debe crecer y desarrollarse a la par de esta,
buscando para ello herramientas que faciliten la toma de decisiones en el desarrollo de sus
procesos tanto inicial como terminal, y así también en la interpretación de los datos que
estas generan.
Basado en las múltiples ventajas que ofrece la informática y las ciencias computacionales
ya que forman parte de la cotidianidad de estas instituciones, como futuro profesional en
este campo se propone diseñar un datawarehouse, estructurado de una manera sólida que
permita llevar a cabo algunas funciones que se requieren dentro de la resolución de los
procesos.
Así, dentro de las instituciones inmersas en la regulación de la Educación Media se conoce
que una de las principales herramientas que aporta a mantener al día las exigencias de los
7
avances tecnológicos, es la automatización de las actividades administrativas y de currículo,
que permita una mejor interpretación de la información, mismos que cumplan con el
objetivo de agilizar, facilitar y modernizar, los procesos para la toma de decisión en las
áreas administrativas, promoviendo de esta manera la eficacia y la eficiencia en todas sus
actividades.
1.1.2. Origen del sistema educativo Latacunga
El actual gobierno desde inicios de su mandato ha venido realizando muchos cambios en
los diferentes aspectos todos ellos encaminados a alcanzar el Buen Vivir y que permita
garantizar la distribución y provisión de bienes y servicios públicos de calidad para la
ciudadanía. Por ello ha promovido la desconcentración del Estado que es coordinado por la
Secretaría Nacional de Planificación y Desarrollo, SENPLADES e implementado a nivel
nacional por los diferentes ministerios y secretarías (SENPLADES, Sistema Nacional de
Información (SNI), 2010).
Por muchos años los recursos que el Estado debía entregar a las familias ecuatorianas solo
llegaban a unos pocos, por lo que muchas personas no podían acceder a los servicios de
salud, educación, vivienda, policía, agua, energía eléctrica, entre otros. Ante ello el
Gobierno Nacional decidió buscar una manera para distribuir mejor los servicios a la
población. La estrategia ha sido entonces promover la descentralización y
desconcentración del Estado.
La desconcentración permite trasladar los servicios que ofrece una entidad nacional
(ministerio) hacia sus dependencias: zonal, provincial, distrital o circuital. La entidad
8
nacional es quien controla y asegura la calidad y cumplimiento de servicios. Así el
Ministerio de Educación asegura el acceso a las escuelas a través de los circuitos
educativos (SENPLADES, 2010).
En conclusión la descentralización y desconcentración permite que los recursos
económicos, responsabilidades, servicios y sus beneficios, no se concentren en ciertos
lugares, sino se administre de manera más equitativa y responsable, en todo el país.
1.1.3. Niveles administrativos de planificación
Es necesario reconocer que las zonas están formadas por provincias de acuerdo a una
proximidad geográfica, cultural y económica. Tenemos 9 zonas de planificación cada una
formada por los distritos y estos por circuitos (la provincia de Cotopaxi pertenece a la
Zona 3, conjuntamente con las provincias: Tungurahua, Chimborazo y Pastaza). Desde
aquí se coordina estratégicamente las entidades del sector público, a través de la gestión de
la planificación para el diseño de políticas en su jurisdicción (Benítez, 2012).
El distrito es la unidad de planificación y prestación de servicios públicos, coincide con el
cantón o unión de cantones. Se han establecido 140 distritos. Cada distrito con alrededor de
90.000 habitantes. En cantones como Quito, Guayaquil, Cuenca, Ambato y Santo Domingo
de los Tsáchilas, donde su población es muy alta, se establecen distritos dentro de ellos, en
mi caso es el Distrito Latacunga – 05D01.
En el circuito están el conjunto de servicios públicos al alcance de la ciudadanía
conformada por establecimientos inmersos para su uso. Comprende en una parroquia o
9
conjunto de parroquias 1.134 circuitos con alrededor de 11.000 habitantes (SENPLADES,
2010).
Tabla 1.- Estructura Distrito - Latacunga
ESTRUCTURA – DISTRITO LATACUNGA
COD.
DISTRITO
NOMBRE
DISTRITO
No.
CIRCUITOS
COD.
CIRCUITO
NOMBRE CIRCUITO
05D01 Latacunga 18
05D01C01 Toacazo
05D01C02 Mulalo
05D01C03 Lasso
05D01C04 Joseguango
05D01C05 Poalo
05D01C06 San Jose
05D01C07 Eloy Alfaro
05D01C08 Bethlemitas
05D01C09 San Carlos
05D01C10 San Martin
05D01C11 La cocha
05D01C12 La calera
05D01C13 El chofer
05D01C14 Terminal terrestre
05D01C15 Nueva vida
05D01C16 Belisario Quevedo
10
05D01C17 Pastocalle
05D01C18 Guaytacama
Las zonas, los distritos y los circuitos son niveles desconcentrados para la administración y
planificación de los servicios públicos de algunos ministerios de la Función Ejecutiva.
Fueron conformados respetando la división político – administrativo, que corresponde a
una nueva organización del territorio y no a un nuevo nivel de gobierno. Es decir los
niveles de gobierno mantienen autonomía y gobernabilidad a nivel de provincia, cantón y
parroquia. Las entidades que actualmente están organizando sus servicios a nivel distrital
son (SENPLADES, 2012):
Ministerio Interior (Policía Nacional)
Ministerio de Educación
Ministerio de Justicia, DDHH y Cultos
Ministerio de Salud Pública
Secretaría de Gestión de Riesgos (Bomberos, Brigadas Comunitarias)
Ministerio de Inclusión Económica y Social
1.1.4. Beneficios de las zonas, distritos y circuitos
Con los niveles administrativos de planificación, el Estado está más cerca a la ciudadanía
garantizando equidad territorial pues los servicios y su administración se planificará desde
el territorio, acorde a las demandas de la ciudadanía para alcanzar estándares de calidad de
vida y de esta manera lograr el Buen Vivir (Benítez, 2012).
11
1.1.5. Códigos de identificación de los distritos y circuitos
Los distritos están formados por uno o varios cantones y para poder distinguir se les han
asignado un código para identificarlos. Los códigos distritales tienen 4 dígitos y una letra y
están estructurados de la siguiente manera: el código provincial (2 dígitos, que
corresponden a los dos primeros números de la cédula) + la letra D de distrito + el número
correspondiente al distrito dentro de la provincia (2 dígitos).
Los códigos circuitales tienen seis dígitos y dos letras, están conformados por: el código
provincial (2 dígitos, que corresponden a los dos primeros números de la cédula) + la letra
D de distrito + el número correspondiente al distrito dentro de la provincia (2 dígitos) + la
letra C de circuitos + el número correspondiente al circuito dentro del distrito (2 dígitos)
(SENPLADES, 2012).
1.1.6. Disposiciones Generales
Primera.-
Para efectos del presente acuerdo se considerarán las siguientes definiciones: Distrito
administrativo de planificación: Unidad territorial para la prestación de servicios públicos
que coincide con el cantón o unión de cantones y articula las políticas de desarrollo del
territorio dentro del cual se coordinará la provisión de servicios para el ejercicio de
derechos y garantías ciudadanas.
Segunda.-
Los 140 distritos administrativos y los 1134 circuitos administrativos serán ajustados
conforme con los resultados oficiales de los censos de población y vivienda que se realicen
12
en el país.
Disposición Final.-
De la ejecución del presente acuerdo que entrará en vigencia a partir de su publicación en
el Registro Oficial encárguese a todas las entidades y organismos de la función ejecutiva
de acuerdo al nivel de desconcentración establecido en su respectiva matriz de
competencias, modelo de gestión y estatuto orgánico (Benítez, 2012).
1.2. Business intelligence – Inteligencia de negocios
Los denominan inteligencia empresarial, inteligencia de negocios o BI (Business
Intelligence), al conjunto de estrategias y aspectos relevantes enfocados a la administración
y creación de conocimiento sobre el medio, a través del análisis de los datos existentes en
una organización o empresa (ROHRBECK, 2008).
Las herramientas de inteligencia se basan en el uso de un sistema de información de
inteligencia mediante herramientas y técnicas ETL (extraer, transformar y cargar) se
extraen los datos de distintas fuentes, se depuran y preparan (homogeneización de los datos)
para luego cargarlos en un almacén de datos.
De ahí que se puede exponer la siguiente definición de inteligencia de negocios:
Es el proceso mediante el cual las organizaciones segmentan, unifican, jerarquizan y
definen contextos sobre la información, con la finalidad de identificar la información más
relevante y representativa para la organización (IBARRA, 2009).
13
La inteligencia de negocio actúa como un factor estratégico para una empresa u
organización, generando ventajas competitivas que consiste en proporcionar información
privilegiada para responder a los problemas de negocio: entrada a nuevos mercados,
promociones u ofertas de sus productos, eliminación de las islas de información, control
financiero, optimización de costos, planificación de la producción, análisis de perfiles de
clientes, rentabilidad de un producto concreto, etc.
1.2.1. Historia de la inteligencia de negocios
El término de business intelligence para escribir la capacidad de una organización para
acceder y explotar la información residente en una base de datos de manera que los
usuarios puedan analizar esa información, desarrollar y adquirir con base en teorías y
conocimientos que apoyen la toma de decisiones del negocio.
A medida que transcurría el tiempo fue mejorando el crecimiento y desarrollo de los
Sistemas de Información Ejecutiva y que en nuestros días dada la alta competitividad se
hacen muy fundamentales para el desarrollo y crecimiento económico de las
organizaciones en sus diferentes actividades productivas, la misma que está estrechamente
ligadas a las áreas ejecutivas, administrativas y gerenciales, lo cual se aplica eficientemente
la teoría de Inteligencia de Negocios (SÁNCHEZ MONTOYA, 2006).
En la figura que se expone se representa la evolución histórica del business intelligence
(Inteligencia de Negocios), así también la evolución de las aplicaciones orientadas a la
toma de decisiones empresariales.
14
Figura Nº 1.- BI – Inteligencia De Negocios
Fuente: Business intelligence
1.2.2. Características de Business intelligence
Accesibilidad a la información. Los datos son la fuente principal, lo primero que
deben garantizar este tipo de herramientas y técnicas es el acceso de los usuarios a los
datos con independencia.
Apoyo en la toma de decisiones. Se busca ir más allá en la presentación de la
información, de modo que los usuarios tengan acceso a herramientas de análisis que les
permitan seleccionar y manipular sólo los datos que lo requieran.
15
Orientación al usuario final. Se busca la independencia entre los conocimientos
técnicos de sus usuarios y la capacidad para usar estas herramientas.
1.2.3. Ventajas de inteligencia de negocios
Permite mejorar la eficiencia operativa al organizar la información mediante el uso de
esta herramienta lo cual se disminuye el tiempo de procesamiento y obtención de
resultados de las bases de datos, pues esta nos da la oportunidad de tener organizados
en una sola base tomando en consideración sus diferentes áreas para extraer los datos
más significativos.
Los usuarios finales no precisan de conocimientos técnicos para generar nuevos
informes, tampoco es necesario contar con el departamento técnico informático para la
resolución de consultas que la institución lo requiere en el momento indicado y con los
datos que actualmente se está procesando con el datawarehouse.
Disminuye notablemente el tiempo de respuesta en las consultas de los datos de difícil
resolución, lo cual se basa en la unificación de consultas de diferentes tablas con gran
tamaño en el volumen de datos almacenados previamente que se evidencia en su flujo
(IBARRA, 2009).
1.2.4. Desventajas de inteligencia de negocios
Puede provocar la saturación del datawarehouse ya que los datos crecen de manera
desproporcionada pues no existe técnica para limitar la excesiva demanda de usuarios.
16
La realización de la extracción, transformación y carga cuando los datos de origen no
están depurados, lo cual puede ocasionar la duplicación de los mismos, puede haber
datos erróneos, lo que influye en su costo por su gran tamaño y muy bajo rendimiento
(IBARRA, 2009).
1.2.5. Niveles de realización de BI
De acuerdo a su nivel de complejidad se pueden clasificar las soluciones de business
intelligence en:
1.2.5.1.1. Informes
Informes predefinidos
Informes a la medida
Consultas (Query) / Cubos OLAP (On-Line Analytic Processing).
Alertas
1.2.5.1.2. Análisis
Análisis estadístico
Pronósticos (Forecasting)
Modelado predictivo o minería de datos (Data mining)
Optimización
Minería de procesos
1.2.6. Sistemas de Información
"Un sistema de información. Es un sistema hombre/ maquina integrado que provee
17
información para el apoyo de las funciones de operación, gerencia y toma de decisiones en
una organización". A esta definición es conveniente agregar lo siguiente "El concepto de
sistema/hombre/máquina implica que algunas tareas la realiza mejor el hombre, mientras
que otra las hace mejor la máquina. Un sistema integrado está basado en el concepto de
que haber integración de datos y procesamiento. La integración de datos es ejecutada por la
base de datos mientras que el procesamiento integrado es ejecutado por un plan general del
sistema" (KROENKE David M., 2009).
Un sistema de información es un conjunto de elementos orientados al tratamiento y
administración de datos e información, organizados y listos para su uso posterior,
generados para cubrir una necesidad o un objetivo. Dichos elementos formarán parte de
alguna de las siguientes categorías:
Personas;
Datos;
Actividades o técnicas de trabajo;
Recursos materiales (generalmente recursos informáticos y de comunicación, aunque
no necesariamente).
Todos estos elementos interactúan para procesar los datos (incluidos los procesos manuales
y automáticos) y dan lugar a información más elaborada, que se distribuye de la manera
más adecuada posible en una determinada organización, en función de sus objetivos
(LAUDON, 2006).
18
1.2.6.1. Funciones de un sistema de información
Los sistemas de información difieren en sus tipos de entradas y salidas, en el tipo de
procesamientos y en su estructura. Estos elementos están determinados por el propósito u
objetivos del sistema, el cual es establecido por la organización, en todos ellos podemos
encontrar las siguientes funciones (LAUDON, 2006):
1.2.6.1.1. Procesamiento de transacciones
Consiste en capturar o recolectar, clasificar, ordenar, calcular, resumir y almacenar los
datos originados por las transacciones, que tienen lugar durante la realización de
actividades en la organización.
1.2.6.1.2. Definición de archivos
Consiste en almacenar los datos capturados por el procesamiento de transacciones, de
acuerdo a una estructura u organización de almacenamiento adecuado (base de datos o
archivo) un método que facilite su almacenamiento, actualización y acceso; y un
dispositivo apropiado de almacenamiento (disco, cintas, diskettes, y otros).
1.2.6.1.3. Mantenimiento de archivos
Los archivos o bases de datos del sistema deben mantener actualizados. Las operaciones
básicas de mantenimiento son la inserción, la modificación y la eliminación de datos en los
medios de almacenamiento.
1.2.6.1.4. Generación de reportes
La realización de esta función es esencial para el sistema de información, ella se encarga
de producir la información requerida y trasmitirla a los puntos o centros de información
19
que la soliciten. Esta transmisión de información se puede efectuar mediante el
movimiento físico de los elementos de almacenamiento (papel, cintas magnéticas,
diskettes, y otros) o mediante la comunicación de señales eléctricas digitales o analógicas a
dispositivos receptores (terminales, convertidores, estaciones remotas u otro computador).
1.2.6.1.5. Procesamientos de consultas
Parte de la información requerida por los usuarios que responde a las interrogantes no
predefinidas y sus respuestas generalmente son cortas por lo que no es necesario un
formato complejo como los reportes. La mayoría de manejadores de base de datos poseen
una herramienta que facilita la realización de esta función, denominado lenguaje de
consultas o lenguaje para el diálogo hombre – máquina.
1.2.6.1.6. Mantenimiento e integridad de datos
Estos datos mantenidos por los sistemas de información serán confiables y veraces pues
una de sus funciones es garantizar la integridad de sus datos y protegerlos contra accesos y
modificaciones indebidas o sin autorización (LAUDON, 2006).
1.2.6.2. Sistemas de soporte a decisiones
1.2.6.2.1. Sistemas de información gerencial (MIS).- (Management Information
Systems).
Llamados también Sistemas de Información Administrativa (AIS) son los que dan soporte
a un espectro más amplio de tareas organizacionales, hallándose a medio camino un DSS
tradicional y una aplicación CRM/ERP implantada en la misma organización (LAUDON,
2006).
20
1.2.6.2.2. Sistemas de información ejecutiva (EIS).- (Executive Information
System)
Es el tipo de DSS que se emplea en business intelligence, pues que provee a los gerentes el
acceso a la información tanto interna como externa de su compañía y es relevante para los
factores claves de éxito. La finalidad principal es que el ejecutivo tenga un panorama claro
del estado de los indicadores del negocio que afectan al instante, manteniendo también la
posibilidad de analizar a detalle aquellos que no cumplan con las expectativas establecidas,
para determinar el plan de acción más adecuado
Un EIS es una aplicación informática que muestra informes y listados consolidados de las
diferentes áreas de negocio, con ello facilitar la monitorización de la empresa, ofrece a los
ejecutivos un acceso rápido y efectivo a la información compartida, utilizando interfaces
gráficas visuales e intuitivas.
Además puede incluir alertas e informes basados en excepción, así como históricos y
análisis de tendencias. También es frecuente que permita la domiciliación por correo de los
informes más relevantes (LAUDON, 2006).
1.2.6.2.3. Sistemas expertos basados en inteligencia artificial (SSEE)
También llamados sistemas de conocimiento, utiliza red neuronal para simular el
conocimiento (inteligente) del experto de forma efectiva para resolver problemas concretos
que está muy relacionado con el Datamining.
21
1.2.6.2.4. Sistemas de apoyo a decisión del grupo (GDSS).- (Group Decision
Support Systems)
Es un sistema basado en computadores que apoya a personas y grupos de personas que
tienen una tarea (objetivo) común, y sirve como interfaz con un entorno compartido. En el
GDSS si se mejora la comunicación se pueden mejorar la decisión.
1.2.7. Datos, información, conocimiento
En una conversación informal, los tres términos se pueden utilizar de forma indistinta lo
que puede conllevar a una interpretación libre del conocimiento. La forma más adecuada
de diferenciar los términos es que los datos están localizados en el mundo, el conocimiento
se localiza en los agentes de cualquier tipo (personas, empresas, máquinas), mientras que la
información constituye un vínculo mediador entre ambos.
Figura Nº 2.- Datos – Información– Conocimiento
Fuente: Sistemas de información gerencial
1.2.7.1. Datos.
Son considerados como la unidad semántica mínima y se componen de elementos
primarios de información que por sí solos no constituyen un apoyo a la toma de decisiones.
22
También se puede considerar como un conjunto de valores que no influyen sobre el porqué
de las cosas y no son promueven la acción.
Así como por ejemplo un número telefónico, el nombre de una persona, son datos que sin
un propósito, una utilidad o un contexto no aportan como base para la toma de decisiones.
Los datos pueden estar almacenados en algún lugar físico como papel, un dispositivo
electrónico (CD, DVD, disco duro). En este sentido las tecnologías de la información y
comunicación han aportado en la recopilación de datos.
Sabemos que los datos pueden provenir de fuentes tanto externas como internas de la
organización y pueden ser de carácter objetivo o subjetivo, o tipo cualitativo o cuantitativo,
etc (LAUDON, 2006).
1.2.7.2. Información.
Es un conjunto de datos procesados que tienen un significado (relevancia, propósito y
contexto), por lo tanto son de utilidad para quienes deben tomar las decisiones al disminuir
su incertidumbre. Así los datos pueden transformarse en información añadiendo valor, así:
Contextualizando: Saber en qué contexto y con qué propósito se generó.
Categorizando: Identificando las unidades de medida que ayudan a interpretar.
Calculando: Mediante el procesamiento de datos matemática o estadísticamente.
Corrigiendo: Eliminando errores e inconsistencias de los datos.
Condensando: Resumiendo datos de forma más concisa (agregación).
23
Por lo tanto la información es la comunicación del conocimiento o la inteligencia y que es
capaz de cambiar la percepción del receptor, impactando sobre sus juicios de valor y
comportamientos (LAUDON, 2006).
1.2.7.3. Conocimiento.
Se dice que el conocimiento es una mezcla de experiencias, valores, información que sirve
como marco para incorporar nuevas experiencias y es útil para la acción. Es originada y se
aplica en la mente de los conocedores. En ciertas organizaciones no sólo se encuentra en
los documentos o almacén de datos, sino también en rutinas organizativas, procesos,
prácticas y normas (LAUDON, 2006).
De esta manera el conocimiento se deriva de la información, así como la información es
derivada de los datos. Para que la información se convierta en conocimiento se hace
necesario realizar acciones tales como:
Comparación con otros elementos.
Predicción de consecuencias.
Búsqueda de conexiones.
Conversación con otros portadores de conocimiento.
1.2.8. Arquitectura de solución de la inteligencia de negocios.
1.2.8.1. Capa de integración
Se extrae los datos de la base de datos operacionales y se seleccionan los campos
Información= Datos + Contexto (añadir valor) + Utilidad (disminuir incertidumbre)
24
necesarios conforme al modelo de datos, posteriormente se pasa por el proceso ETL donde
se limpian y estandarizan, eliminando de esta manera la inconsistencia y posibles errores
que pudieran llegar a existir quedando de esta manera almacenados en las tablas e
implantado en los datamart (SÁNCHEZ MONTOYA, 2006).
1.2.8.2. Capa de análisis
Esta capa comprende la técnica OLAP y algoritmos de data mining de ser el caso, pero en
este proyecto no se aplica la técnica del data mining. El motor OLAP se encarga de mapear
las consultas en lenguaje MDX a sentencias SQL, lo cual son ejecutadas en la base de
datos relacional donde reside el datamart y la información resultante es regresada al motor
OLAP la que se encarga de enviar a la capa de visualización (SÁNCHEZ MONTOYA,
2006).
1.2.8.3. Capa de visualización
En esta capa se muestra los resultados obtenidos de la aplicación, los mismos que pueden
visualizarse a través de textos, tablas y gráficos. Esta variedad facilita la comprensión e
interpretación de los mismos que facilita al usuario final la manipulación de esta
información y analizarla.
Esta arquitectura permite intercambiar las herramientas en el caso de que fuere necesario
aislar entradas y salidas bien definidas tratando de crear un flujo de información donde se
pueda localizar fácilmente cada etapa y buscar otros puntos de mejora (SÁNCHEZ
MONTOYA, 2006).
25
Fuente: Business intelligence
1.2.9. Cuadro de Mando Integral o Dashboard
El cuadro de mando integral (CMI), también conocido como balanced scorecard (BSC) o
dashboard ejecutivos, es una herramienta de control empresarial que permite establecer y
monitorizar los objetivos de una empresa y de sus diferentes áreas o unidades, es decir son
resúmenes visuales de información del negocio, que muestran de una mirada la
comprensión del global de las condiciones del negocio mediante métricas e Indicadores
Clave de Desempeño (KPIs). Esta es una Herramienta de Inteligencia de Negocios.
DW – Sistema Educativo Latacunga
Capa de
visualización
Capa de
Análisis
Capa de
Integración
BD
DW Integration Services
ETL
Analysis Services
OLAP
Analysis Services
DW
Reporting Services
Figura Nº 3.- Capa de Visualización
26
También se puede considerar como una aplicación que ayuda a una compañía a expresar
los objetivos e iniciativas necesarias para cumplir con su estrategia, mostrando de forma
continuada cuándo la empresa y los empleados alcanzan los resultados definidos en su plan
estratégico (SÁNCHEZ MONTOYA, 2006).
Figura Nº 4.- Cuadro de Mando Integral (CMI)
Fuente: Business intelligence
1.2.10. Esquemas multidimensionales
Estas son las bases de datos diseñadas precisamente para desarrollar las aplicaciones
concretas como la creación de los cubos OLAP (Procesamiento analítico en línea), cuya
diferencia con la base de datos relacional es que en la base de datos multidimensional los
atributos pueden ser las dimensiones o las métricas cuyos aspectos a considerar son:
Velocidad de acceso y sus consultas.
Capacidad de análisis desde varios puntos de vista (dimensiones) (SÁNCHEZ
MONTOYA, 2006).
27
1.2.10.1. Esquema estrella
Se puede señalar que un esquema en estrella es un modelo de datos que tiene una tabla de
hechos (o fact-table) que contiene los datos para el análisis, rodeada de las tablas de
dimensiones, así las tablas de dimensiones tendrán siempre una clave primaria simple,
mientras que en la tabla de hechos, la clave principal estará compuesta por las claves
principales de las tablas dimensionales (SÁNCHEZ MONTOYA, 2006).
Figura Nº 5.- Esquema Estrella
Fuente: Business intelligence
1.2.10.2. Esquema Copo de Nieve
Un esquema copo de nieve es una estructura compleja, se origina cuando alguna dimensión
implementa con más de una tabla de datos. La finalidad es normalizar las tablas y reducir
el espacio de almacenamiento al eliminar la redundancia de datos; pero tiene la
28
contrapartida de generar peores rendimientos al tener que crear tablas de dimensiones y
relaciones entre las tablas (JOINS) que tiene un impacto sobre el rendimiento (SÁNCHEZ
MONTOYA, 2006).
Figura Nº 6.- Esquema Copo de Nieve
Fuente: Business intelligence
1.2.11. Base de Datos
Es un conjunto de datos que pertenecen al mismo contexto almacenados sistemáticamente
en la memoria de una computadora, diseñado para facilitar su mantenimiento y acceso de
una forma estándar. La información se organiza en campos y registros. Un campo se
refiere a un tipo o atributo de información y un registro a toda la información utilizados
posteriormente.
29
Los datos pueden aparecer en forma de texto, números, gráficos, sonido o vídeo. Las bases
de datos presentan la posibilidad de consultar datos, bien los de un registro o los de una
serie de registros que cumplan una condición. Para facilitar la introducción de los datos en
la base se suelen utilizar formularios; también se pueden elaborar e imprimir informes
sobre los datos almacenados.
Los sistemas gestores de bases de datos (SGBD), permiten almacenar y posteriormente
acceder a los datos de forma rápida y estructurada, además gracias a la tecnología
proveniente de la informática y la electrónica, las bases de datos puede ofrecer un amplio
rango de almacenamiento de datos (BERTINO, 1995).
Las aplicaciones más usuales son para la gestión de empresas e instituciones públicas.
También son ampliamente utilizadas en entornos científicos con el objeto de almacenar la
información experimental.
El SGBD, es el conjunto de programas, procedimientos y lenguajes que proporcionan las
herramientas necesarias para trabajar con una base de datos e incorporan una serie de
funciones que nos permite definir los registros, campos, relaciones, así también insertar,
suprimir, modificar y consultar los datos.
Existen grandes motores de bases de datos: DB2 de IBM, Informix, Oracle, PostgreSQL,
SAP, Teradata, MySQL, SQL Server de Microsoft entre otros, cada uno con sus
respectivas características y requerimientos específicos (PETKOVIĆ, 2005).
30
1.2.12. Microsoft SQL Server
Microsoft SQL Server 2008r, exponen que: El lenguaje SQL está compuesto por una serie
de sentencias y de cláusulas muy reducidas en número, pero muy potentes en efectividad.
De entre todas las palabras, existen cuatro que son las más utilizadas, estando compuestas
por una sentencia y por tres cláusulas (PETKOVIĆ, 2005).
1.2.12.1. Motor de bases de datos
Estas bases de datos son las que almacenan la información en forma de tablas de dos
dimensiones enlazadas por uniones (joints), entre dichas tablas, lo cual establecen los
siguientes aspectos:
Son las encargadas de realizar la depuración y homogenización de los datos.
Del almacenaje de los datos tomando en consideración del máximo detalle y
recopilando los datos históricos y los actuales.
Si fuera necesario también puede utilizar un motor de cálculo para un mejor
tratamiento de los datos (PETKOVIĆ, 2005).
1.2.12.2. Integration services (SSIS)
Es una herramienta que nos permite extraer, transformar y cargar; se refieren a los datos en
una empresa. El ETL es el proceso que organiza el flujo de datos entre los diferentes
sistemas en una organización y aporta los métodos y las herramientas necesarias para
mover datos desde las múltiples fuentes a un almacén de datos, reformatearlos, limpiarlos
y cargarlos en otra base de datos, los datamart o bodega de datos. El ETL forma parte de la
Inteligencia Empresarial (Business Intelligence), también llamado “Gestión de los datos”
(Data management).
31
Las herramientas más populares y aplicaciones ETL del mercado:
IBM websphere data stage (anteriormente ascential data stage y ardent data stage)
Pentaho data integration (Kettle ETL) – Una herramienta open source business
intelligence
ETL studio
Oracle warehouse builder
Informática power center
Cognos decision stream
Business objects data integrator (bodi)
Microsoft SQL server integration services (SSIS)
Además se considera que ocupa entre el 60 y 80% del tiempo asignado en la inteligencia
de negocios, para lo cual se divide en 5 subprocesos:
Extracción.- Es la recuperación física de datos desde su fuente.
Limpieza.- Se extrae la información precisa eliminando los duplicados, corrigiendo los
datos erróneos y agregando datos necesarios.
Transformación.- Permite la obtención de datos de calidad y aplicados todos los cambios
necesarios.
Integración.- Establece los formatos de presentación, tiene un nivel de complejidad.
Actualización.- Nos permite agregar nuevos datos al datawarehouse (ROHRBECK, 2008).
1.2.12.3. Analysis services
Microsoft SQL Server 2008 Analysis services (SSAS) ofrece funciones de procesamiento
32
analítico en línea (OLAP) y minería de datos para aplicaciones de business intelligence.
Analysis services admite OLAP y permite diseñar, crear y administrar estructuras
multidimensionales que contienen datos agregados desde diferentes orígenes, como bases
de datos relacionales, vistas de origen de datos, cubos, medidas, grupos de medida,
dimensiones, atributos, jerarquías, estructuras de minería de datos, modelos de minería de
datos y funciones (RANKINS Ray, 2010).
1.2.13. Los datamart
Se tratan netamente de las bases de datos departamentales, lo que significa que almacena
exclusivamente información del departamento o área exclusiva, es por ello que disponen
de una estructura óptima para el análisis adecuado de la información, un datamart puede
trabajar con los datos de un datawarehouse y a su vez también se entiende que la
agrupación de los datamarts pueden generar un datawarehouse (KROENKE David M.,
2009).
1.2.14. Tecnología OLTP (On-Line Transaction Processing)
Los sistemas de procesamiento transaccional en línea son los que captura las transacciones
de los procesos empresariales, por lo tanto son responsables del mantenimiento de los
datos mediante la agregación, actualización o eliminación, mediante la validación de las
entradas o su rechazo si no cumplen las reglas establecidas. Estos sistemas pueden ser
empleados en:
Los sistemas bancarios.
Proceso de pedidos
Comercio electrónico
33
Sistemas de facturación
Sistemas de stock, entre otros.
Dentro de las características de la tecnología OLTP tenemos:
Realizar la transacción en tiempo real de los procesos de un negocio.
Son los adecuados para realizar el mantenimiento de los datos (ingresos,
actualizaciones, eliminaciones).
Para su uso los datos deben estar depurados, es decir analiza la información obtenida y
si no cumple lo requerido se lo rechaza (IBARRA, 2009).
1.2.15. Tecnología OLAP (On-Line Analytical Processing)
La tecnología de procesamiento analítico en línea, ofrece una alternativa de transacción
analítica rápida y flexible de los datos, así los cubos OLAP almacenan varios niveles de
datos conformados por la estructura que responde a las exigencias del negocio inclusive de
datos complejos, además permite que los usuarios finales puedan cambiar fácilmente entre
las filas, las columnas y las páginas pudiendo presentar los informes de una manera más
adecuada para su entendimiento (IBARRA, 2009).
OLAP, es el procesamiento analítico en línea es una solución utilizada en Inteligencia de
Negocios (Business Intelligence) y su objetivo es agilitar la consulta de grandes volúmenes
de datos. Por ello utilizan estructuras multidimensionales (Cubos OLAP) que contienen los
datos que son resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP).
Se utiliza en los informes de negocios de ventas, el marketing, los informes de dirección, la
minería de datos y las áreas similares.
34
OLAP ofrece consultas con mayor rapidez de respuesta. Una base de datos relacional
almacena a las entidades en las tablas discretas si son normalizados. La estructura es buena
en el sistema OLTP pero para las consultas con multitablas es relativamente lenta. Un
modelo mejor para búsquedas (aunque no recomendable en el plano operativo) es la base
de datos multidimensional (IBARRA, 2009).
Dentro de las características de la tecnología OLAP tenemos:
La rapidez de ejecutar instrucciones SQL de tipo select, en comparación con OLTP ya
que esta se centra en operaciones de tipo insert, update y delete.
Tiene un esquema para responder las preguntas del usuario en forma rápida.
Los cubos tienen varios niveles de datos con estructuras que cumplen las expectativas
del negocio generando reportes complejos de una manera fácil.
Se pueden alternar entre filas y columnas logrando visualizar un informe adecuado
para su análisis.
1.2.16. Tipos de sistemas OLAP
1.2.16.1. ROLAP (Relational OLAP)
Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los
datos son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas
Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque
es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta
por un servidor de base de datos relacional y el motor OLAP se encuentra en un servidor
dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme
35
cantidad de datos (IBARRA, 2009).
1.2.16.2. MOLAP (Multidimensional OLAP)
Esta implementación OLAP almacena los datos en una base de datos multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la información es usualmente
calculado por adelantado. Algunos sistemas utilizan técnicas de compresión de datos para
reducir el tamaño de almacenamiento en el disco ya que los valores son pre calculados
(IBARRA, 2009).
1.2.16.3. HOLAP (Hybrid OLAP)
Almacena los datos en un motor relacional y otros en base de datos multidimensional.
HOLAP (OLAP Híbrido) es la que engloba un conjunto de técnicas que tratan de combinar
MOLAP y ROLAP de una mejor forma más adecuada. Generalmente puede pre-procesar
rápidamente y proporciona una muy buena función de apoyo (IBARRA, 2009).
1.2.16.4. Otros tipos
WOLAP o Web OLAP: OLAP orientado a la web.
DOLAP o Desktop OLAP: OLAP de escritorio
RTOLAP o Real Time OLAP: OLAP en tiempo real
SOLAP o Spatial OLAP: OLAP espacial
1.2.17. Diferencias entre un sistema OLTP y OLAP
Las características que diferencian a los sistemas OLTP y OLAP se muestran a
continuación con su respectiva explicación:
36
Tabla 2.- Diferencia entre sistemas OLTP y OLAP
Sistemas OLTP Sistemas OLAP
Objetivo
Garantizar la consistencia de los
datos.
Consolidar los datos ya validados y
adecuados a las necesidades para la
toma de decisiones.
Orientación Orientado a la aplicación, hace
cumplir las reglas del negocio.
Orientado al sujeto, se define en
base a lo que el analista necesita
ver.
Vigencia de
los datos
Los datos se usan a medida que se
van produciendo y dejan de ser
importantes a corto plazo.
Se guardan los datos actuales y los
históricos para poder realizar
análisis comparativos.
Granularidad
de datos
Es dada por controles definidos
por la organización, así como por
normas legales importantes.
Estará dado por el tipo de análisis
que se requiera analizar.
Organización
Es normalizado.
Se basa en estructuras jerárquicas
desnormalizadas modeladas de
acuerdo a como se analizaran los
datos.
Cambios en
los datos
Modifica sus datos en forma
constante porque maneja las
transacciones de la empresa.
No tiene como objetivo la
presentación de los datos en línea ni
tampoco modificar datos originales,
solo consultarlos.
37
1.2.18. Datawarehouse o almacén de datos
Un datawarehouse es una colección de información creada para soportar las aplicaciones
de toma de decisiones, Bill Inmon, fue quien definió las características que debe cumplir
un datawarehouse que son: Orientado sobre un área, integrado, indexado al tiempo, es un
conjunto volátil de información que soporta la toma de decisiones.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la información (modelos de tablas en estrella, en copo de nieve, cubos
relacionales, etc.). Este tipo de persistencia de la información es homogénea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales). http://personal.lobocom.es/claudio/gen006.htm
1.2.19. Metodología de diseño del datawarehouse
Los almacenes de datos (datawarehouse) toman cada día mayor importancia, a medida que
las organizaciones pasan de esquemas de sólo recolección de datos a esquemas de análisis
de los mismos, a pesar de la gran difusión de los conceptos relacionados con los almacenes
de datos, no existe mucha información disponible en cuanto a las metodologías para
implementarlos. Sin embargo se expondrá una explicación general de las metodologías
más usadas y su comparación para determinar la más adecuada en el desarrollo del
presente proyecto (IBARRA, 2009).
1.2.19.1. Metodología de Bill Inmon
Bill Inon ve la necesidad de transferir la información de los diferentes OLTP (sistemas
38
transaccionales) de las organizaciones a un modelo centralizado donde los datos pueden ser
utilizados para el análisis corporativo. La metodología Inmon referencia normalmente
como top down, los datos son extraídos de los sistemas operaciones por los procesos ETL
y cargados en las áreas stage, estos son validados y consolidados en el datawarehouse
corporativo donde existen los metadatos desde los cuales los procesos departamentales
obtienen la información de este (Peñafiel, 2012).
1.2.19.2. Metodología Ralph Kimball
El datawarehouse es el conjunto de todos los datamarts de una empresa, siendo una copia
de los datos transaccionales estructurados de una forma especial para el análisis de acuerdo
al modelo dimensional (no normalizado) que incluye las dimensiones y sus atributos, su
organización jerárquica y los hechos, conectados en una estructura en bus que permiten
futuras consultas.
Esta metodología también se referencia como bottom-up pues al final del datawarehouse
corporativo está la unión de los datamart, siendo éste el primer elemento en ser analizado,
en este modelo los procesos ETL extraen la información de los sistemas operacionales y
los procesan igualmente en las áreas stage y llenándolos posteriormente en una forma
individual. Esta metodología incluye 4 fases:
1) Selección del proceso de negocio.
2) Definición de granularidad de la información.
3) Elección de las dimensiones de análisis.
4) Identificación de los hechos o métricas. Tratamiento de los cambios, dimensiones
lentamente cambiantes (SCD (Peñafiel, 2012)).
39
1.2.20. Comparación de Metodologías
Se realizará una comparación entre las metodologías de Ralph Kimball (enfoque
dimensional) y la metodología del Bill Inmon (enfoque Empresarial Warehouse) para la
construcción del datawarehouse, además se puede mencionar que existen otras alternativas
como la metodología de Hefeso y The SAS Rapid datawarehouse methodology como
también las metodologías hibridas (Hybrid DW o el Federated DW) que usan parte
bottom-up y en parte top down y que para el caso de aplicación se toma en consideración
los datos que manejan, la complejidad de los mismos, las transacciones, las perspectiva de
crecimiento, entre otros aspectos, siendo esta la metodología de Kimball.
1.2.21. Aplicación de la metodología de Kimball
1.2.21.1. Planificación
En esta etapa se determina el propósito del proyecto de DW/BI, sus objetivos específicos y
el alcance del mismo, los principales riesgos y una aproximación inicial a las necesidades
de información e incluye las siguientes acciones:
Definir el alcance
Identificar y programar las tareas
Planificar y asignar la carga de trabajo a los recurso (Rivadera, 2010).
1.2.21.2. Análisis de requerimientos
Es el proceso de entrevistar al personal para aprender tanto como se pueda sobre el negocio,
los competidores, la industria, sus clientes, los términos y la terminología ya que a partir de
las entrevistas, podemos identificar los temas analíticos y los procesos involucrados
40
(Rivadera, 2010).
1.2.21.3. Modelado Dimensional
La creación de un modelo dimensional es un proceso dinámico y altamente iterativo que
empieza con un modelo dimensional de alto nivel obtenido a partir de los procesos
priorizados de la matriz de requerimientos, la cual incluye los siguientes pasos:
Elección del proceso de negocio
Establecimiento del nivel de granularidad
Dimensiones, tablas de hechos y medidas
Identificación de los atributos de las dimensiones y de las tablas de hechos
Implementación el modelo dimensional detallado
Revisión y validación del modelo (Rivadera, 2010).
1.2.21.4. Diseño físico
Para ello se debe tomar en cuenta el tamaño del sistema de DW/BI, la configuración del
sistema, tipo de almacenamiento, los procesadores, la conversión de datos lógicos a un
modelo físico, entre otros aspectos (Rivadera, 2010).
1.2.21.5. Extracción, transformación y carga (ETL)
La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de
sistemas principales, realice transformación, validación, el proceso cualitativo, filtración y
al final escriba datos en el almacén y en este momento los datos son disponibles para
analizar por los usuarios (Rivadera, 2010).
41
1.2.21.6. Especificación y desarrollo de aplicaciones de BI
Una parte fundamental de todo proyecto de DW/BI es proporcionar una forma fácil, de
acceder al almacén de datos a través de las aplicaciones de inteligencia de negocios
(business intelligence aplications) que van desde informes simples de formato fijo a
sofisticadas aplicaciones analíticas que usan complejos algoritmos e información del
dominio aplicadas por la metodología de Kimball (Rivadera, 2010).
1.2.21.7. Despliegue
El cubo se ha explotado usando la herramienta de SQL Server Business Intelligence
(Analysis Services), creando una aplicación de Windows para construir el Tablero de
control con conexión al cubo multidimensional. El tablero de control es una herramienta
gráfica para crear, editar y visualizar cuadros de mando. (Peñafiel, 2012)
1.2.21.8. Dashboard (Microsoft Excel)
El despliegue se lleva a efecto mediante el uso de herramientas utilitarias de Microsoft
Excel con el Tablero de mando (dashboard), lo cual permitirá una adecuada manipulación
de datos por los miembros que laboran en el distrito educativo Latacunga.
1.2.22. Características de un datawarehouse
Orientado a un área.- Se entiende que cada parte del datawarehouse puede estar orientado
a resolver un problema específico del negocio, así puede ser: rendimiento académico,
promedios por años de educación, promedios por materias, entre otros.
Integrado.- La información procesada debe tener las medidas, los códigos y los formatos
42
comunes para su adecuada utilidad.
Indexado en el tiempo.- Lo que quiere decir que la información histórica se organiza en
tiempos como: parciales, quimestres o años; siendo este último el que precisamente se
aplica.
No volátil.- Se refiere a que los datos no se mantienen como en los entornos
transaccionales comunes, por el contrario no se actualiza continuamente sino
periódicamente de manera preestablecida y específicamente para la toma de decisiones
(PETKOVIĆ, 2005).
Según Ralph Kimbal, un datawarehouse debe cumplir ciertos objetivos, como:
La información en el datawarehouse puede ser separada y combinada para analizar
cada una de las posibles medidas del negocio.
El datawarehouse no es solo información sino también las herramientas de consulta,
análisis y presentación de la información.
El datawarehouse da acceso a la información de la corporación o del área funcional.
Su alcance puede ser departamental o bien corporativo (W.H. Inmon, 1997)
La calidad de la información en el datawarehouse es el motor del business
reengineering (Hammer, 1991)
1.2.23. Estructura del datawarehouse
Se puede señalar que los datawarehouse tienen estructuras diferentes y detalles que los
limitan, como se puede observar en el siguiente gráfico.
43
Figura Nº 7.- Estructura de un Datawarehouse
Fuente: Microsoft SQL Server 2005
1.2.24. Herramientas para la Implantación del datawarehouse
El datawarehouse se implementa generalmente sobre un sistema gestor de bases de datos y
para sus cargas periódicas que se realizan desde diferentes orígenes se pueden utilizar
herramientas ETL, que permiten enlazar la base de datos con los diferentes orígenes,
definir las transformaciones que hay que realizar para integrar los datos y programar o
automatizar las cargas periódicas. Para la explotación se usa diferentes herramientas, cuya
clasificación se puede realizar en función del perfil de la persona que las utiliza.
Para los analistas o directivos se han creado las herramientas DSS (Decision support
systems), o sistemas de soporte a la toma de decisiones. Podrían considerar como
herramientas de reporting, pero que ofrezca funcionalidad que permitan analizar datos
desde diferentes puntos de vista. Además la modificación y personalización de informes y
la navegación por los datos seleccionados a diferentes niveles de detalle según dimensiones.
44
Para los directivos de nivel superior existe el cuadro de mando, que no deja de ser informes,
pero que permite agregar información en el sentido que una sola página sea suficiente para
evaluar el estado de la empresa. Estos informes tienen que ser visuales, simples y muy
informativos.
Finalmente, cuando se requiere obtener la mayor información o más bien conocimiento de
los datos de la empresa se aplica la minería de datos o datamining contando siempre con la
experiencia de un analista de negocio que entienda y pueda parametrizarlas y crear un
modelo persiguiendo los objetivos corporativos concretos, realizan una explotación de los
datos existentes en busca de nuevas relaciones ocultas, agrupaciones o conclusiones
(Rivadera, 2010).
1.3. Valoración Crítica
Un datawarehouse es una herramienta que permite el análisis de datos en forma
multidimensional, es decir se puede ver su resultado procesado desde diferentes ángulos
acorde a las necesidades de las organizaciones encaminadas a ofrecer un mejor
rendimiento competitivo, mediante la extracción de la información de diferentes fuentes,
ya sean bases de datos o archivos incluso de texto plano posibilitados a su procesamiento.
1.4. Análisis Crítico
En el mundo actual las empresas y organizaciones que no realizan un buen análisis de
información están en riesgo de perder su competitividad y con ello les imposibilite un
mejor crecimiento económico, es precisamente desde este punto de vista que se promueven
una mejor alternativa de análisis de datos en el caso del sistema educativo, mediante
45
business intelligence con un datawarehouse utilizando herramientas: Motor de base de
datos, integración de servicios y análisis de servicios que en conjunto forman una
estructura adecuada para la presentación de información.
1.5. Conclusiones parciales del Capítulo
Al finalizar el CAPÍTULO I – MARCO TEÓRICO, se ha logrado profundizar más con
respecto a las bases teóricas, los mismos que permiten promover de una mejor manera la
investigación encaminada a continuar con el estudio del sistema educativo de la ciudad de
Latacunga, así:
El concepto y la funcionalidad de los sistemas de información orientados al análisis de
datos tomando en consideración los elementos que lo integran: Personas, datos,
actividad y los recursos, así como también las metodologías establecidas como
modelos de aplicación y una vez realizados sus respectivos análisis se puede
determinar que la metodología de Kimball es la que más se centra a la resolución del
presente proyecto ya que cumple con los parámetros de desarrollo.
El estudio de las herramientas tecnológicas basado en un análisis sintético de los
diferentes motores de bases de datos para determinar el uso del más adecuado y que
cumplan con los requerimientos de estudio, ejecución y almacenamiento de la
información para su posterior uso.
La búsqueda, selección y estudio de la herramienta óptima para llevar a cabo el análisis
de datos, tomando en consideración el cumplimiento de las fases del proceso de
46
extracción, transformación y carga de datos, cuyo resultado final sea de fácil
comprensión por el usuario final.
CAPÍTULO II
2. METODOLOGÍA
2.1. Caracterización del sector
El distrito educativo de Latacunga 05D01, se encuentra ubicado en la ciudad de este
mismo nombre, provincia de Cotopaxi, entre las calles Av. Antonia Vela y Guayaquil,
anteriormente se le conocía como dirección provincial de educación de Cotopaxi, pero a
raíz de la nueva denominación establecida en el actual régimen pasa a ser distrito
educativo, además también se unifica con la dirección de educación bilingüe de esta misma
provincia, teniendo como autoridad máxima al/a administrador/a distrital, en este caso
actualmente bajo la responsabilidad de la señora Lic. Paulina Bravo.
La función principal del distrito, es centralizar las acciones enmarcadas al quehacer
educativo en el nivel medio, es decir desde inicial hasta el tercer año de bachillerato en su
diferentes modalidades y especialidades, de las distintas instituciones educativas que se
encuentran dentro de este territorio, en conjunto con sus entes inferiores, los circuitos que
actúan como intermediarios directos entre los establecimientos educativos y el distrito.
Generando de esta manera un gran volumen de información importante relacionada
especialmente con el rendimiento académico de los estudiantes, los cuales tomando en
consideración que en los tiempos actuales la mayoría de las actividades se realiza con el
apoyo de los equipos informáticos y tecnológicos.
47
Tomando en consideración la estructura expuesta anteriormente, es necesario exponer las
acciones que se lleva a efecto, así se puede mencionar los procesos de regulación
académica, es decir promover una mejor manera para que los estudiantes en los diferentes
establecimientos educativos puedan acceder a los beneficios que el estado por obligación
les asigna en una forma equitativa, tomando en consideración los niveles de influencia que
tiene dentro del sector en donde se realiza el quehacer educativo.
2.2. Descripción del procedimiento metodológico
Para la consecución del presente proyecto se ha determinado aplicar el siguiente el
procedimiento metodológico, el cual se centra al logro deseado:
2.2.1. Modalidad Básica de la Investigación
En el desarrollo del presente trabajo se empleará los métodos cualitativo y cuantitativo,
tomando en consideración sus aspectos característicos que son esenciales para la
realización óptima del proyecto, expuestas así:
El método Cualitativo permitirá reconocer los aspectos esenciales del problema para
tratar con mayor profundidad determinadas características inmersas en el proyecto, y;
El método Cuantitativo para la exposición de datos numéricos que enfocará en una forma
más clara las cantidades a analizar.
2.3. Tipos de Investigación
48
La investigación Bibliográfica se empleará para la elaboración del marco teórico y que
permitirá recopilar la información desde otras fuentes que servirá como soporte.
La investigación de campo se utilizará para la recolección de datos que servirán como
base para la elaboración del proyecto.
2.4. Población y Muestra
El trabajo estará centrado al tratamiento de la información en el sistema educativo de la
ciudad de Latacunga con una población base (15 personas), distribuidas así:
Tabla 3.- Personal involucrado
FUNCIÓN Nº
Administradora distrital 1
Administradores circuitales 3
Personal de apoyo TIC’s 3
Recursos humanos 2
Secretarias 4
Asistentes de apoyo 2
TOTAL 15
2.5. Métodos, Técnicas e Instrumentos de Investigación
Para la adecuada realización de la investigación se aplicará los métodos: inductivo y
deductivo, que permitirá conocer en una forma más adecuada los aspectos que encierra el
tema expuesto:
49
El método deductivo que promueve la recopilación de la información partiendo desde
hechos generales para llegar a los hechos más específicos.
El método inductivo en forma inversa al anterior me dará la posibilidad de absorber
información desde los hechos mínimos para ir hacia un nivel más general.
La técnica que se empleará en la investigación será la encuesta que se lo realizará al
personal involucrado en los procesos administrativos de la institución, con lo cual se
logrará obtener los datos requeridos.
El instrumento que se aplicará será el cuestionario. Ver anexo 1.
2.5.1. Procesamiento de la información
Una vez recolectada la información se procederá al análisis de los datos obtenidos, los
cuales serán la parte medular para la propuesta. Estos datos serán cuantificados y
representados gráficamente con sus respectivos análisis. Así:
Encuesta Aplicada al personal del distrito Latacunga
Objetivo:
Determinar los factores que inciden en el correcto uso de la información dentro del sistema
educativo de Latacunga.
50
1) ¿El volumen de datos que usted procesa los catalogaría cómo?
Tabla 4.- Volumen de datos procesados
ITEM FRECUENCIA PORCENTAJE
Alto 10 67%
Medio 4 27%
Bajo 1 7%
TOTAL 15 100%
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 8.- Volumen de datos procesados
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Tomando en consideración esta pregunta, la mayoría del personal manipula un alto
volumen de información en el sistema educativo Latacunga.
67%
27%
6%
Volumen de datos procesados
Alto
Medio
Bajo
51
2) ¿Cuál es la frecuencia de ingreso de información para su procesamiento?
Tabla 5.- Frecuencia de ingreso de información
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 9.- Frecuencia de ingreso de información
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Como se observa, la mayoría de los encuestados ingresa anualmente la información para su
procesamiento.
7%
20%
73%
Frecuencia de ingreso de información
Trimestral
Semestral
Anual
ITEM FRECUENCIA PORCENTAJE
Trimestral 1 7%
Semestral 3 20%
Anual 11 73%
TOTAL 15 100%
52
3) ¿Qué nivel de dificultad tiene usted para elaborar los informes requeridos?
Tabla 6.- Nivel de dificultad para elaborar informe
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 10.- Nivel de dificultad para elaborar informe
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Como se puede observar la mayoría de los encuestados exponen que tienen un alto nivel de
dificultad para la elaboración de informes.
67%
27%
6%
Nivel de dificultad para elaborar informe
Alta
Media
Baja
ITEM FRECUENCIA PORCENTAJE
Alta 10 67%
Media 4 27%
Baja 1 7%
TOTAL 15 100%
53
4) ¿Existen demoras y errores de cálculo durante la emisión de informes?
Tabla 7.- Demoras y errores en informes
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 11.- Demoras y errores en informes
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Con respecto a la pregunta formulada, la mayoría de los encuestados exponen que existen
60% 13%
27%
Demoras y errores en informes
Si
No
A veces
ITEM FRECUENCIA PORCENTAJE
Si 9 60%
No 2 13%
A veces 4 27%
TOTAL 15 100%
54
demoras y errores de cálculo durante la emisión de informes.
5) ¿Considera usted necesaria alguna herramienta informática que le permita
optimizar el procesamiento de la información?
Tabla 8.- Herramienta de optimización
ITEM FRECUENCIA PORCENTAJE
Si 12 80%
No 3 20%
TOTAL 15 100%
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 12.- Herramienta de optimización
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Se puede observar que los encuestados en su gran mayoría requieren de una herramienta
informática que le permita optimizar sus procesos.
80%
20%
Herramienta de optimización
Si
No
55
6) ¿Qué tipo de representación de datos considera adecuada para el análisis de la
información?
Tabla 9.- Representación de datos
ITEM FRECUENCIA PORCENTAJE
Numéricos 2 13%
Gráficos 3 20%
Numéricos y gráficos 10 67%
TOTAL 15 100%
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 13.- Representación de datos
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Se observa que los encuestados en su gran mayoría consideran adecuada la representación
13%
20%
67%
Representación de datos Numéricos
Gráficos
Numéricos y gráficos
56
numérica y gráfica para el análisis de la información.
7) ¿Usted considera que la información que procesa dentro de su área, es adecuada
para la toma de decisiones?
Tabla 10.- Información para toma de decisiones
ITEM FRECUENCIA PORCENTAJE
Muy adecuada 12 80%
Poco adecuada 3 20%
Inadecuada 0 0%
TOTAL 15 100%
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Figura Nº 14.- Información para toma de decisiones
Fuente: Sistema Educativo Latacunga
Elaborado por: El Autor
Análisis:
Como se observa la mayoría de los encuestados considera que la información utilizada es
80%
20%
0%
Información para toma de decisiones
Muy adecuada
Poco adecuada
Inadecuada
57
adecuada para la toma de decisiones.
2.5.2. Resumen de la Interpretación de Resultados
Se puede exponer los siguientes aspectos más notorios que nos arroja como resultado
general del análisis:
El volumen con las que trabajan en el sistema educativo Latacunga es Alto, lo que se
hace necesario la realización de un aplicativo.
Es necesario realizar el procesamiento con los datos recibidos anualmente para
determinar el rendimiento académico.
En vista del alto nivel de dificultad que se presenta en el sistema educativo Latacunga,
se hace necesaria la realización de un aplicativo
Para evitar las demoras y errores en el cálculo para la presentación de informes en el
sistema educativo Latacunga se hace necesario la realización del presente proyecto.
En el sistema educativo Latacunga es muy necesaria una herramienta informática para
el tratamiento de la información.
Es necesario la representación de datos numéricos y gráficos para un mejor análisis de
información en el sistema educativo Latacunga.
La información existente en las diferentes áreas del distrito son muy adecuadas para la
toma de decisiones haciéndose factible la realización del proyecto.
Vista de esta manera se determina que la situación actual con respecto a la organización,
tratamiento y representación de la información para ser llevada a su respectivo análisis y
con ello promover un mejor desarrollo en el Sistema Educativo de la Ciudad de Latacunga,
58
requiere de una pronta optimización; por lo que se determina factible la realización del
presente Proyecto.
2.6. Conclusiones parciales del Capítulo
Es necesario exponer que al finalizar el capítulo II – METODOLOGÍA, se ha logrado
conocer más específicamente respecto a la situación actual del Sistema Educativo de la
ciudad de Latacunga, así:
La información se maneja en esta institución de forma básica, es decir mediante el uso
de utilitarios, lo cual no proporcionan una adecuada presentación del mismo en el
momento requerido para su análisis, es por ello que se debe manipular de una mejor
manera para lograr una mayor eficiencia en el tratamiento.
El procesamiento de la información, debido al volumen del mismo ocasionan demoras
en la obtención de los resultados deseados y su modo de presentación no son óptimos
lo que ocasiona dificultad para la realización de su análisis, evidenciando así las
falencias y debilidades en su tratamiento.
También es necesario reconocer el aporte que proporciona el presente proyecto, en el
análisis de la información de esta institución objeto de estudio, es considerable, ya que
ello dará una mejor oportunidad de desarrollo y logro de resultados en la vida práctica
e incluso también constituye un buen referente para las organizaciones que realizan
este tipo de actividades.
59
CAPÍTULO III
3. MARCO PROPOSITIVO
3.1. Tema:
DESARROLLO DE UN DATAWAREHOUSE PARA EL TRATAMIENTO DE LA
INFORMACIÓN Y LA TOMA DE DECISIONES EN EL SISTEMA EDUCATIVO
DE LA CIUDAD DE LATACUNGA.
3.2. Fundamentación
El presente trabajo de investigación se fundamenta en determinados temas de índole
informático así como también de carácter educativo. Dentro de los temas informáticos
puedo mencionar las herramientas tecnológicas como SQL Server 2008r, que incluye:
Motor de base de datos, Integration Services (ETL) y Analysis Services (para el diseño de
Cubos), utilizados en el proyecto; y para la manipulación directa de los datos Microsoft
Excel (Dashboard). Mientras que por el ámbito educativo el uso de información en medios
manuales y el uso básico del procesador de palabras y hoja de cálculo.
3.3. Objetivos
3.3.1. Objetivo general
Optimizar el proceso de toma de decisiones mediante la tecnología de business
intelligence en el sistema educativo de la ciudad de Latacunga.
60
3.3.2. Objetivos específicos
Implementar una herramienta business intelligence BI, para promover de la mejor
manera la toma de decisiones del sistema educativo Latacunga.
Organizar capacitaciones al personal del departamento de tecnología para que pueda
utilizar y administrar el aplicativo.
Promover nuevas alternativas de uso de la tecnología business intelligence
desarrolladas para la institución.
3.4. Descripción de la propuesta
La propuesta planteada y objeto de estudio del presente proyecto, expuesta en el capítulo I,
se orienta específicamente al desarrollo de un datawarehouse para el tratamiento de la
información, la misma que permitirá la manipulación de los datos por los usuarios,
generando de esta manera un informe de resultados óptimos para su interpretación.
3.5. Metodología de Desarrollo
En este punto se hace necesaria una herramienta para el desarrollo del datawarehouse, el
mismo que se llevará a efecto mediante la metodología Ralph Kimball que cumple con los
pasos secuenciales hasta alcanzar su producto.
3.5.1. Planificación
En la planificación se determina el alcance del proyecto en el aspecto de determinar su
origen y hasta que nivel de profundidad se tratará el tema en estudio, considerándose así:
La información que se maneja dentro del distrito, su origen, es decir desde donde
61
provienen, para de esta manera determinar qué influencia tienen las instituciones
educativas tomando en consideración la nómina de estudiantes y sus respectiva
información con la que aportan para su estudio.
Se debe tomar en consideración los cinco factores importantes según la metodología de
Ralph Kimball para iniciar el proyecto, siendo estas:
Patrimonio de la Gerencia del negocio.
Motivación del negocio.
Acompañamiento del área de tecnología.
Cultura analítica.
Factibilidad.
Se establece la justificación del negocio en donde se especifica e identifica el costo y
beneficio relacionado con el proyecto, siendo considerados dentro de esta:
Costo de hardware.- Que va de acuerdo a los equipos a ser utilizados.
Costo de software.- Teniendo en consideración los programas utilizados para la
construcción del ETL y sus interface de trabajo por el usuario final.
Recursos internos.- Tomando en consideración con los que cuenta el distrito educativo.
Recursos externos.- En el caso de ser necesario algún soporte externo.
Costo de mantenimiento.- Se debe tener en cuenta los requerimientos tanto en hardware
como en software, aquí se involucraría también la proyección de crecimiento del aplicativo.
En la planeación del proyecto, se procederá a establecer los roles de las personas que
62
participan en el mismo, así:
Administradora distrital
Administradores circuitales
Personal de apoyo TIC’s
Recursos humanos
Secretarias
Asistentes de apoyo
En la Administración del proyecto, se toma en consideración las reuniones periódicas
que fomentan una mayor comunicación entre los involucrados internos y externos,
tomando en consideración que las reuniones externas se lleva a efecto especialmente para
actividades específicas, por lo general entes del nivel superior u organismos anexos.
3.5.2. Análisis de Requerimientos
Para la realización adecuada del datawarehouse centrado a las exigencias del cliente se
toma en consideración sus necesidades, las cuales son evidenciadas en la recopilación de
datos, para ello es necesario una comunicación adecuada con los involucrados en la toma
de decisiones en el distrito, ya que conociendo los objetivos, las decisiones y metas
tendremos mayor comprensión de los requerimientos, en contraposición no se debe
averiguar a los usuarios que datos desean que aparezca.
63
3.5.2.1. Preparar la entrevista
Se debe tener presente el rol que desempeña el entrevistado, tomando en cuenta
especialmente a la administradora y al personal de tecnología, a ello se debe recalcar que la
entrevista debe generar confianza y comodidad.
3.5.2.2. Proceder con la entrevista
Para obtener la mejor información posible, es necesario empezar con las preguntas de
índole general, para de allí ir adentrando hacia aspectos más específicos ya que ello
promoverá que el entrevistado haga un poco de memoria en cada detalle haciéndole notar
que la información que proporciona es propia de su trabajo.
3.5.2.3. Revisar el resultado de la entrevista y analizarlo
Para este caso se hace imprescindible haber extraído la información respecto al uso de la
tecnología lo que me permite determinar con mayor efectividad el logro de la
investigación, posterior a ello se debe revisar los datos clave y analizar la información
recopilada en función de ello se procede con su desarrollo.
3.5.2.4. Requerimientos Institucionales
Distrito educativo Latacunga
Universidad UNIANDES
3.5.2.5. Requerimientos Humanos
Investigador: Pedro Pablo Mullo Casnanzuela
Asesor: Msc. Carlos Eduardo Martínez
64
Personal Involucrado del Distrito Latacunga.
Tribunal asignado para defensa de proyecto.
3.5.2.6. Requerimientos Tecnológicos
Tabla 11.- Tecnológicos
Software
Motor de base de datos: SQL Server 2008r
Gestor de datos: Integration services
Análisis de datos: Analysis services
Presentación de datos: Microsoft Excel (Dashboard)
3.5.2.7. Requerimientos Económicos
Tabla 12.- Económicos
Descripción Recurso Costo
Hardware Computador con programas básicos $ 850,00
Software Herramientas para desarrollo (Licencias) $ 350, 00
Servicios
Desarrollo de aplicación $ 200, 00
Capacitación al personal $ 100, 00
Material
Tecnológico $ 200, 00
De oficina $ 150, 00
Suman $ 1.850, 00
Imprevistos (10%) $ 185, 00
Total $ 2.035, 00
65
3.5.3. Modelado Dimensional
3.5.3.1. Elección del proceso de negocio
Al hablar de procesos de negocio se puede señalar que todos los procesos tienen su grado
de importancia y que influyen en sus diferentes niveles, en el análisis de los datos, sin
embargo para la presente resolución se enfocará específicamente en las notas que es la que
mayor profundidad de tratamiento requiere.
3.5.3.2. Dimensiones
Para dar solución al proceso en tratamiento en este punto se determina las dimensiones que
afectan directamente a su resolución, las mismas que surgen de las discusiones del equipo,
por la elección de la granularidad y de la matriz procesos/dimensiones, estas tablas de
dimensiones tienen un conjunto de atributos (generalmente texto) que brindan una
perspectiva o forma de análisis sobre una medida en una tabla de hechos, así
mencionamos:
Dimensión DANIOEDUC: Registra el año de educación (Grados/Cursos).
Tabla 13.- Dimensión DANIOEDUC
Columna Tipo Longitud
CODANIOEDUC varchar 3
ANIOEDUCACION varchar 30
66
Dimensión DDOCENTES: Registra la información de los docentes.
Tabla 14.- Dimensión DDOCENTES
Columna Tipo Longitud
CODOCENTE varchar 10
NOMDOCENTES varchar 63
SEXDOCENTE varchar 3
ESPECDOCENTES varchar 30
IES varchar 60
Dimensión DESTUDIANTES: Registra la información necesaria de los estudiantes.
Tabla 15.- Dimensión DESTUDIANTES
Columna Tipo Longitud
CODESTUDIANTE varchar 10
NOMESTUDIANTES varchar 63
SEXESTUDIANTE varchar 3
Dimensión DINSTITUCIONES: Registra la información de las instituciones educativas.
Tabla 16.- Dimensión DUBICA
Columna Tipo Longitud
CODINSTITUCION varchar 3
NOMINSTITUCION varchar 60
67
Dimensión DPERIODOS: Registra el periodo académico, es decir el año lectivo.
Tabla 17.- Dimensión DPERIODOS
Columna Tipo Longitud
CODPERIODO varchar 3
ANIOINICIO int
Dimensión DMATERIAS: Registra las materias objeto de estudio en cada nivel.
Tabla 18.- Dimensión DMATERIAS
Columna Tipo Longitud
CODMATERIA varchar 3
NOMMATERIA varchar 60
3.5.3.3. Establecimiento del nivel de granularidad
Basado en el proceso a analizar señalado en el punto anterior es necesario precisar los
datos que repercuten especialmente en la interpretación al nivel más minúsculo para
exponer un informe adecuado al usuario final.
Tabla 19.- Nivel de Granularidad
DIMENSIÓN GRANULACIÓN
DANIOEDUC codanioeduc, anioeducacion
DDOCENTE codocente, nomdocentes, sexdocente, especdocentes, IES
DESTUDIANTE codestudiante, nomestudiantes, sexestudiante
DINSTITUCIONES codinstitucion, nominstitucion
DPERIODO codperiodo, anioinicio
68
DMATERIAS codmateria, nommateria
3.5.3.4. Tablas de hechos y medidas
Una medida es un atributo (campo) de una tabla que se desea a analizar, sumarizando o
agrupando sus datos usando los criterios de corte conocidos como dimensiones, las
medidas se vinculan con el nivel de granularidad y se encuentran en las tablas de hechos
(fact.-tables), lo cual es una agrupación de las dimensiones expuestas en el numeral
anterior, lo cual dará la posibilidad de analizar la información de la mejor manera posible.
Tabla 20.- Tablas de Hechos y medidas FactNotas
Columna Tipo Longitud Observaciones
CODNOTAS varchar 20 Clave Principal
CODOCENTE varchar 10 Proviene de Dimensión DDOCENTES
CODMATERIA varchar 3 Proviene de Dimensión DMATERIAS
CODESTUDIANTE varchar 10 Proviene de Dimensión DESTUDIANTES
CODINSTITUCION varchar 3 Proviene de Dimensión DUBICACION
CODANIOEDUC varchar 3 Proviene de Dimensión DANIOEDUC
CODPERIODO varchar 3 Proviene de Dimensión DPERIODOS
PROMEDIO decimal 5.2 Medida
CONDUCTA decimal 5.2 Medida
PROMO int --- Medida
3.5.3.5. Bus matrix
Esta matriz de procesos/hechos versus dimensiones permitirá tener una visión más clara en
el datawarehouse, al presentar su eje de conexión, los mismos que arrojaran los resultados
69
esperados:
Tabla 21.- Bus Matrix
TABLA DE
HECHOS
MEDIDAS
DIMENSIONES
DE
ST
UD
IAN
T
E
DD
OC
EN
TE
DM
AT
ER
IA
DP
ER
IOD
O
DA
NIO
ED
UC
DU
BIC
AC
IÓN
FACTNOTAS
Promedio X X X X X X
Conducta X X X X X X
Promo X X X X X X
3.5.4. Diseño Físico
Es importante recalcar que para la realización del modelo Multidimensional de sistema se
utilizó el modelo ER de los datos operacionales del sistema educativo Latacunga.
Figura Nº 15.- Diseño Físico
70
Los datos almacenados en la base de datos operacionales no siempre se encuentran
homogéneos y estandarizados sobre todo cuando las bases provienen de distintas fuentes
esto es debido a que son ingresados por distintas personas y usualmente no cumplen con
estándares para su ingreso.
Para realizar el análisis OLAP es necesario que la información sea homogénea para esto se
requiere pasar los datos por un proceso de integración, para lo cual se toma la siguiente
consideración:
Definición de los nombres de las tablas de hechos, las dimensiones y sus atributos,
tomando en consideración que esta debe hacer referencia a la base de datos
operacional.
3.5.5. Extracción, transformación y carga (ETL).
Se considera el flujo de datos a través de las tres capas: integración, análisis y visualización
en la cual los datos son extraídos de la base de datos transaccional y pasan por los procesos
ETL, posterior a ser almacenados en la base de datos multidimensional que son explotados
por la capa de análisis, en donde está la técnica OLAP (On Line Analisis Processing); y
precisamente aquí se manipula la información para ofrecer resultados que permitan su uso.
Finalmente los datos son desplegados en la capa de visualización en donde se puede
manipular gráficamente para una mejor comprensión en la toma de decisiones.
El proceso de creación de un ETL consta de los siguientes pasos:
71
Proceso de validación y refrescamiento de datos, tomando en consideración sus
diferentes motores o gestores de base de datos y la estructura misma de operación de
los mismos para determinar la información precisa que se requiere analizar desde sus
diferentes perfiles.
Paso de la BDD operacional a las dimensiones, las mismas que permitirán organizar de
una manera adecuada de acuerdo a sus categorías de influencia en la posterior
estructuración de datos.
Paso de las dimensiones a hechos, una vez ya organizada la información en sus
diversas dimensiones en esta etapa se procede ya a armar la información para ser
presentada al usuario final.
Así como se observa:
72
Figura Nº 16.- Diseño del ETL
3.5.5.1. Creación de cubos
La creación de cubos se realizó utilizando la herramienta SQL server business intelligence
development studio, dentro de la categoría analysis services, opción cubos, cuya estructura
está conformada por el componente de análisis OLAP, a ello se puede mencionar que se
conforma de los elementos:
Origen de datos, que se enlaza a la información de la base de datos desde donde se
almacena.
Vista del origen de datos, nos permite organizar de una mejor manera el orden de
visualización de la información.
Las dimensiones, de acuerdo al establecimiento de los niveles de organización.
El cubo, el producto final que será esencial para el establecimiento de la información
final para su análisis.
Así se presenta en el siguiente gráfico:
73
Figura Nº 17.- Creación de Cubos
3.5.6. Especificación y desarrollo de aplicaciones de BI
La parte fundamental del proyecto de DW/BI está en proporcionar una forma más
estructurada y por lo tanto, más fácil de acceder al almacén de datos. Por ello proporciona
este acceso estructurado a través de lo que llamamos aplicaciones de inteligencia de
negocios (Business Intelligence Aplications).
3.5.6.1. Aplicación de cálculos
En el siguiente gráfico se expone la aplicación del cálculo, los mismos que permitirá
exponer un equivalente por una escala acorde como esté estipulado las calificaciones
utilizadas.
74
Figura Nº 18.- Aplicación de Cálculos
3.5.7. Despliegue
Una vez ya concluida con el diseño de la fact-table aplicando todos los parámetros
requeridos, se procede a procesar la información para ver su resultado.
Procedemos a ejecutar el aplicativo, lo cual se tardará dependiendo de los procesos a
realizar y el volumen de información existente en la base de datos con toda la ejecución
procedemos a examinar la información que arroja el aplicativo.
75
Figura Nº 19.- Despliegue
3.5.8. Dashboard (Microsoft Excel)
En la pestaña datos seleccionamos la opción de otras fuentes y dentro de esta Analysis
Services en la cual nos presentará la ventana que se visualice los cubos existentes, se
procede a seleccionar el cubo correspondiente, en ella nos presenta la ventana en la que nos
permite seleccionar el modo de visualización de la información, dentro de Microsoft Excel
la manipulación es netamente basada a modo de tabla dinámica así como también gráfico
dinámico, para una mejor manipulación e interpretación de los datos se procede a
establecer un modelo de Cuadro de Mando para visualizar el contenido de una mejor
manera, así:
76
Figura Nº 20.- Cuadro de Mando
En la figura 20 se puede observar que se exponen los tres parciales de las diferentes
materias que cada uno de los estudiantes reciben en sus diferentes niveles, de la cual se
obtienen sus respectivos promedios, conjuntamente a esta se expone el avance, el mismo
que se demuestra con sus colores marcados.
A esto también se visualiza la columna del Semáforo, en la cual el color rojo representa
las notas inferiores a 7.00, el color naranja a las notas entre 7.00 y 8,99; mientras que el
color verde representa a las notas desde 9.00 inclusive y superiores.
Posterior y finalmente podemos visualizar la columna de Equilibrar, en la cual cada una
77
de las flechas diseñadas representa sus niveles de aceptabilidad en las notas. Así:
La flecha roja apuntando hacia abajo son las notas inferiores a 7.00 lo que significa que
el rendimiento es Crítico.
La flecha verde apuntando hacia arriba representa las notas 9.00 y superiores, lo que
significa que la nota es Aceptable.
La flecha naranja apuntando hacia el lado derecho inferior equivale a un puntaje entre
7.00 y 7.50 inclusive, lo que demuestra que el rendimiento está en Descenso.
La flecha naranja apuntando hacia le derecha en sentido de línea recta equivale a un
puntaje que oscila entre 7.50 y 8.50 lo que significa un rendimiento Estable.
La flecha naranja apuntando hacia el lado derecho superior equivale a un puntaje entre
8.50 y 9.00 exclusive, lo que significa un rendimiento Ascendente.
En la tabla del dashboard, para controlar la visualización de errores propios que emite
Microsoft Excel cuando se aplica mal una fórmula o función se procedió a aplicar la
función (si.error) lo cual configurando la información de salida se observa la expresión
vacío.
3.6. Conclusiones parciales del capítulo
Al finalizar el CAPÍTULO III – MARCO PROPOSITIVO, se ha logrado materializar la
consecución de la propuesta, la misma que se ha desarrollado basado en los requerimientos
del usuario, y que se centre a la metodología propuesta para su desarrollo, así:
78
Se aplica la metodología de Ralph Kimball para el desarrollo del proyecto, la misma
que abarca las etapas en la resolución de los proyectos de inteligencia empresarial (BI):
planificación, análisis de requerimientos, modelo dimensional, diseño físico, diseño del
sistema (ETL), especificación y desarrollo de aplicaciones de BI.
Se procede a la creación de las dimensiones, las medidas y las tablas de hechos (fact-
tables), siendo precisamente esta última la que permitirá generar el cubo que es el
objeto principal para llevar a efecto el análisis de datos en sus respectivas dimensiones
o requerimientos de los usuarios.
Se diseña el sistema ETL: Extracción que nos permite la obtención de la información
desde la base de datos, transformación que nos permite extraer los datos específicos
con las que se va a trabajar y carga que nos ofrece ya la información lista para el
análisis por parte del usuario final.
CONCLUSIONES Y RECOMENDACIONES
Conclusiones
Se ha logrado conocer con mayor profundidad la manera en la que se manipula
actualmente la información que se utiliza en el sistema educativo Latacunga, la misma
que provoca demora en su tratamiento y cuyos resultados no son los adecuados para
llevarlo a un análisis óptimo del mismo.
79
Se ha procedido a la recopilación de la información influyente en el desarrollo del
proyecto basado en criterios de los expertos para los diferentes temas que involucra al
marco teórico, el mismo que servirá de fundamento para el logro del objetivo
planteado.
Los procesos automatizados han sustituido a las actividades manuales, lo cual ha dado
como resultados el ahorro de tiempo en un gran porcentaje, facilitando con exactitud
informes, provocando mayor satisfacción a las personas que manejan determinada
información y en un futuro a un análisis más adecuado.
80
Recomendaciones
Se recomienda que el aplicativo sea utilizado de una manera adecuada tomando en
consideración las ventajas que esta ofrece dentro del uso y tratamiento de la
información en el nuevo modelo sistemático basado en criterios precisos de
estructuración de datos para su presentación y enfoque a un mejor análisis.
Es necesario que para un mejor tratamiento de la información se tome en consideración
el enfoque que involucra un aplicativo orientado a inteligencia de negocios para el
sistema educativo Latacunga, mediante el uso en herramientas con licencia y que es un
modelo adecuado para orientarse hacia otras plataformas.
Se precisa el uso de herramientas de inteligencia de negocios (BI), tomando en
consideración que en la actualidad se manipula grandes volúmenes de información y
que a su vez requieren de un análisis más detallado orientado a promover la toma de
decisiones de una forma más óptima y en el menor tiempo posible.
BIBLIOGRAFIA
Benítez, F. F. (2012). Registro Oficial. Quito - Ecuador: Lexis.
BERTINO, E. A. (1995). Sistemas de bases de datos orientadas a objetos.
México: Ediciones Díaz de Santos.
IBARRA, M. d. (2009). La Tecnología de Procesamiento Analítico en Línea.
Argentina: Corrientes.
juanito. (2016). gyhghg.
KROENKE David M., P. (2009). Procesamiento de Base de datos – Fundamentos,
Diseño e Implementación. Otawa: Prentice Hall.
LAUDON, J. y. (2006). Sistemas de información gerencial- Administración
de la empresa digital. Mexico: Prentice Hal.
Peñafiel, X. L. (2012). ANÁLISIS, DISEÑO, CONSTRUCCIÓN E IMPLEMENTACIÓN
DE UN DATA WAREHOUSE PARA TOMA DE DECISIONES Y CONSTRUCCIÓN DE LOS
KPI, PARA LA EMPRESA KRONOSCONSULTING CIA LTDA. Quito: Quito.
PETKOVIĆ, D. (2005). Microsoft SQL Server 2005: a beginner’s guide.
México: McGraw-Hill Professional - 0072260939.
RANKINS Ray, B. P. (2010). Microsoft SQL Server 2008 R2 Unleashed. México:
Limuz.
Rivadera, G. R. (2010). La metodología de Kimball para el diseño de
almacenes de datos (Data warehouses). Quito: Rivadera.
ROHRBECK, R. &. (2008). Strategic Foresight in Multinational Companies:
Building a Best-Practice Framework from Case Studies. Ottawa,
Canadá: R&D Management .
SÁNCHEZ MONTOYA, R. (2006). Business intelligence. Microsoft SQL Server
Integration Services (SSIS). México: Limuz.
SENPLADES. (20 de 10 de 2010). Sistema Nacional de Información (SNI).
Recuperado el 25 de 11 de 2015, de
http://www.planificacion.gob.ec/zonas-distritos-y-circuitos/
SENPLADES. (2012). ¿Qué son las zonas, distritos y circuitos? Quito:
Secretaría Nacional de Planificación y Desarrollo.
https://ingenieriadelsoftwareuah2015.wordpress.com/2015/04/05/inteligencia-de-negocios/.
http://es.wikipedia.org/w/index.php?title=Sistemas_de_informaci%C3%B3n_gerencial&pr
intable=yes.
http://exa.unne.edu.ar/informatica/SO/OLAPMonog.pdf.
http://personal.lobocom.es/claudio/gen006.htm.
ANEXOS
Universidad Regional Autónoma de los Andes
UNIANDES
ENCUESTA APLICADA AL PERSONAL DEL DISTRITO LATACUNGA
Sexo: M F
INSTRUCCIONES:
La información que usted proporcione tiene el carácter confidencial y será utilizada
únicamente para fines de desarrollo del presente proyecto.
Por favor lea detenidamente la pregunta y responda de acuerdo a su criterio.
OBJETIVO:
Determinar los factores que inciden en el correcto uso de la información dentro del sistema
educativo de Latacunga.
1) ¿El volumen de datos que usted procesa los catalogaría cómo?
Alto Medio Bajo
2) ¿Cuál es la frecuencia de ingreso de información para su procesamiento?
Trimestral Semestral Anual
3) ¿Qué nivel de dificultad tiene usted para elaborar los informes requeridos?
Alta Media Baja
4) ¿Existen demoras y errores de cálculo durante la emisión de informes?
Si No A veces
5) ¿Considera usted necesaria alguna herramienta informática que le permita optimizar el
procesamiento de la información?
Si No
6) ¿Qué tipo de representación de datos considera adecuada para el análisis de la
información?
Numéricos Gráficos Numéricos y gráficos
7) ¿Usted considera que la información que procesa dentro de su área, es adecuada para la
toma de decisiones?
Muy adecuada Poco adecuada Inadecuada
DATOS PERSONALES:
Nombre: Pedro Pablo Mullo Casnanzuela
Teléfono: 032809361 – 0983240168
Especialidad: Maestría en Ingeniería y Sistemas de Computación
top related