universidad de guayaquilrepositorio.ug.edu.ec/bitstream/redug/48862/1/b-cisc-ptg... · 2020. 8....
Post on 17-Feb-2021
14 Views
Preview:
TRANSCRIPT
-
III
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN SISTEMAS
COMPUTACIONALES
APLICACIÓN DE TÉCNICAS DE MACHINE LEARNING
BASADO EN INFORMACIÓN SÍSMICA PARA
PROFUNDIZAR LA PROBABILIDAD DE
TERREMOTOS MEDIANTE EL USO
DE REGRESIÓN LOGÍSTICA Y
REDES NEURONALES
PROYECTO DE TITULACIÓN
Previa a la obtención del Título de:
INGENIERO EN SISTEMAS COMPUTACIONALES
AUTOR (ES):
Daniel Alejandro Alba Vega
Javier Fernando Calle Jara
TUTOR:
Ing. Lorenzo Cevallos Torres, M. Sc.
GUAYAQUIL – ECUADOR
2020
-
REPOSITORIO NACIONAL EN CIENCIA Y TECNOLOGÍA
FICHA DE REGISTRO DE TESIS
TITULO: “APLICACIÓN DE TÉCNICAS DE MACHINE LEARNING BASADO EN INFORMACIÓN
SÍSMICA PARA PROFUNDIZAR LA PROBABILIDAD DE TERREMOTOS MEDIANTE EL USO DE
REGRESIÓN LOGÍSTICA Y REDES NEURONALES”
REVISORES:
INSTITUCIÓN: Universidad de Guayaquil FACULTAD: Facultad de Ciencias Matemáticas y
Físicas
CARRERA: Ingeniería en Sistemas Computacionales
FECHA DE PUBLICACIÓN:
N. DE PÁGS.: 173
ÁREA TEMÁTICA: Herramientas biotecnológicas aplicados a los recursos naturales y agropecuarios.
PALABRAS CLAVE: Sismos, Predicción, Machine Learning, Redes Neuronales, Regresión Logística, Python
RESUMEN: El objetivo principal del presente proyecto es predecir la posibilidad de que ocurra un evento sísmico y las características de este mediante la
aplicación de técnicas de Machine Learning con la finalidad de minimizar daños dentro del territorio ecuatoriano, debido a que, la aparición de
un terremoto imprevisto es causante de daños estructurales y sociales dependiendo de su magnitud, por lo que, se aplicaron las técnicas de Redes
Neuronales y Regresión Logística. Para aplicar aquellos algoritmos, se elaboró una base de datos que contiene datos históricos provenientes de
páginas web acerca de los sismos que sucedieron en el Ecuador desde el año 1985 hasta el 2019 en las regiones Costa, Sierra y Oriente. En total
se recolectaron 658 sismos, los cuales fueron utilizados por las técnicas ya mencionadas para la generación de nuevas predicciones y con ellas
una probabilidad de que estas en realidad puedan suceder. Los datos históricos, resultados y gráficos obtenidos por ambas técnicas se puede
visualizar por medio de una página web. Los dos algoritmos demuestran que son viables al momento de predecir un evento sísmico, por ejemplo
a través de la aplicación de Redes Neuronales, la pérdida de valor de los datos de validación (17.64%) es menor a los de la pérdida de valor de los
datos de entrenamiento (23.8%) lo que significa que no hay sobreajuste es decir que el proceso tendrá una menor probabilidad en fallar al
reconocer nuevos eventos sísmicos; mientras que el algoritmo de Regresión Logística obtuvo una precisión del 72.25% siendo así un porcentaje
mayor al 70% mínimo requerido para poder aplicarse y el valor de la curva ROC o AUC es aproximadamente 70.4% dando a entender que los
datos por encima de ese valor tienden a ser clasificadas correctamente puesto que a medida que se acerquen más a 1, los datos tendrán una mejor
clasificación. Tomando en cuenta los resultados mencionados, se puede concluir que las técnicas aplicadas en este proyecto son eficientes al
momento de predecir eventos próximos en base a datos históricos y que el uso de técnicas de aprendizaje automático resultan muy útiles para
resolver diversos problemas predictivos.
N. DE REGISTRO (en base de datos):
N. DE CLASIFICACIÓN:
DIRECCIÓN URL (tesis en la web):
ADJUNTO PDF (tesis en la web): SI X NO CONTACTO CON AUTORES/ES:
Alba Vega Daniel Alejandro
Calle Jara Javier Fernando
Telf:
0969032394
0967847563
E-mail:
daniel.albav@ug.edu.ec
javier.calleja@ug.edu.ec
CONTACTO EN LA INSTITUCIÓN:
Nombre: Ab. Juan Chávez Atocha.
Teléfono: 2307729
mailto:stefynavasf@gmail.com%22HYPERLINK%20%22mailto:vincent.medinao@ug.edu.ec
-
III
APROBACIÓN DEL TUTOR
En mi calidad de Tutor del trabajo de titulación, “APLICACIÓN DE TÉCNICAS
DE MACHINE LEARNING BASADO EN INFORMACIÓN SÍSMICA PARA
PROFUNDIZAR LA PROBABILIDAD DE TERREMOTOS MEDIANTE EL
USO DE REGRESIÓN LOGÍSTICA Y REDES NEURONALES” elaborado por
los Sres. Alba Vega Daniel Alejandro y Calle Jara Javier Fernando, ALUMNOS
NO TITULADOS de la Carrera de Ingeniería en Sistemas Computacionales,
Facultad de Ciencias Matemáticas y Físicas de la Universidad de Guayaquil, previo
a la obtención del Título de Ingeniero en Sistemas, me permito declarar que luego
de haber orientado, estudiado y revisado, la Apruebo en todas sus partes.
Atentamente,
Ing. Lorenzo Cevallos Torres, MSc.
TUTOR
-
IV
DEDICATORIA
Dedico este trabajo a mis padres quienes nunca
Escatimaron su cariño conmigo, a mis queridos
Docentes quienes me enseñaron diariamente lo
Importante que es esforzarse para conseguir
Cada meta propuesta, que no importa lo
Alto o lejos que se vea el final, siempre se
Tiene que seguir adelante hasta llegar a nuestro
Objetivo. Me enseñaron que el camino va a estar
Rodeado de piedras con las que tropezaremos, lo
Importante es saber levantarse, continuar y
Aprender a no tropezar con la misma piedra.
Daniel Alba
-
V
AGRADECIMIENTO
Agradezco en primer lugar a mis padres por su
Gigantesco amor que me brindaron, ellos me
Regalaron los mejores consejos que pude recibir,
Agradezco también el Ing. Lorenzo por ayudarme
Desinteresadamente y acompañarme hasta
El final, para terminar agradezco a todos los que
Confiaron en mí, a los que creyeron que mis
Inmensas ganas de triunfar me iban a llevar
Muy lejos, quienes me dijeron que sin
Importar lo difícil que se vea el camino si
Estudiaba mucho y nunca me rendía iba a ver que
Nada en esta vida se me iba hacer difícil, que
Todas mis metas, anhelos, sueños, deseos u
Objetivos los iba a cumplir, solo debo luchar.
Daniel Alba
-
VI
DEDICATORIA
Dedico esta tesis a mis padres quienes aun
Estando lejos siempre me supieron
Dar los mejores consejos y me apoyaron
Incondicionalmente, a mis hermanos por
Cada frase motivadora compartida y que
A pesar de cualquier pelea, siempre
Terminábamos riéndonos y diciéndome lo
Orgullosos que se sentían por nunca
Renunciar a mis sueños y que un día
Iba a ver los frutos de mi esfuerzo porque
Aprendí a jamás rendirme frente a nada.
Javier Calle
-
VII
AGRADECIMIENTO
Agradezco primero a Dios por ser mi
Guía en este arduo camino, a mis
Respetados padres por siempre estar
Al pendiente de mi a pesar de todos mis
Defectos y errores, a mis hermanos por
Ese cariño único e incondicional que
Comparten conmigo a la distancia, al
Ingeniero Lorenzo Cevallos quien fue
Mi tutor y a mis demás profesores que
Incondicionalmente me ayudaron y
Estimularon para continuar adelante y a
No rendirme a pesar de los obstáculos y
Tropiezos que he tenido, siempre me han
Orientado por el camino correcto.
Javier Calle
-
VIII
TRIBUNAL PROYECTO DE TITULACIÓN
Ing. Fausto Cabrera Montes, M.Sc.
DECANO DE LA FACULTAD
CIENCIAS MATEMATICAS Y
FISICAS
Ing. Gary Reyes Zambrano, Mgs.
DIRECTOR DE LA CARRERA
DE INGENIERIA EN SISTEMAS
COMPUTACIONALES
Ing. Lorenzo Cevallos Torres, M.Sc.
PROFESOR TUTOR DEL
PROYECTO DE TITULACION
Ing. Erick E. González Linch, M.Sc.
PROFESOR REVISOR DEL
PROYECTO DE TITULACION
Ab. Juan Chávez Atocha, Esp.
SECRETARIO
-
II
DECLARACIÓN EXPRESA
“La responsabilidad del contenido de este
Proyecto de Titulación, nos corresponden
exclusivamente; y el patrimonio intelectual de
la misma a la UNIVERSIDAD DE
GUAYAQUIL”
____________________________
Daniel Alejandro Alba Vega
__________________________
Javier Fernando Calle Jara
-
III
.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES
APLICACIÓN DE TÉCNICAS DE MACHINE LEARNING BASADO
EN INFORMACIÓN SÍSMICA PARA PROFUNDIZAR LA
PROBABILIDAD DE TERREMOTOS MEDIANTE EL
USO DE REGRESIÓN LOGÍSTICA
Y REDES NEURONALES
Proyecto de Titulación que se presenta como requisito para optar por el título de
INGENIERO EN SISTEMAS COMPUTACIONALES
Autores:
Alba Vega Daniel Alejandro
C.I. 0706298643
Calle Jara Javier Fernando
C.I. 0302666250
Tutor: Ing. Lorenzo Cevallos Torres, MSc.
Guayaquil, Abril de 2020
-
IV
CERTIFICADO DE ACEPTACIÓN DEL TUTOR
En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo
Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad de
Guayaquil.
CERTIFICO:
Que he analizado el Proyecto de Titulación presentado por los estudiantes Alba Vega Daniel Alejandro y Calle Jara Javier Fernando, como
requisito previo para optar por el título de Ingeniero en Sistemas Computacionales
cuyo título es:
APLICACIÓN DE TÉCNICAS DE MACHINE LEARNING BASADO EN
INFORMACIÓN SÍSMICA PARA PROFUNDIZAR LA PROBABILIDAD DE
TERREMOTOS MEDIANTE EL USO DE REGRESIÓN LOGÍSTICA Y REDES
NEURONALES
Considero aprobado el trabajo en su totalidad.
Presentado por:
Alba Vega Daniel Alejandro C.I. 0706298643
Calle Jara Javier Fernando C.I. 0302666250
Tutor: Ing. Lorenzo Cevallos, MSc.
Guayaquil, Abril del 2020
-
V
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES
Autorización para Publicación de Proyecto de Titulación en Formato Digital
1. Identificación del Proyecto de Titulación
Nombre Alumno: Alba Vega Daniel Alejandro
Dirección: Alborada segunda etapa
Teléfono: 0969032394 E-mail: daniel.albav@ug.edu.ec
Nombre Alumno: Calle Jara Javier Fernando
Dirección: Rumichaca y Víctor Manuel Rendom
Teléfono: 0967847563 E-mail: javier.calleja@ug.edu..ec
Título del Proyecto de titulación: Aplicación de técnicas de Machine Learning basado en
información sísmica para profundizar la probabilidad de terremotos mediante el uso de regresión
logística y redes neuronales
Tema del Proyecto de Titulación: Sismos, Predicción, Machine Learning, Redes Neuronales,
Regresión Logística, Python.
2. Autorización de Publicación de Versión Electrónica del Proyecto de Titulación
A través de este medio autorizo a la Biblioteca de la Universidad de Guayaquil y a la Facultad de
Ciencias Matemáticas y Físicas a publicar la versión electrónica de este Proyecto de titulación.
Publicación electrónica:
Inmediata X Después de 1 año
Firma Alumno:
____________________________ ____________________________
Alba Vega Daniel Alejandro Calle Jara Javier Fernando
3. Forma de envío:
El texto del proyecto de titulación debe ser enviado en formato Word, como archivo .Doc. O .RTF
y. Puf para PC. Las imágenes que la acompañen pueden ser: .gif, .jpg o .TIFF.
DVDROM X CDROM
Facultad: Ciencias Matemáticas y Físicas
Carrera: Ingeniería en Sistemas Computacionales
Proyecto de titulación al que opta: Ingeniera en Sistemas Computacionales
Profesor tutor: Ing. Lorenzo Cevallos Torres, MSc.
mailto:daniel.albav@ug.edu.ec
-
VI
ÍNDICE GENERAL
DEDICATORIA .............................................................................................................. IV
AGRADECIMIENTO ...................................................................................................... V
ÍNDICE GENERAL .............................................................................................................. VI
ÍNDICE DE CUADROS ..........................................................................................................X
ÍNDICE DE GRÁFICOS .................................................................................................. XI
RESUMEN ..................................................................................................................... XIII
ABSTRACT................................................................................................................... XIV
INTRODUCCIÓN .................................................................................................................. 1
CAPÍTULO I ......................................................................................................................... 3
EL PROBLEMA .................................................................................................................... 3
UBICACIÓN DEL PROBLEMA EN UN CONTEXTO ................................................................. 4
SITUACIÓN CONFLICTO NUDOS CRÍTICOS .......................................................................... 5
CAUSAS Y CONSECUENCIAS DEL PROBLEMA...................................................................... 6
DELIMITACIÓN DEL PROBLEMA ......................................................................................... 7
FORMULACIÓN DEL PROBLEMA ......................................................................................... 7
EVALUACIÓN DEL PROBLEMA ............................................................................................ 7
OBJETIVOS .......................................................................................................................... 9
Objetivo General ................................................................................................................ 9
Objetivos Específicos .......................................................................................................... 9
ALCANCES DEL PROBLEMA................................................................................................. 9
JUSTIFICACIÓN E IMPORTANCIA ...................................................................................... 10
METODOLOGÍA DEL PROYECTO ....................................................................................... 11
CAPÍTULO II ...................................................................................................................... 13
MARCO TEÓRICO ............................................................................................................. 13
ANTECEDENTES DEL ESTUDIO .......................................................................................... 13
FUNDAMENTACIÓN TEÓRICA .......................................................................................... 22
Los sismos ........................................................................................................................ 22
Licuefacción, derrumbes y deslizamientos ....................................................................... 25
Tsunamis o maremotos .................................................................................................... 25
Cinturón de Fuego en el Pacífico ...................................................................................... 25
Machine Learning............................................................................................................. 26
Algoritmos de Machine Learning ..................................................................................... 27
-
VII
Redes Neuronales ............................................................................................................ 28
Funciones de Activación:.................................................................................................. 30
Funciones de Optimización .............................................................................................. 31
Fases para una buena modelización de redes neuronales ............................................... 32
Tipos de Aprendizaje ........................................................................................................ 33
Algoritmo Backpropagation ............................................................................................. 35
Redes Neuronales Recurrentes LSTM .............................................................................. 36
Regresión Logística........................................................................................................... 41
Tipos de Regresión Logística ............................................................................................ 43
Condiciones del Modelo Logístico .................................................................................... 47
Principales atributos del Modelo de Regresión Logística ................................................. 48
Curva ROC ........................................................................................................................ 52
Matriz de Confusión ......................................................................................................... 54
Revisiones Sistemáticas ................................................................................................... 55
Distribución de Frecuencias Estadística ........................................................................... 56
Metaanálisis ..................................................................................................................... 57
Tablas de Contingencia .................................................................................................... 60
Análisis Bivariado ............................................................................................................. 61
SOFTWARE SPSS 2 ............................................................................................................ 62
Límites de Control ............................................................................................................ 62
Python .............................................................................................................................. 63
Base de Datos................................................................................................................... 64
FUNDAMENTACIÓN LEGAL .............................................................................................. 66
DEFINICIONES CONCEPTUALES ........................................................................................ 69
CAPÍTULO III ..................................................................................................................... 71
METODOLOGÍA DE LA INVESTIGACIÓN ............................................................................ 71
DISEÑO DE LA INVESTIGACIÓN ........................................................................................ 71
MODALIDAD DE LA INVESTIGACIÓN ................................................................................ 71
TIPO DE INVESTIGACIÓN .................................................................................................. 72
POBLACIÓN Y MUESTRA................................................................................................... 74
POBLACIÓN ...................................................................................................................... 74
MUESTRO PROBABILÍSTICO.............................................................................................. 74
POBLACIÓN OBJETIVO ...................................................................................................... 75
MARCO MUESTRAL .......................................................................................................... 75
-
VIII
DISEÑO DEL METAANÁLISIS ............................................................................................. 76
DESCRIPCIÓN DE VARIABLES ............................................................................................ 76
Instrumentos utilizados para la recolección de datos ...................................................... 79
Resultados del metaanálisis ............................................................................................. 80
Análisis Bivariado de los datos y tablas de contingencia .................................................. 91
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS .............................................. 99
TÉCNICAS ......................................................................................................................... 99
INSTRUMENTOS DE INVESTIGACIÓN.............................................................................. 100
RECOLECCIÓN DE LA INFORMACIÓN.............................................................................. 100
ANÁLISIS DE FACTIBILIDAD ............................................................................................. 100
FACTIBILIDAD OPERACIONAL ......................................................................................... 100
FACTIBILIDAD TÉCNICA .................................................................................................. 101
FACTIBILIDAD LEGAL ...................................................................................................... 101
FACTIBILIDAD ECONÓMICA ............................................................................................ 101
ANÁLISIS DE LOS DATOS ................................................................................................. 102
PROCEDIMIENTOS DE LA INVESTIGACIÓN ..................................................................... 102
Análisis de datos de Regresión logística ......................................................................... 103
Análisis de datos de Redes neuronales LSTM................................................................. 109
CAPÍTULO IV ................................................................................................................... 117
RESULTADO CONCLUSIONES Y RECOMENDACIONES ..................................................... 117
RESULTADOS .................................................................................................................. 117
CRITERIOS DE VALIDACIÓN ............................................................................................ 119
CONCLUSIONES .............................................................................................................. 120
RECOMENDACIONES ...................................................................................................... 121
BIBLIOGRAFÍA ................................................................................................................. 122
ANEXOS .......................................................................................................................... 129
ANEXO 1 – Cronograma del Proyecto........................................................................... 129
ANEXO 2 – Resultados del Entrenamiento del Modelo de Regresión Logística ............. 130
ANEXO 3 – Resultados del Entrenamiento del Modelo LSTM ........................................ 131
ANEXO 4 – Código empleado para el modelo de Redes Neuronales LSTM .................. 132
ANEXO 5 – Código empleado para el Modelo de Regresión Logística .......................... 136
ANEXO 6 – Actas de sesión de investigador y tutor ...................................................... 138
ANEXO 6 – Evaluación/Criterio de Experto .................................................................. 141
ANEXO 7 – Manual de Usuario ...................................................................................... 142
-
IX
ABREVIATURAS
UG Universidad de Guayaquil
Ing. Ingeniero
M.Sc. Master
URL Localizador de Fuente Uniforme
GPS Global Positioning System
ISC Centro Internacional de Sismología
LSTM Long short-term memory
ROC Receiver Operating Characteristic
ECM Error Cuadrático Medio
OVR One Vs the Rest
IGEPN Instituto Geofísico de la Escuela Politécnica Nacional.
USGS United States Geological Survey
SPSS Statistical Product and Service Solutions
RNA Red Neuronal Artificial
SGD Descenso estocástico del gradiente
AUC Área bajo la curva
-
X
ÍNDICE DE CUADROS
Tabla 1: Causas y Consecuencias del Problema ................................................................. 6
Tabla 2: Delimitación del Problema ................................................................................... 7
Tabla 3: Escala abreviada de Richter ............................................................................... 24
Tabla 4: Rangos de probabilidad de éxito ........................................................................ 44
Tabla 5: Condiciones principales del Modelo Logístico .................................................. 47
Tabla 6: Comparación de características de base de datos ............................................... 65
Tabla 7: Variables del Metaanálisis ................................................................................. 76
Tabla 8: Palabras Clave .................................................................................................... 77
Tabla 9: Criterio de selección........................................................................................... 77
Tabla 10: Bibliografía ...................................................................................................... 79
Tabla 11: Análisis de la variable Número de citas de cada artículo.................................. 80
Tabla 12: Análisis de la variable “Palabras Clave” .......................................................... 81
Tabla 13: Análisis de la variable “Criterio de selección” ................................................. 82
Tabla 14: Análisis de la variable “Comparación del modelo” .......................................... 83
Tabla 15: Análisis de la variable “Número de veces que se repite Redes Neuronales” .... 84
Tabla 16: Análisis de la variable “Número de veces que se repite Regresión Logística” . 85
Tabla 17: Análisis de la variable “Número de veces que se repite Sismo” ....................... 86
Tabla 18: Análisis de la variable “Número de veces que se repite Estadística”................ 87
Tabla 19: Análisis de la variable “Número de veces que se repite Predicción” ................ 88
Tabla 20: Análisis de la variable “Número de veces que se repite Machine Learning" .... 89
Tabla 21: Análisis de la variable “Bibliografía” ............................................................... 90
Tabla 22: Correlación de Pearson de las variables “Machine Learning” y “Predicción” .. 91
Tabla 23: Tabla de Contingencia de las variables “Machine Learning” y “Predicción” ... 92
Tabla 24: Correlación de Pearson de las variables “Redes Neuronales” y “Sismo” ......... 93
Tabla 25: Tabla de Contingencia de las variables “Redes Neuronales” y “Sismo” .......... 93
Tabla 26: Correlación de Pearson de las variables “Regresión Logística” y “Sismo” ...... 95
Tabla 27: Tabla de Contingencia de las variables “Regresión Logística” y “Sismo” ....... 95
Tabla 28: Correlación de Pearson de las variables “Número de Citas”, “Predicción” y
“Machine Learning” ......................................................................................................... 97
Tabla 29: Tabla de Contingencia de las variables “Número de Citas” y “Machine
Learning” ......................................................................................................................... 97
Tabla 30: Tabla de Contingencia de las variables “Número de Citas” y “Predicción” ..... 98
Tabla 31: Detalle de Costos del Proyecto ....................................................................... 102
Tabla 32: Descripción de las variables ........................................................................... 104
Tabla 33: Descripción de las variables ........................................................................... 110
-
XI
ÍNDICE DE GRÁFICOS
Gráfico 1: Representación del origen de un sismo ............................................................. 4
Gráfico 2: Magnitudes de los sismos ocurridos ................................................................ 15
Gráfico 3: Número de víctimas que han dejado los terremotos a nivel mundial y a nivel de
América Latina ................................................................................................................ 16
Gráfico 4: Número de muertos que ha dejado los sismos más fuertes ocurridos en el
Ecuador ............................................................................................................................ 17
Gráfico 5: Magnitud de los sismos más fuertes ocurridos en el Ecuador ......................... 18
Gráfico 6: Representación del origen de un sismo ........................................................... 23
Gráfico 7: Cinturón de Fuego del Pacífico ....................................................................... 26
Gráfico 8: Ejemplo de una Red Neuronal ........................................................................ 29
Gráfico 9: Representación de los datos en un plano de regresión ..................................... 33
Gráfico 10: Representación de los datos en un plano de clasificación ............................. 34
Gráfico 11: Esquema de la metodología LSTM ............................................................... 36
Gráfico 12: Representación de los odds en base a la probabilidad ................................... 45
Gráfico 13: Mostrando Datos ........................................................................................... 49
Gráfico 14: Resumiendo cada categoría ........................................................................... 49
Gráfico 15: Usando función GLM ................................................................................... 50
Gráfico 16: Exponenciando Modelo ................................................................................ 51
Gráfico 17: Realizando la predicción ............................................................................... 52
Gráfico 18: Resultados finales ......................................................................................... 52
Gráfico 19: Curva ROC ................................................................................................... 53
Gráfico 20: Matriz de confusión ...................................................................................... 54
Gráfico 21: Tabla de Contingencia bidireccional r x c ..................................................... 61
Gráfico 22: Funcionamiento del método deductivo ......................................................... 73
Gráfico 23: Representación del Muestreo Aleatorio Simple ............................................ 75
Gráfico 24: Frecuencia de la variable “Número de citas el artículo” ................................ 80
Gráfico 25: Frecuencia de la variable “Palabras Clave” ................................................... 81
Gráfico 26: Frecuencia de la variable “Criterios de Selección” ....................................... 82
Gráfico 27: Frecuencia de la variable “Criterios de Selección” ....................................... 83
Gráfico 28: Frecuencia de la variable “Número de veces que se repite Redes Neuronales”
......................................................................................................................................... 84
Gráfico 29:Frecuencia de la variable “Número de veces que se repite Regresión
Logística” ......................................................................................................................... 85
Gráfico 30: Frecuencia de la variable “Número de veces que se repite Sismo” ............... 86
Gráfico 31: Frecuencia de la variable “Número de veces que se repite Estadística” ........ 87
Gráfico 32: Frecuencia de la variable “Número de veces que se repite Predicción” ........ 88
Gráfico 33: Frecuencia de la variable “Número de veces que se repite Machine Learning”
......................................................................................................................................... 89
Gráfico 34: Frecuencia de la variable “Bibliografía” ....................................................... 90
Gráfico 35: Gráfico en barras de tablas cruzadas “Machine Learning” y “Predicción” .... 92
Gráfico 36: Gráfico en barras de tablas cruzadas “Redes Neuronales” y “Sismo” ........... 94
Gráfico 37: Gráfico en barras de tablas cruzadas “Regresión Logística” y “Sismo” ........ 96
Gráfico 38: Gráfico en barras de tablas cruzadas “Número de Citas” y “Machine
Learning” ......................................................................................................................... 98
Gráfico 39: Gráfico en barras de tablas cruzadas “Número de Citas” y “Predicción” ..... 99
Gráfico 40: Descripción de parámetros .......................................................................... 105
-
XII
Gráfico 41: Comparación de datos ................................................................................. 106
Gráfico 42: Curva ROC ................................................................................................. 106
Gráfico 43: Matriz de confusión .................................................................................... 107
Gráfico 44: Cantidad de Sismos 2020 ............................................................................ 108
Gráfico 45: Predicción de sismos 2020 .......................................................................... 109
Gráfico 46: Descripción de parámetros .......................................................................... 111
Gráfico 47: Validación de Pérdida ................................................................................. 112
Gráfico 48: Validación del modelo ................................................................................ 113
Gráfico 49: Comparación del Modelo ............................................................................ 114
Gráfico 50: Límites de Control ...................................................................................... 115
Gráfico 51: Sismos Predichos Codificados .................................................................... 115
Gráfico 52: Sismos Predichos Descodificados ............................................................... 116
-
XIII
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMATICAS Y FISICAS
CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES
APLICACIÓN DE TÉCNICAS DE MACHINE LEARNING BASADO EN
INFORMACIÓN SÍSMICA PARA PROFUNDIZAR LA PROBABILIDAD
DE TERREMOTOS MEDIANTE EL USO DE REGRESIÓN
LOGÍSTICA Y REDES NEURONALES
RESUMEN
El objetivo principal del presente proyecto es predecir la posibilidad de que ocurra un
evento sísmico y las características de este mediante la aplicación de técnicas de Machine
Learning con la finalidad de minimizar daños dentro del territorio ecuatoriano, debido a
que, la aparición de un terremoto imprevisto es causante de daños estructurales y sociales
dependiendo de su magnitud, por lo que, se aplicaron las técnicas de Redes Neuronales y
Regresión Logística. Para aplicar aquellos algoritmos, se elaboró una base de datos que
contiene datos históricos provenientes de páginas web acerca de los sismos que sucedieron
en el Ecuador desde el año 1985 hasta el 2019 en las regiones Costa, Sierra y Oriente. En
total se recolectaron 658 sismos, los cuales fueron utilizados por las técnicas ya
mencionadas para la generación de nuevas predicciones y con ellas una probabilidad de
que estas en realidad puedan suceder. Los datos históricos, resultados y gráficos obtenidos
por ambas técnicas se puede visualizar por medio de una página web. Los dos algoritmos
demuestran que son viables al momento de predecir un evento sísmico, por ejemplo a través
de la aplicación de Redes Neuronales, la pérdida de valor de los datos de validación
(17.64%) es menor a los de la pérdida de valor de los datos de entrenamiento (23.8%) lo
que significa que no hay sobreajuste es decir que el proceso tendrá una menor probabilidad
en fallar al reconocer nuevos eventos sísmicos; mientras que el algoritmo de Regresión
Logística obtuvo una precisión del 72.25% siendo así un porcentaje mayor al 70% mínimo
requerido para poder aplicarse y el valor de la curva ROC o AUC es aproximadamente
70.4% dando a entender que los datos por encima de ese valor tienden a ser clasificadas
correctamente puesto que a medida que se acerquen más a 1, los datos tendrán una mejor
clasificación. Tomando en cuenta los resultados mencionados, se puede concluir que las
técnicas aplicadas en este proyecto son eficientes al momento de predecir eventos próximos
en base a datos históricos y que el uso de técnicas de aprendizaje automático resultan muy
útiles para resolver diversos problemas predictivos.
Palabras Clave: Sismos, Predicción, Machine Learning, Redes Neuronales, Regresión
Logística, Python.
Autores: Alba Vega Daniel Alejandro
Calle Jara Javier Fernando
Tutor: Ing. Lorenzo Cevallos, M.Sc.
-
XIV
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMATICAS Y FISICAS
CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES
APPLICATION OF BASED MACHINE LEARNING TECHNIQUES IN
SEISMIC INFORMATION TO DEEPEN THE PROBABILITY OF
EARTHQUAKES THROUGH THE USE OF LOGISTIC
REGRESSION AND NEURONAL NETWORKS
ABSTRACT
The main objective of this project is to predict the possibility of a seismic event and its
characteristics through the application of Machine Learning techniques in order to
minimize damages within the Ecuadorian territory, due to the fact that the occurrence of an
unforeseen earthquake may cause structural and social damage depending on its magnitude,
so the techniques of Neural Networks and Logistic Regression were applied. To apply those
algorithms, a database was created, it contains historical data from web pages about the
earthquakes that happened in Ecuador from 1985 to 2019 in the Costa, Sierra and Oriente
regions. In total 658 earthquakes were collected, which were used by the aforementioned
techniques for the generation of new predictions and with them a probability that these may
actually happen. Historical data, results and graphs obtained from both techniques can be
visualized through a web page. The two algorithms demonstrate that they are viable to
predict a seismic event, for example through the application of Neural Networks, the loss
of value of the validation data (17.64%) is less than those of the loss of value of the training
data (23.8%) which means that there is no overfitting, meaning, the process will have a
lower probability of failing to recognize new seismic events; while the Logistic Regression
algorithm obtained an accuracy of 72.25%, thus being a percentage greater than the 70%
minimum required to apply and the value of the ROC or AUC curve is approximately
70.4%, implying that the data above that value tend to be classified correctly since they get
closer to 1, the data will have a better classification. Taking into account the mentioned
results, it can be concluded that the techniques applied in this project are efficient when
predicting upcoming events based on historical data and that the use of machine learning
techniques are very useful to solve various predictive problems.
Keywords: Earthquakes, Prediction, Machine Learning, Neural Networks, Logistic
Regression, Python.
Authors: Alba Vega Daniel Alejandro
Calle Jara Javier Fernando
Tutor: Ing. Lorenzo Cevallos, M.Sc.
Tutor: Ing. Rosa Molina Izurieta, Msc.
-
1
INTRODUCCIÓN
La Tierra es un planeta activo, y prueba de ello son los huracanes, tsunamis,
sismos, entre otros, respecto a este último concepto, (CÓRDOVA ROSADO &
BRAVO ALVAREZ, 2015) sostienen que “un sismo es un fenómeno vibrátil que se
puede transmitir a través de un movimiento ondulatorio, liberando energía debido
al desplazamiento de las placas tectónicas, erupción volcánica, por ruptura de la
corteza terrestre o por otras causas”.
Estos constantes movimientos se los suelen llamar temblores y este término es
usado para calificar los sismos de regular intensidad, y en cuanto a su
equivalencia, “tienen una magnitud menor a 6, y no causan grandes daños, y la
palabra terremoto para los sismos de gran intensidad, y de mayor magnitud, que
conllevan efectos destructivos de construcciones realizadas por el hombre y/o
pérdidas de vidas humanas” (INPRES, 2016). A pesar de ello, frecuentemente se
denomina terremoto para calificar cualquier sismo ya que significa movimiento de
tierra.
Una de las características más destacables de un terremoto es su naturaleza
impredecible, es decir, estos se pueden dar en cualquier momento o lugar, y esto
afecta mucho a la población humana ya que, si dado el caso de que el terremoto
sea de gran magnitud, las pérdidas serían mayores sin una buena preparación,
en este aspecto, (Beci, 2018) señala lo siguiente:
La enorme inquietud que nos provoca la presencia de estos fenómenos
naturales y la incertidumbre de no poder determinar cuándo y dónde
ocurrirán, aunado a la poca difusión de estudios que contribuyan a informar
y orientar a la población sobre las causas y mecanismos que dan origen a
estos movimientos, dan pie a que personas sin escrúpulos. ajenas al dolor
humano en momentos tan difíciles, como son aquellos que acompañan a
la catástrofe, inventen y se empeñen en divulgar las historias y "teorías"
más descabelladas, sin base científica alguna, consiguiendo acrecentar 1a
confusión, el pánico y el miedo en la población.
Según lo mencionado anteriormente, se da a entender que tratar de predecir en
un pequeño plazo de tiempo y al instante es muy complicado, por lo tanto tener
una estimación a largo plazo es lo más factible, pero con la desventaja que solo
-
2
será de conocimiento leve de que sucederá un terremoto, pero no en qué
momento específico sucederá.
En base a lo ya mencionado, cuando sucede un sismo, se toman datos básicos
como su magnitud, profundidad, su zona, tipo de suelo, entro otros; todos estos
puntos dan a entender la gravedad y qué consecuencias puede ocasionar un
sismo, qué factores depende para llegar a dicho resultado; para todos estos datos
se aplicarán técnicas de Machine Learning (Aprendizaje Automático), la cual el
(Management Solutions, 2018) la define como un conjunto de métodos capaces
de detectar patrones en los datos de forma automática por medio de diversos
métodos estadísticos, que incluye desde el uso de los patrones detectados para
realizar predicciones o para realizar tipos de decisiones en entornos de
incertidumbre.
Las técnicas que se usarán son Regresión Logística y Redes Neuronales, las
cuales en base a datos tomados de los terremotos ocurridos en el Ecuador desde
1985 hasta el 2019 permitirán revelar cual es la probabilidad de que ocurra un
movimiento telúrico, los datos a considerar serán los sismos con magnitud de 4
en adelante ya que son los que más daños suelen provocar.
A continuación, se muestra la estructura del presente trabajo de titulación.
Capítulo I – El Problema. – Aquí se detalla todo lo relacionado al problema en
cuestión, sus causas y consecuencias, objetivos generales y objetivos específicos
que se pretenden cumplir al final de este proyecto.
Capítulo II – Marco Teórico. - Dentro de este capítulo se describe toda la
fundamentación legal y teórica que debe ser conocida por los autores del proyecto
para que en base a este conocimiento lo desarrollen con los debidos lineamientos.
Capítulo III – Metodología de la investigación. - Se determina la factibilidad de
la propuesta planteada para solucionar el problema, contiene factibilidad
operacional, técnica, legal y económica, el metaanálisis, los procedimientos de la
investigación y el análisis de los modelos de Machine Learning.
Capítulo IV – Resultados, Conclusiones y Recomendaciones. - Se presenta
los resultados obtenidos para cada uno de los objetivos planteados. Se tiene
también las conclusiones y recomendaciones como tal del aplicativo web y de los
modelos planteados.
-
3
CAPÍTULO I
EL PROBLEMA
PLANTEAMIENTO DEL PROBLEMA
Se denomina sismo al movimiento repentino del suelo cuya intensidad es
sumamente variable, en los últimos años en el Ecuador el número de
sismos se ha incrementado considerablemente esto debido a liberación de
energía que se ha dado tras el fracturamiento de las placas tectónicas
siendo el terremoto del 16 de abril del 2016 el que más ha afectado a las
familias ecuatorianas y la economía local. Este hecho al ser un fenómeno
natural es imposible predecir, sin embargo, en la actualidad existen
técnicas basadas en Inteligencia Artificial, que ayuda a partir de datos
históricos poder determinar la probabilidad de ocurrencia del mismo.
Tener un margen de probabilidad de cuándo podría ocurrir un sismo con
una magnitud considerablemente alta resulta extremadamente útil para
poder estar preparados y disminuir los desastres catastróficos que implica
la presencia de este fenómeno natural; al producirse un terremoto de gran
magnitud, especialmente en la noche, toma desprevenido a las personas y
esto produce como consecuencia, pérdidas estructurales y/o humanas. En
la sociedad se han creado alarmas que suenan solo unos instantes antes
de que suceda un movimiento telúrico, pero aun así no es suficiente para
evitar las pérdidas ya mencionadas.
También se ha hecho uso de varias técnicas de disciplinas científicas para
poder hallar la forma en como predecir un terremoto, pero no se ha llegado
a una conclusión en específico.
-
4
UBICACIÓN DEL PROBLEMA EN UN CONTEXTO
La República del Ecuador se encuentra ubicado en el continente
americano, más específicamente en la parte al noreste de América del sur,
sus límites son: al este y al sur con la Republica de Perú, al norte con la
República de Colombia y al oeste con el Océano Pacífico.
Gráfico 1: Representación del origen de un sismo
Elaboración: Daniel Alba y Javier Calle.
Fuente: Google Maps.
Uno de los principales problemas con los que debe lidiar las personas no
solo del Ecuador sino de cualquier parte del mundo es que un sismo puede
ocurrir en cualquier momento y hasta la actualidad aún no se ha podido
desarrollar ninguna técnica o instrumento que permita predecir cuando y
donde va a ocurrir, esto ha causado que a lo largo de todos estos años
existan infinitas pérdidas no solo materiales sino también humanas.
Potencias mundiales como Estados Unidos y otros países siguen
investigando la manera de lograr pronosticar la ocurrencia de un sismo con
un lapso lo suficientemente amplio para lograr salvar la mayor cantidad de
vidas humanas posibles, pero hasta ahora no han tenido éxito.
-
5
Por todos los motivos ya antes mencionado se han tomado los factores más
importantes de los sismos ocurridos a lo largo de estos años en la republica
del Ecuador con el fin de utilizarlos y analizarlos para poder pronosticar la
probabilidad de ocurrencia de sismo y así lograr que las personas estén
prevenidas y por ende salvar la mayor cantidad de vidas posibles.
SITUACIÓN CONFLICTO NUDOS CRÍTICOS
Debido a que el territorio ecuatoriano se encuentra ubicado en el Cinturón
de Fuego del Pacifico, una zona que abarca algunos países como Chile,
Bolivia, Ecuador, México entre otros, es susceptible a formar parte de
frecuentes sismos de gran magnitud esto debido a que las placas
tectónicas que reposan sobre el océano pacifico convergen lo cual causa
fricciones entre ellas provocando a su vez que esta energía deba ser
liberada de golpe haciendo que la parte superior de la superficie terrestre
se mueva bruscamente en un fenómeno conocido como sismo.
Los sismos de gran magnitud normalmente causan grandes daños sociales
ya que dejan a familias destruidas, niños huérfanos, ancianos sin hogar,
colapso de edificaciones estructurales, etc. el gobierno por lo general crea
albergues en las zonas donde el impacto del sismo haya sido de mayor
magnitud, sin embargo muchas de las veces no cuentan con todos los
servicios básicos que una persona necesita, las cuales por lo general han
perdido sus cosas, (Salazar Arbelaez, 2018), agrega “ponen en evidencia
la vulnerabilidad de los sistemas de salud y crean necesidad de adoptar
una política de Estado que ponga en práctica un plan de contención y
mitigación de daños a la salud”.
Por todo lo mencionado en el párrafo anterior es que este trabajo de
investigación pretende ayudar a las personas ecuatorianas a que no
pierdan todas su cosas materiales y familiares en movimientos telúricos
fuertes puesto que, mediante las técnicas a usar, las personas podrán
están prevenidos de la probabilidad de ocurrencia de dichos fenómenos
naturales.
-
6
CAUSAS Y CONSECUENCIAS DEL PROBLEMA
Con el objetivo de una mejor comprensión por parte del lector sobre las
causas y consecuencias del problema principal y todas sus derivaciones
presentes a lo largo de esta investigación se utilizará una tabla divisoria
para presentar la información.
Tabla 1: Causas y Consecuencias del Problema
Causas Consecuencias
No contar con ningún portal web
que pronostique la probabilidad
de ocurrencia de un sismo de gran
magnitud.
Las personas están completamente
desprevenidas acerca de un
movimiento telúrico de gran
magnitud
Los terremotos pueden ocurrir en
cualquier momento ya sea durante
el día o la noche
Pérdida de enseres materiales, así
como vidas humanas.
Los movimientos telúricos pueden
llegar a ser de magnitudes
extremadamente altas.
Al ser una magnitud alta, los
daños causados pueden ser de
igual proporción.
Los sismos fuertes siempre vienen
acompañados de réplicas cuyas
magnitudes son inciertas.
Las personas tienen miedo de
regresar a sus casas porque no
saben si existe riesgo de réplicas
fuertes.
Los sismos de magnitudes fuertes
suelen causar muchos desastres
sobre todo en lugares que no
tienen construcciones
antisísmicas, y que están ubicados
en zonas donde se han registrado
varios eventos sísmicos.
Muchas personas pierden sus
casas y/o se quedan sin trabajo,
afectando en varias formas a la
macroeconomía de la nación.
Elaboración: Daniel Alba y Javier Calle
Fuente: Propia de la Investigación
-
7
DELIMITACIÓN DEL PROBLEMA
A continuación, se presenta una tabla con la delimitación del problema de
la presente investigación en el aspecto, área y el campo.
Tabla 2: Delimitación del Problema
Campo: Biotecnología, Biodiversidad y Sostenibilidad de los Recursos
Naturales
Área: Herramientas biotecnológicas aplicados a los recursos naturales y
agropecuarios.
Aspecto: Investigación, Desarrollo de software y Bioinformática
Tema: Aplicación de técnicas de Machine Learning basado en información
sísmica para profundizar la probabilidad de terremotos mediante el
uso de Regresión Logística y Redes Neuronales.
Elaboración: Daniel Alba y Javier Calle.
Fuente: Propia de la investigación.
FORMULACIÓN DEL PROBLEMA
¿El uso de técnicas de Inteligencia Artificial tal como Machine Learning,
ayudará a determinar una probabilidad de ocurrencia de un sismo mediante
datos históricos?
EVALUACIÓN DEL PROBLEMA
Después de haber realizado una minuciosa investigación acerca de cada
una de las cuestiones involucrados dentro del problema se ha concluido
que el presente trabajo investigativo cumple con los aspectos que se
detallan a continuación:
Factible: Este proyecto es viable, ya que se usará técnicas de Machine
Learning y datos que se han recolectado de los terremotos ocurridos en el
-
8
Ecuador a lo largo de su historia, para calcular la probabilidad de que ocurra
uno.
Concreto: El presente trabajo permitirá demostrar que los resultados
obtenidos al usar diferentes técnicas de Machine Learning para calcular la
probabilidad de que se avecina un terremoto son muy similares.
Claro: Este proyecto consiste en aplicar técnicas de Machine Learning y
comparar los resultados de sus análisis, seleccionar cual es la más
conveniente para poder tener una probabilidad más cercana de que ocurra
un sismo mediante los datos recolectados por otros terremotos ocurridos
anteriormente en el país.
Evidente: En este aspecto se logrará obtener una conclusión más cercana
en el estudio de los movimientos sísmicos, determinar las causas y cuáles
serían las consecuencias según el entorno en el que se suscite.
Delimitado: En este análisis se usan las técnicas de Machine Learning que
son Regresión Logística y Redes Neuronales, en las cuales analizarán
datos históricos de terremotos, con el objetivo de comparar los resultados
finales y visualizar cuál es el que se acerca más a la conclusión esperada.
Variable: Dentro del proyecto de titulación se detallan cuáles son las
variables que se toman después de un sismo, sus causas, la magnitud,
profundidad, epicentro, localización, y definir también sobre la disciplina
Machine Learning y los modelos a usar: Regresión Logística y Redes
Neuronales.
Identifica los productos esperados: Los resultados que se pretenden
obtener al culminar la presente investigación es mostrar en una página web
cual es la probabilidad de ocurrencia de un sismo dentro del Ecuador
empleando los modelos de Regresión Logística y Redes Neuronales los
cuales serán entrenados por los datos recopilados de los sismos más
relevantes ocurridos en el Ecuador en las últimas décadas.
-
9
OBJETIVOS
Objetivo General
Pronosticar la probabilidad de ocurrencia de un sismo mediante el uso de
Machine Learning y ciertas técnicas probabilísticas para reducir los
impactos negativos tanto sociales como estructurales que deja este tipo de
fenómeno natural dentro del Ecuador.
Objetivos Específicos
1. Recopilar datos históricos acerca de los sismos ocurridos en el
territorio ecuatoriano en un periodo de tiempo.
2. Hacer uso de las técnicas de Machine Learning para determinar la
probabilidad de ocurrencia de un terremoto.
3. Determinar la exactitud de una prueba diagnóstica basada en redes
neuronales y regresión logística para encontrar el punto de corte de
una escala continua en el que se alcanza la sensibilidad y
especificidad más alta.
4. Analizar los atributos de los datos históricos sobre los terremotos en
el Ecuador que contengan las características necesarias para ser
tomados en consideración en la aplicación de las técnicas de
Machine Learning.
5. Desarrollar una página web para visualizar mediante gráficas
estadísticas la probabilidad de ocurrencias de estos eventos
sísmicos y así permanecer en un estado de alerta continua.
ALCANCES DEL PROBLEMA
• La recopilación de los datos será realizada por medio de páginas
web que se dedican a registrar este tipo de eventos naturales, tales
como El Programa de Riesgos de Terremotos del Servicio Geológico
-
10
de los Estados Unidos (USGS) y del Instituto Geofísico de la Escuela
Politécnica Nacional (IGEPN).
• Los resultados de la probabilidad de que ocurra un sismo serán
obtenidos aplicando Redes neuronales y Regresión Logística.
• Se usarán gráficos estadísticos de barras, de frecuencia, de
dispersión, histogramas, matriz de confusión y curva ROC para
poder visualizar los resultados obtenidos de las dos técnicas de
Machine Learning y así llegar a una conclusión.
• El análisis de atributos será posible mediante la aplicación del
metaanálisis la cual permite sintetizar información obtenida de
papers y revistas científicas como Springer, Scielo entre otras.
• La página web será desarrollada haciendo uso del lenguaje de
programación Python y los gráficos estadísticos serán realizados
mediante la información almacenada en la base de datos.
• En los datos históricos de los eventos sísmicos en el Ecuador, solo
serán tomados en cuenta las regiones Costa, Sierra y Oriente,
excluyendo la región Insular o Galápagos, por falta de datos
concretos y fiables.
JUSTIFICACIÓN E IMPORTANCIA
A pesar de que el Ecuador no es un país desarrollado o una potencia
mundial como si lo son otros países, eso no quiere decir que las personas
que habitan el territorio ecuatoriano no puedan desarrollar técnicas o
mecanismos que ayuden a sus habitantes a tener una vida más tranquila,
en vista de lo mencionado al observar que en el país no existe ninguna
página web que utilicen modelos probabilísticos y de inteligencia artificial
que permitan tener una estimación de la probabilidad de ocurrencia de un
sismo, se decidió desarrollar esta investigación con el objetivo de ayudar
a que los habitantes del territorio ecuatoriano puedan tener una vida un
poco más serena.
-
11
El presente proyecto se enfocará en investigar cuales son los principales
factores que intervienen en un sismo para poder entender su
comportamiento y así poder predecir la probabilidad de ocurrencia del
mismo y mostrarlo en un sitio web, todo esto se logrará a través de estudiar
los movimientos telúricos más significativos que se han producido en el
Ecuador a lo largo de su historia.
Este estudio es importante y se realiza debido a que en los últimos años el
movimiento de la corteza terrestre en territorio ecuatoriano ha sido más
frecuente lo que ha provocado gran preocupación en los habitantes del
Ecuador quienes en su mayoría observaron en el terremoto ocurrido el 16
de abril del 2016 que las construcciones de sus viviendas se tornaron muy
vulnerables ante movimientos telúricos de gran magnitud lo que pone en
peligro sus vidas y sus pertenencias materiales.
Finalmente, el presente trabajo también es de mucha importancia debido a
que permitirá disminuir los impactos negativos que dejan los sismos a gran
escala, por que las personas al tener libre acceso a esta página web podrán
estar preparadas para evacuar dependiendo del grado de probabilidad de
ocurrencia que arrojen los modelos probabilísticos empleados para
pronosticar este cataclismo.
METODOLOGÍA DEL PROYECTO
Las técnicas y métodos usados para la recopilación, clasificación y análisis
de datos son diversos, la investigación bibliográfica y el metaanálisis son
los principales métodos empleados.
Metaanálisis: Técnica empleada para para el análisis cuantitativo de los
artículos científicos.
Investigación Bibliográfica: Todos los datos necesarios para la
investigación serán recopilados de bases de datos y artículos científicos.
-
12
Investigación Cuantitativa: Los datos recolectados serán clasificados en
base a técnicas estadísticas de distribución de frecuencias para poder
realizar el entrenamiento de los datos
Investigación Deductiva: Los datos generales recopilados serán
procesados para obtener resultados específicos.
Presentación de la propuesta: A través del entrenamiento de los modelos
se presenta la página web la cual contiene todos los datos históricos
recolectados, así como los resultados obtenidos.
-
13
CAPÍTULO II
MARCO TEÓRICO
En el presente capítulo se detallará los antecedentes que motivaron a llevar
a cabo esta investigación, también se realizará la revisión de la literatura
con respecto a los sismos ocurridos en el Ecuador a lo largo de su historia
y de las principales consecuencias que los mismos implican, para finalizar
con este capítulo se definirán los conceptos más importantes a usar dentro
del presente trabajo.
ANTECEDENTES DEL ESTUDIO
En los últimos años, el Ecuador ha sido víctima de muchas actividades
sísmicas, las cuales se han ido incrementado conforme pasan los años,
este fenómeno natural suele causar muchos daños puesto que provoca no
solo que las personas pierdan sus seres queridos, sino también muchas de
las veces también deja a las personas en la calle sin ninguna esperanza de
vida, los más preocupante de todo es que estos cataclismos llegan en el
momento menos esperado, sin dar tiempo a las personas de salvar cosas
importantes para ellas y esto incluye salvar su propia vida, algunos países
más desarrollados como Estados Unidos han desarrollado mecanismos
como alarmas sísmicas que alertan a sus ciudadanos la posible ocurrencia
de un movimiento telúrico, sin embargo esta alarma suena solo unos
instantes antes de que ocurra este fenómeno natural sin dar tiempo a las
personas de ponerse a salva en un lugar seguro.
Hasta la actualidad según la (BBC-Mundo, 2017) los cuatro terremotos con
mayor magnitud registrado en la historia de la humanidad son los
siguientes:
-
14
1. El ocurrido en la ciudad de Valdivia (Chile) que tuvo una magnitud
de 9,5 en la escala de Richter, este fenómeno natural aconteció el
22 de mayo de 1960 dejando como resultados alrededor de dos mil
muertos y más de dos millones de personas damnificadas.
2. El segundo lugar lo ocupa el terremoto ocurrido en Arica que se
ubica en la parte norte de Chile, sucedió el 13 de agosto de 1868
cuya magnitud fue de 9 en la escala de Richter, cabe recalcar que
cuando aconteció este cataclismo la ciudad de Arica pertenecía a la
República de Perú.
3. El tercer puesto también le pertenece a Chile, esta vez el movimiento
sísmico tuvo lugar el 27 de febrero del 2010 en la parte sur de Chile.
Según datos oficiales el número de muertos llegó hasta los 500 y el
número de personas damnificadas ascendió hasta los dos millones.
4. Por último, se tiene el terremoto acontecido en el Ecuador, el cual
ocurrió el 31 de enero de 1906 entre la frontera ecuatoriana y la
frontera de Colombia cuya magnitud fue de 8,8 en la escala de
Richter. La provincia que más afectada se vio por este inesperado
suceso fue Esmeraldas, esto debido a que este fenómeno natural
provocó un tsunami en dicha provincia el cual dejó completamente
devastado al pueblo de Rio Verde, en aquel entonces se calculó que
la cifra de muertos se encontraba entre 500 y 1.500 personas, (BBC-
Mundo, 2017).
Como se puede dar cuenta los terremotos más devastadores registrados
en el planeta se encuentran en América Latina, incluso uno de ellos ocurrió
en el Ecuador, lo cual es motivo de preocupación porque quiere decir que
se encuentra ubicado en un territorio muy inestable, también es señal de
que el peligro es constante porque no se sabe en qué momento puede
llegar un nuevo sismo y arrasar con todo lo que se tiene, sin otorgar tiempo
de salvar cosas importantes o incluso, salvar la propia vida.
-
15
A continuación, se muestra un gráfico que representa los sismos ocurridos
(antes mencionados) a través de la historia y el lugar donde acontecieron
los mismos.
Gráfico 2: Magnitudes de los sismos ocurridos
Elaboración: Daniel Alba y Javier Calle.
Fuente: BBC, 2017.
Que un terremoto tenga una magnitud considerablemente alta no significa
que sea el más catastrófico, esto es fácil de demostrar porque si bien
anteriormente se observó que los dos sismos con mayor magnitud
registrados en la historia de la humanidad fueron los ocurridos en Chile, sin
embargo los terremotos más mortíferos según el sitio web (elPeriódico) son
los ocurridos en China, por una parte se tiene el sismo acontecido el 23 de
enero de 1556 en la ciudad de Shansi (China) en donde hubo alrededor de
830.000 víctimas, porcentualmente hablando se puede decir que en
algunos puntos del país se perdió hasta el 60% de la población. Por otra
parte está el cataclismo ocurrido en este mismo país pero esta vez en la
ciudad de Tangshang el 27 de julio de 1976 cuyas cifras ascendieron hasta
las 255.000 víctimas, aunque en este punto es importante resaltar que el
Centro Internacional de Sismología (ISC) llegaron a pronosticar que la cifra
de víctimas que dejó a su paso este hecho llegó hasta los 655.000 personas
(elPeriodico, 2017)
9,5
9
8,8 8,8
VALDIVIA (CHILE) ARICA (CHILE) CENTRO-SUR DE CHILE ESMERALDAS (ECUADOR)
Magnitud
Magnitud
-
16
En lo que se refiere a Latinoamérica los dos sismos registrados que más
muertos han dejado son los acontecidos primero en Haití el 12 de enero
del 2010 cuya cifra asciende a las 316.000 víctimas a pesar de que la
magnitud fue solamente de 7 en la escala de Richter y segundo es el
terremoto acontecido en Perú el 31 de mayo de 1970 cuyo saldo fue de
66.000 víctimas con una magnitud de 7,8 en la escala de Richter (Abad,
Blanco, & Alameda, 2017)
Gráfico 3: Número de víctimas que han dejado los terremotos a nivel mundial y a nivel de
América Latina
Elaboración: Daniel Alba y Javier Calle.
Fuente: BBC y elPeriódico 2017.
Como se puede observar los sismos ocurridos a través de la historia son
muy preocupantes y el número de víctimas y damnificados que deja a su
paso es muy considerable, por ende es importante empezar a tomar
medidas que ayuden a las personas a tener un poco más de tranquilidad
en sus vidas y sobre todo ayude a disminuir el número de impactos
negativos que dejan estos fenómenos naturales a su paso, que si bien son
desastres de la naturaleza que no se pueden predecir, pero si se puede
aplicar técnicas que ayuden a tener hasta cierto punto una noción de cuál
es su probabilidad de ocurrencia para estar pendientes y tomar las debidas
precauciones.
830000
655000
316000
80000
SHANSI (CHINA) TANGSHAN (CHINA) PUERTO PRINCIPE (HAITÍ)
LOS ANDES (PERÚ)
Víctimas
Víctimas
-
17
Según el diario El Universo en su publicación realizada el 17 de abril del
2016 en el Ecuador los dos sismos más potentes registrados desde que
existen sismógrafos son:
1. El ocurrido en enero de 1906 entre las fronteras de Ecuador y
Colombia muy cerca de Esmeraldas cuya magnitud fue de 8,8 y el
número de víctimas mortales ascendió hasta las 1.500 personas.
2. El que devastó la ciudad de Riobamba el 4 de febrero de 1797 cuya
magnitud alcanzó hasta los 8,3 en la escala de Richter y el número
de muertos llegó hasta las 31.000 víctimas. Es importante mencionar
que este terremoto es el más mortífero que ha ocurrido en el
Ecuador hasta la actualidad puesto que aparte de afectar a la
provincia de Tungurahua, también afectó considerablemente a las
provincias de Chimborazo, Cotopaxi, Bolívar y Pichincha.
(elUniverso, 2018).
Gráfico 4: Número de muertos que ha dejado los sismos más fuertes ocurridos en el Ecuador
Elaboración: Daniel Alba y Javier Calle.
Fuente: Diario el Universo, 2018.
1500
31000
ESMERALDAS RIOBAMBA
Víctimas
Víctimas
-
18
Gráfico 5: Magnitud de los sismos más fuertes ocurridos en el Ecuador
Elaboración: Daniel Alba y Javier Calle.
Fuente: Diario el Universo, 2018.
Como se puede ver en las gráficas anteriores en el Ecuador al igual que
otros países también se dan terremotos de grandes magnitudes, es decir
el territorio ecuatoriano no está exento de sismos y mucho menos de todas
las consecuencias que traen los mismos por lo que es imperativo y muy
necesario empezar a buscar soluciones que ayuden a las personas a estar
prevenidas y alertas en caso de que ocurran este tipo de desastres
naturales para que puedan al menos salvar vidas.
Terremoto del 16 de abril del 2016
Este inesperado hecho ocurrido hace algunos años atrás dejo
conmocionado al Ecuador, especialmente a las provincias de Manabí y
Esmeraldas, aunque la ciudad de Guayaquil también se vio afectada pero
no en igual proporción que Pedernales y Muisne. Según el informe emitido
por la (Secretaría de Gestión de Riesgos del Ecuador, 2016):
El sismo de M 7.8 en el norte de Ecuador se produjo como resultado
de un movimiento de capas tectónicas de tipo superficial en el borde
de la Placa de Nazca y la Placa del Pacífico. En el epicentro la placa
8,8
8,3
ESMERALDAS RIOBAMBA
Magnitud
Magnitud
-
19
de Nazca se subduce en dirección Este, debajo de la Placa de
Sudamérica a una velocidad de 61mm al año. Por la presión
existente se liberó presión de la placa primaria generándose una
mega ruptura entre las dos placas.
Ante la magnitud de este fenómeno natural ocurrido el estado ecuatoriano
tuvo que emitir un estado inmediato de excepción en las provincias de
Santo Domingo, Esmeraldas, Manabí, Los Ríos, Guayas y Santa Elena,
con el objetivo de mantener la calma y el orden entre la ciudadanía
ecuatoriana. A pesar de que las principales provincias afectadas limitan con
el Océano Pacifico no hubo alerta de tsunami sin embargo si se ordenó la
evacuación inmediata de sus habitantes por motivos de seguridad.
Entre las principales afectaciones que tuvieron las provincias involucradas
se pueden citar las siguientes:
1. Manabí
• Las comunicaciones se perdieron entre varios cantones de la
zona.
• El puente de las Caras tuvo serias afectaciones.
• Los centros de salud seguían funcionando, pero existían
muchas limitaciones para los mismos.
• La electricidad también se vio afectada en la mayor parte de
esta provincia.
• La población fue evacuada inmediatamente a zonas
elevadas.
• Hubo un total de 12 hoteles que tuvieron que ser demolidos
porque serios daños estructurales y 23 hoteles colapsaron
por el impacto del sismo.
2. Esmeraldas
• 110 viviendas colapsaron.
• Los hospitales trabajaron a pesar de que no se disponía con
los servicios de electricidad y telefonía.
-
20
• La refinería de esmeraldas tuvo que parar sus operaciones
por un incendio causado por el terremoto.
• Las personas de las zonas costeras también tuvieron que ser
evacuadas de forma inmediata.
3. Guayas
• El puente ubicado frente a la Universidad Laica Vicente
Rocafuerte en la Avenida de las Américas colapsó por el
impacto del sismo, este hecho dejó dos víctimas mortales.
• 243 edificaciones se vieron afectadas, aunque los daños
fueron mínimos (Moncayo y Sarmiento, 2018, p. 22).
Como parte del proyecto, un tema importante es el uso de las técnicas de
Machine Learning, en el Ecuador en la última década, el uso de la
Inteligencia Artificial se ha hecho notable en el país. Bancos, operadoras
de teléfono y universidades están empleado un chatbot como servicio al
cliente, no solo en páginas web, sino también en redes sociales como
WhatsApp. Machine Learning es una rama de la inteligencia artificial en la
cual se busca que las computadoras aprendan nuevos términos, palabras
nuevas, para así aprender su significado y usarlas en otra ocasión y de esta
manera hacer mucho mejor la experiencia del usuario y poder minimizar el
número de errores al mínimo.
Por otra parte, actualmente el aprendizaje automático es usado en
marketing y las empresas para predecir cómo serán sus ventas e ingresos
en los días posteriores, identificar clientes potenciales según sus gustos o
preferencias, para así elaborar un plan u ofertas para atraerlos, aunque su
uso por ahora se limita a esto, hay varios proyectos que buscan usarla con
otros fines, sin embargo aún están en desarrollo, como es mencionado
según (Rodríguez, 2019) para el periódico EL COMERCIO, en la que un
equipo de ingenieros ecuatorianos, desarrollaron un sistema, que permite
la posibilidad que un usuario pueda replicar los movimientos que hace con
sus manos en las manos de su compañero, sin que este pueda hacer nada
para evitarlo.
-
21
Otro punto importante en la presente investigación es el uso de Redes
Neuronales y Regresión Logística en el Ecuador, estas dos técnicas son
usadas en muchas actividades que ayudan a las empresas a predecir
futuros conflictos con la finalidad de estar preparados con planes de
contingencia que disminuyan los impactos de los problemas que se puedan
presentar. Por ejemplo, Peña y Orellana en su investigación “Red Neuronal
para clasificación de riesgo en cooperativas de ahorro y crédito” señalan
como esta técnica de Machine Learning puede ser usado en el
descubrimiento temprano de problemas futuros en cooperativas de ahorro
y crédito (COAC) puesto que “ayuda a presentar un porcentaje de precisión
aceptable, para clasificar una COAC dentro de un nivel de riesgo con base
al valor de sus índices financieros” (Peña y Orellana, 2018, p. 121).
Por otro lado, la técnica de regresión logística la cual se originó en la
década de los 60 con el trabajo de Smith, Cornfield y Gordon con el objetivo
de convertirse en una técnica multivariada para realizar análisis explicativos
y predictivos que permita modelar la ausencia o presencia de un evento
(García, Plaza y Mite, 2016) también ha sido muy importante en el Ecuador
ya que ha sido usada en muchos sectores ganaderos, agrícolas,
ambientales, etc.
Este método por lo general es utilizado cuando se desea saber la
probabilidad de ocurrencia de un hecho como puede ser ¿Cuál es la
probabilidad de que llueva?, ¿Cuál es la probabilidad de que un cliente elija
un determinado supermercado para realizar sus compras?, entre otros
muchos cuestionamientos, siendo 1 el valor máximo que puede tomar la
variable y 0 el valor mínimo.
Un claro ejemplo es el que Valencia y Bonifaz presentan en su artículo
“Modelo de Regresión Logística Multinomial para medir las preferencias
que tienen los clientes en el sector farmacéutico: caso Ambato, Ecuador”
en el cual muestran como mediante esta técnica probabilística y en base a
unas variables recopiladas se puede pronosticar la probabilidad de que un
-
22
cliente elija una determinada farmacia ubicada en un sector específico de
Ambato.
Esto a su vez permite realizar simulaciones a las farmacias para indagar
cuales pueden ser sus futuras demandas, conocer en que pueden mejorar
o saber cómo pueden convertirse en una farmacia competitiva (Valencia y
Bonifaz, 2018, p. 318).
FUNDAMENTACIÓN TEÓRICA
Los sismos
A pesar de que en la actualidad existen muchos conceptos acerca de los
sismos, CINAPRED (2014) los define como:
Un sismo es un fenómeno que se produce por el rompimiento repentino
en la cubierta rígida del planeta llamada corteza terrestre. Como
consecuencia se producen vibraciones que se propagan en todas
direcciones y que percibimos como una sacudida o un balanceo con
duración e intensidad variables. (p. 2)
Cualquier parte del planeta tierra es susceptible a sentir movimientos
violentos de la corteza terrestre puesto que no existe ningún rincón en la
tierra en donde se pueda afirmar que se está a salvo de un temblor. Sin
embargo, algunos lugares son más propensos a ser víctimas de este
fenómeno natural, es decir estos lugares reciben este hecho con mayor
intensidad y con una mayor frecuencia. Una muestra de ello es Baja
California en Estados Unidos que por el hecho de estar ubicada entre la
Placa del Pacífico y la Placa de Cocos los sismos son frecuentes y de
grandes magnitudes en cambio Brasilia que es la capital de Brasil se
encuentra en una zona en donde los temblores casi pasan desapercibidos
por su gente, este es un claro ejemplo de lo mencionado anteriormente.
(Ramírez, 2017)
-
23
Por lo general el punto en donde se produce un sismo suele ser dividido en
dos partes:
1. Epicentro: Es el lugar sobre la superficie terrestre en donde se
originó el movimiento sísmico, en este lugar es donde se siente con
mayor intensidad el desplazamiento de la corteza terrestre.
2. Hipocentro o Foco: Es el sitio bajo la superficie terrestre en donde
se originó el movimiento telúrico.
Gráfico 6: Representación del origen de un sismo
Elaboración: Agencia de Noticias de a U. Nacional.
Fuente: El Espectador, 2019.
Cuando se produce un sismo es importante saber identificar si es un
temblor leve o un terremoto que pude dejar consecuencias devastadoras,
todo ello se sabe en base a la magnitud del mismo la cual se puede definir
como la liberación de energía que se produce en el interior de la tierra al
momento de suceder el sismo, también se debe tener en cuenta que el
proceso de subducción de la placa de Nazca bajo el territorio Sudamericano
es uno de los principales responsables del alto índice de sismicidad
existente en dicho territorio (Velarde y Tavera, 2016).
-
24
Para medir las magnitudes existen instrumentos especiales conocidos
como sismómetros los cuales son muy precisos a la hora de calcular la
intensidad de cualquier movimiento telúrico, estos instrumentos suelen
estar generalmente en centros sismológicos y desde ahí se envían reportes
señalando que tan grande fue la magnitud del sismo detectado. Otra forma
de calcular la intensidad de un movimiento de la corteza terrestre es a
través de dos variables: la amplitud de las ondas sísmicas y la duración del
mismo; tomando en cuenta la magnitud de un sismo, se puede saber si este
fenómeno natural puede convertirse en un terremoto o ser simplemente un
temblor, ya que en caso de ser este último, significa que el riesgo de causar
daños en el lugar donde ocurre es mínimo.
Tabla 3: Escala abreviada de Richter
MAGNITUD DENOMINACIÓN
1 a 2.9 Sismos Menores
3 a 3.9 Sismos Pequeños
4 a 4.9 Sismos Ligeros
5 a 5.9 Sismos Moderados
6 a 6.9 Sismos Fuertes
7 a 7.9 Sismos Mayores
Mayores a 8 Sismos Destructivos
Elaboración: Daniel Alba y Javier Calle.
Fuente: Ciencias de la Tierra al Servicio de la Sociedad
-
25
Licuefacción, derrumbes y deslizamientos
La licuefacción de un terreno suele denominarse al proceso en el cual el
suelo pasa de estar en estado sólido a un estado líquido, normalmente pasa
en suelos húmedos, arenosos, arcillosos o granulados, este fenómeno
ocurre al momento de que la tierra es sometida a movimientos bruscos.
Entre las consecuencias que esto trae se tienen las siguientes:
• Pérdida parcial o total de cultivos.
• Derrumbamiento de edificaciones.
• Pérdida de vidas humanas.
• Pérdidas materiales.
• Derrumbes y deslizamientos
Tsunamis o maremotos
Los maremotos también conocidos como tsunamis son olas las cuales se
encuentran cargadas de energía extremadamente altas provocando a la
vez que su tamaño sea variable, suelen aparecer ante la presencia de
grandes fenómenos naturales como lo son terremotos o erupciones
volcánicas. Una ola se genera por la atracción gravitatoria de la luna o el
sol, también puede producirse por el viento, sin embargo, un maremoto es
provocado por los bruscos deslizamientos de agua cuya cantidad
transportada es muy superior a la que transporta normalmente. Una de las
grandes ventajas que se tiene con los tsunamis es que se pueden
pronosticar con algunas horas de antelación (Lovholt, Bondevik, Laberg,
Kim y Boylan, 2017).
Cinturón de Fuego en el Pacífico
También conocido como el Anillo de Fuego del Pacífico, se encuentra
ubicado en las costas del océano Pacífico, su principal característica es que
-
26
en este lugar existe mucha actividad sísmica y volcánica debido a que se
encuentra situado sobre varias placas tectónicas las cuales tienen
constante fricción llenándolas de tensión que después debe ser liberada
provocando constantes sismos. Entre los principales países que se ven
afectados por el cinturón de fuego se tienen a los siguientes: Perú, Chile,
Bolivia, Argentina, Colombia, Ecuador, Panamá, Costa Rica, El Salvador,
Nicaragua, Honduras, Guatemala, Canadá, México, Estados Unidos, entre
otros. (Gringer, 2018).
Gráfico 7: Cinturón de Fuego del Pacífico
Elaboración: Gringer.
Fuente: GeoEnciclopedia. ´
Como se puede observar el cinturón de fuego afecta principalmente a los
países de Sudamérica ya que atraviesa a gran parte de ellos por lo que se
debe estar en continua alerta y sobre todo de prevenidos en todo momento
por posibles eventos sísmicos que puedan llegar a causar daños sociales
y estructurales.
top related