“una arquitectura conceptual para el análisis de ... · resultados y discusión el árbol de...
TRANSCRIPT
“Una arquitectura conceptualpara el análisis de contenidossobre el aborto usando laplataforma Twitter"
Paolo R. Roldán Robles, Ana C. Umaquinga-Criollo, Janneth A. García-Santillán, Israel D. Herrera-Granda, Iván D. García-Santillá[email protected]
Universidad Técnica del Norte
16 de octubre de 2019 . Ibarra-Ecuador
Agenda
• Introducción
•Materiales y métodos
•Resultados y discusión
•Conclusiones y trabajo futuro
• La disponibilidad de información en internet: insumos en Twitter
• El Aborto en el Ecuador entre 2004 y 2014 fue de 431614 abortos [12]
• Permite contribuir a la toma de decisiones con respecto a lapolítica de salud pública entre otros.
• El crecimiento exponencial del tipo de datos: estructurados, noestructurados semiestructurados.
1. IntroducciónMotivación
• Conocer de manera técnica la opinión pública sobre el aborto en Ecuador, a partir del análisis de contenidos de los tweets enviados desde Ecuador a través de la plataforma de Twitter.
Objetivo
Materiales y métodos
• Autenticación: se creó una aplicación de Twitter con permisos de
desarrollador, se usó el IDE Spyder Python 3.6 de la plataforma Anaconda 3-
4.3.0.1 y se instaló la biblioteca tweepy.
• Recolección de datos: Usando la API Streaming de Twitter, se realizó la
descarga de tweets del 16 de agosto al 29 de septiembre de 2018. Para
limitar el territorio o el país, se utiliza el filtro de ubicación [9], [16]. Se obtuvo
un archivo JSON de 1721287 KB de tamaño, que contiene 344149 registros.
• Limpieza y Procesamiento de Datos:
Limpieza: Del archivo recibido, se eliminan los hashtags que no están
relacionados con el tema del aborto,
Procesamiento: El procesamiento se realizó manualmente, con una
investigación adecuada del origen de cada hashtag y su uso.
Materiales y métodos
• Modelado y Análisis:
Modelado La información resultante se procesó en dos categorías:
A favor del aborto (Aborto +) En Contra del aborto (Aborto -)
Análisis:
✓ Frecuencia de hashtags.
✓Menciones de Usuarios
✓ Porcentajes a Favor y en Contra: Usando los clasificadores Árbol de decisiones y Naive Bayes
✓Ubicaciones: Usando el servicio Nominatim de OpenStreetMap en la versión 1.11.0 de la
biblioteca de geopy, que ofrece las mismas funcionalidades que las APIS de Google Maps pero
de forma gratuita
• Presentación de Resultados
Materiales y métodos
Resultados y discusiónHashtags Número de
mencionesA favor
(Aborto+)En contra (Aborto-)
1. #salvemoslas2vidas 12480 X
2. #abortolegalya 9467 X
3. #sialavida 5270 X
4. #28s 4102 X
5. #noalaborto 3306 X
Algoritmo Aplicado A favor(Aborto+)
En Contra(Aborto-)
1. Árbol de Decisión 40.7% 59.3%
2. Naive Bayes 44.6% 55.4%
Promedio Total 42,65% 57,35%
Top 5 Hashtags
Resultados por Algoritmo y en promedio
Resultados y discusión
Menciones diarias de Tweets Mapa de Calor
Nubes de Palabras
Cuentas de Usuarios hashtags
Resultados y discusión
Resultados y discusión
El árbol de decisión (97.9%) superó el Clasificador de NaiveBayes en precisión (79.1%), coincidiendo con otro estudio en lacomparación de clasificadores [20], lo que contribuye con unpunto de referencia confiable.
Si se requieren estudios sobre hashtags específicos [11] encuanto al feminicidio e ideología de género, debe considerarse eluso de: #niunamenos y #conmishijosnotemetas,respectivamente; mientras que, para otros estudios sobre eltema del aborto: #salvemoslasdosvidas y #abortolegalya,porque fueron los más utilizados en este estudio.
Conclusiones
• En Ecuador los usuarios de Twitter, muestra el 40.7% a favor del
aborto y el 59.3% contra el aborto, respaldado por el 97.9% de
precisión del árbol de decisión.
• Existe una estrecha relación entre los hashtags utilizados con el
texto, excepto, en algunos casos donde los hashtags se usan para
mostrar oposición.
Trabajo Futuro
• Se recomienda una investigación
comparativa del mismo tema, y así
determinar si los porcentajes han
cambiado o si existen nuevas
tendencias. Adicional, se sugiere
considerar redes sociales como
Facebook e Instagram.
Referencias9. KlokanTech. (2017). BoundingBox. Retrieved August 12, 2018, from
https://boundingbox.klokantech.com/
11. Niklander, S. (2017). Content Analysis on Social Networks: Exploring the #Maduro
Hashtag. 5. https://doi.org/10.1109/ICCNI.2017.8123803
12. Ortíz, E. (2017). Redacción Médica. Retrieved June 29, 2019, from
https://www.redaccionmedica.ec/secciones/salud-publica/el-85-de-los-abortos-
registrados-en-el-ecuador-son-de-causas-desconocidas-90319
16. Sogo, J. G. (2016). Lingẅars. Retrieved February 10, 2019, from
http://lingwars.github.io/blog/twitter-stream.html
20. Vila, Dayana; Cisneros, Saúl; Granda, Pedro; Ortega, Cosme; Posso-Yepez, Miguel;
García-Santillan, I. (2019). Detection of Desertion Patterns in University. Springer Nature
Switzerland AG 2019, 10. https://doi.org/10.1007/978-3-030-05532-5_31
GraciasPaolo R. Roldán Robles , Ana C. Umaquinga-Criollo, Israel D. Herrera-Granda , Iván D. García-Santillán.
[email protected] [email protected] [email protected] [email protected]
Universidad Técnica del Norte
Janneth A. García-Santillán
Unidad Educativa Juan Pablo II