Balotaje Argentina 2015
Demostración Big Data:
HPE Vertica + Pulse
Grupo de Usuarios HPE Big Data LATAM
Agenda
Análisis de sentimiento de tweets• ¿Qué es el análisis de sentimiento? Ejemplo
• Arquitectura
• Estructura de Tablas y Vistas
• Configuración del Agente Flume
• Inicio del Agente
• Diccionarios de pulse
• Calculo de sentimiento (sentimental analysis)
• Datos Analizados
• Resultados obtenidos
• Visualización con Tableau
¿Qué es el análisis de sentimiento?
Es software que mediante la comprensión del leguaje cataloga un texto en positivo, negativo o neutro.
Nuestro estudio analiza los mensajes de twitter generados durante el periodo del Balotaje de Argentina 2015 entre Mauricio Macri y Daniel Scioli y realiza este análisis de sentimiento, dándole un valor de 1 a los mensajes positivos, -1 a los negativos y 0 a los neutros.
Veamos un ejemplo
Buscando este mensaje en la base de datos, vemos que el mismo es catalogado como sentiment_score_tweet = -1, negativo
Si analizamos este tweet, es un mensaje negativo para el candidato Macri
Propósito del estudio
Encontrar una relación entre los tweets generados durante el periodo previo al Balataje 2015, analizando el sentimiento de los mismos a favor y en contra de los candidatos, con el resultado electoral de la elección.
Host
Twitter Streaming
API
Arquitectura de la Solución
Agente Apache Flume
Source Sinc
Channel
Pulse
Conector Vertica para Hadoop
Estructura de tablas
Vistas
Configuración del Agente Flume
Iniciar el Agente Apache Flume
Diccionario Pulse, normalización y white list
Diccionario Pulse, palabras positivas y negativas
Calcular el sentimiento de los tweets
insert into elec.tweet_sentiment
(select id,
"user.screen_name",
SentimentAnalysis(text using parameters
filterlinks=true,filterusermentions=false, filterhashtags=false)
over (partition by id, "user.screen_name", text)
from elec.tweets where lang='es'
and created_at between to_timestamp ('2015-11-20 00:00:00','YYYY-MM-DD
HH:MI:SS') and to_timestamp ('2015-11-20 23:59:59','YYYY-MM-DD
HH:MI:SS'));
commit;
Datos analizados
Resultados del Análisis de Sentimiento
Resultados del Análisis de Sentimiento
Resultados del Análisis de Sentimiento
Resultado del Balotaje
Resultado del Balotaje
Resultado de Sentimiento Positivo
Resultados con Tableau
Resultados con Tableau
Resultados con Tableau
Resultados con Tableau
Conclusión
Mediante el presente estudio, hemos detectado relación entre los tweets y el resultado general a nivel global, y no así si lo extrapolamos a las provincias, ya que en algunos casos el sentimiento positivo da resultados diferentes.
Una de las posibilidades que brinda esta tecnología es apoyar a los sistemas de encuestas tradicionales, como así también análisis de sentimientos negativos para tomar decisiones de cambio en base a los mismos.
https://my.vertica.com/
Datos de Contacto
Daniel Robins
Tel: +54 351 5680045
Skype: daniel.robins2
Grupo de Usuarios: http://www.meetup.com/es-ES/Grupo-de-Usuarios-HPE-Big-Data-LATAM/
Registro y Download: https://my.vertica.com/