elecciones 20n en twitter

21
Elecciones 20N en Twitter 6-Julio-2012 M. Luz Congosto / Pablo Aragón 1

Upload: m-luz-congosto

Post on 05-Dec-2014

3.394 views

Category:

Technology


0 download

DESCRIPTION

Análisis de las elecciones generales en España del 20 de noviembre de 2011

TRANSCRIPT

Page 1: Elecciones 20N en twitter

Elecciones 20N en Twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 1

Page 2: Elecciones 20N en twitter

ÍNDICE

Twitter en campañas electorales

Estado del arte de predicción electoral

Caso de estudio: elecciones 20N-2011

Conclusiones

6-Julio-2012 M. Luz Congosto / Pablo Aragón 2

Page 3: Elecciones 20N en twitter

Twitter en campañas electorales

6-Julio-2012 M. Luz Congosto / Pablo Aragón 3

Comunicación Sonda de opinión

Minería de datos Predicción

Page 4: Elecciones 20N en twitter

Estado del arte de predicción electoral

(Tumasjan, 2010) elecciones parlamento alemán 2009. Método contar menciones 1,65% MAE (Mean Absolute Error)

(Jungherr, 2011) del parlamento alemán 2009 (Conover D. , 2010) analizó las elecciones del US del 2010 (Gayo-Avello D. , 2011) analizó las elecciones de presidenciales de

US en 2008 (Tjong, 2012) elecciones al senado de Holanda 2011 (Skoric, 2012) elecciones de Singapur 2011 (Bermingham et al., 2011) elecciones generales irlandesas 2011 (Panagiotis, 2011) elecciones de US de 2010

6-Julio-2012 M. Luz Congosto / Pablo Aragón 4

Page 5: Elecciones 20N en twitter

Caso de estudio: elecciones 20N-2011

Metodología

Twitter como canal de comunicación

Twitter como sonda de opinión

Twitter como red de conexiones

Twitter como fuente de predicción de resultados 6-Julio-2012 M. Luz Congosto / Pablo Aragón 5

Page 6: Elecciones 20N en twitter

Caso de estudio: elecciones 20N-2011

Metodología– Dataset 1: Monitorizó los partidos nacionales desde el 08/10/11

hasta el 22/11/11 mediante el streaming API de Twittter desde la Universidad Carlos III obteniendo 2.973.110 tweets de 441.795 usuarios diferentes

– Dataset 2: Capturó los mensajes de los partidos que tienen representación parlamentaria, del 9-10-2011 al 24-11-2011 utilizando un proceso periódico de descarga del timeline de un conjunto de perfiles y el streaming API de Twitter desde la Fundació Barcelona Media, obteniendo 2.279.250 tweets de 442.014 usuarios diferentes

6-Julio-2012 M. Luz Congosto / Pablo Aragón 6

Page 7: Elecciones 20N en twitter

Twitter como canal de campañaCandidato vs. Partido

6-Julio-2012 M. Luz Congosto / Pablo Aragón 7

Rajoy

RubalcabaCayoLara

PSOE PP

UpyD Equo

Seguidores inicio campaña 20N (Dataset-1)

Page 8: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 8

Acumulado de tweets campaña 20N (Dataset-1)

Actividad de las cuentas Twitter

Twitter como canal de campaña

Page 9: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 9

Acumulado de nuevos seguidores campaña 20N (Dataset-1)

Adquisición de nuevos seguidores

Twitter como canal de campaña

Page 10: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 10

Campaña 20N (Dataset-1)

Correlación nuevos seguidores / menciones únicas

Twitter como canal de campaña

Page 11: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 11

Tweets por día de la campaña 20N (Dataset-1)

Participación de los ciudadanos

Twitter como sonda de opinión

Page 12: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 12

Valencia por día de la campaña 20N (Dataset-2)

Medida de emotividad (valencia)

Twitter como sonda de opinión

Page 13: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 13

Dominancia por día de la campaña 20N (Dataset-2)

Medida de emotividad (dominancia)

Twitter como sonda de opinión

Page 14: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 14

Mapa de menciones de sitios Web en la campaña 20N (Dataset-1)Imagen interactiva: http://barriblog.com/taller/javascript/protovis/sites_20N.html

Difusión de enlaces

Twitter como sonda de opinión

Política.El País

El País

Público

El mundo

EuropaPress

ABC

Page 15: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 15

Mapa de RTs de la campaña 20N (Dataset-2)

Comunidades de usuarios

Twitter como red de conexiones

Page 16: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 16

Cómputo menciones campaña 20N (Dataset-1)

Menciones vs. Resultados

Twitter como fuente de predicción de resultados

Menciones totales (nombre + @usuario + #hashtag) MAE=1,66%

Page 17: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 17

Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)

Polaridad política vs. Resultados

Twitter como fuente de predicción de resultados

Usuarios en general MAE: 5,00%

Page 18: Elecciones 20N en twitter

6-Julio-2012 M. Luz Congosto / Pablo Aragón 18

Polaridad política vs. Resultados

Twitter como fuente de predicción de resultados

Hombres (61,38%) MAE: 6,49% Mujeres (38,62%) MAE: 3,88%

Usuarios con más de tres RTs o #hashtags polarizados en la campaña 20N (Dataset-1)

Page 19: Elecciones 20N en twitter

Conclusiones

Con las medidas basadas en el cómputo de menciones se ha obtenido un buen resultado, no obstante:

Los resultados dependen de muchos factores como: el entorno socio-cultural de las elecciones, el periodo de la muestra, los eventos de campaña, la recogida de datos en Twitter, los partidos analizados y la forma de cómputo

La validación de este método para predicción requeriría sistematizar todos los pasos y comprobar si los resultados son similares para otras elecciones en diferentes entornos

6-Julio-2012 M. Luz Congosto / Pablo Aragón 19

Page 20: Elecciones 20N en twitter

Conclusiones

Con las medidas basadas en la polaridad política ha obtenido un peor resultado, habrá que tener en cuenta para mejorar los algoritmos de predicción: 1.Demografía: Los usuarios de Twitter son jóvenes y en un alto porcentaje con estudios superiores.

2.Opinión oculta: No todos los usuarios manifiestan sus preferencias políticas

3.Sobreopinión: En contraposición al punto anterior, los simpatizantes de algunos partidos opinan activamente

Sigue…

6-Julio-2012 M. Luz Congosto / Pablo Aragón 20

Page 21: Elecciones 20N en twitter

Conclusiones

Continúa: 4.Entidades vs. Personas: Es difícil distinguir en Twitter una entidad de una persona

5.Anonimato vs. “Identidad real”: Los usuarios con identidad real son más propensos a la opinión oculta

6.Hombres vs. Mujeres: Se ha detectado diferencia de comportamiento según género. Los hombres son más propensos a ocultar su opinión o a sobreopinar que las mujeres

6-Julio-2012 M. Luz Congosto / Pablo Aragón 21