Jiebo Luo y Yu Wang no se propusieron predecir quién ganaría las elecciones presidenciales de 2016 en Estados Unidos. Sin embargo, su exhaustivo estudio de 14 meses de los seguidores de Twitter de cada candidato, habilitado por el aprendizaje automático y otras herramientas de ciencia de datos, ofrece pistas tentadorasen cuanto a por qué la carrera resultó como lo hizo.
"Queríamos entender cómo evolucionó cada una de las campañas del candidato y poder explicar por qué alguien ganó o perdió", dice Luo, profesor asociado de ciencias de la computación.
Luo y Wang, un candidato a doctorado doble en ciencias políticas e informáticas, resumieron sus hallazgos en ocho documentos durante el curso de la campaña, incluidas estas observaciones :
Cuanto más tuiteó Donald Trump, más rápido creció su seguimiento, incluso después de que tuvo un mal desempeño en los debates contra otros candidatos republicanos, e incluso después de que provocó controversias, como proponer una prohibición de la inmigración musulmana. Lea el documento en http://arxiv.org/abs/1603.08174
Cuando Trump acusó a Hillary Clinton de jugar a la "carta de la mujer", las mujeres tenían más probabilidades de seguir a Clinton y menos de "no seguirla" durante la semana siguiente. Pero no afectó la composición de género de los seguidores de Trump.Lea el periódico en http://arxiv.org/abs/1605.05401
Además, un "efecto de afinidad de género" visto en otras elecciones, mujeres que tienden a votar por las mujeres, no parecía estar funcionando para Clinton cuando las primarias llegaron a su fin. El porcentaje de mujeres seguidores de Twitter en el campo de Clinton nomás grande que eso en el campo de Trump. Además, aunque los "no seguidores" eran más propensos a ser mujeres para ambos candidatos, el fenómeno fue "particularmente pronunciado" para Clinton lea el documento en http://arxiv.org/abs/1604.07103
Al mismo tiempo, varias encuestas, incluidas ABC / Washington Post y CBS / New York Times, sugirieron que algunos partidarios de Bernie Sanders podrían "saltar" de la columna demócrata y terminar votando por Trump si Sanders se retiraba. Luoy Wang encontró evidencia de apoyo, informando que el número de seguidores de Bernie Sanders que también seguían a Trump estaba aumentando, pero el número que seguía a Clinton también estaba disminuyendo. Los seguidores duales de Sanders / Trump también eran hombres desproporcionadamente hasta el 64 por ciento.el papel en http://arxiv.org/abs/1605.09473
"Al final, a pesar de que elegimos no hacer ninguna predicción, no nos sorprendió en absoluto que Donald Trump ganó", dice Luo.
¿Por qué Twitter?
El uso de las redes sociales por parte de Barack Obama en la carrera presidencial de 2008 ayudó a establecer Twitter y otras plataformas de redes sociales como herramientas poderosas para que los candidatos lleguen rápidamente y reciban comentarios de un gran número de votantes potenciales y atacar a sus oponentes.
Desde entonces, ha habido un creciente interés en la investigación académica que emplea la ciencia de datos para analizar elecciones basadas en publicaciones en redes sociales.
Twitter, en particular, es una rica fuente de datos porque los millones de tweets publicados por sus miembros cada día son fácilmente accesibles utilizando una interfaz de programación de aplicaciones.
La clave para Luo, Wang y sus colegas fue recopilar la mayor cantidad posible de estos datos, comenzando al principio de la campaña, y luego "extraerlos" de formas innovadoras.
Género de seguidores seguidores de Twitter en abril de 2016, compilado por Wang y Luo.
"La naturaleza misma de estos datos es que desaparecerán mañana, por lo que tuvimos que comenzar a capturarlos desde una etapa temprana y diseñar un marco de investigación para poder continuar recolectando datos todo el tiempo", dijo Wang.
desde septiembre de 2015 hasta octubre de 2016, el equipo comenzó a acumular un gran conjunto de datos que incluía :
Utilizando herramientas avanzadas de visión por computadora, los investigadores entrenaron una red neuronal artificial lo que se llama una red neuronal convolucional para determinar, con una precisión del 90 por ciento o más, la edad, el género y la raza de los seguidores de los candidatos utilizando sus fotos de Twitter.Esto ayudó a los investigadores a analizar el papel de cada uno de esos factores en la campaña, ya que rastrearon los cambios en los seguidores de cada candidato antes y después de los debates, por ejemplo, y cómo los seguidores reaccionaron a los propios tweets de los candidatos.
La minería de Twitter tiene sus límites en comparación con las respuestas obtenidas de las encuestas telefónicas tradicionales. No hay oportunidad de hacer preguntas de seguimiento, por ejemplo, y los tweets son difíciles de ubicar geográficamente, lo que limita su aplicación para estudiar tendencias en estados cambiantes. Inclusolos tweets geoetiquetados pueden enviarse mientras el remitente está de vacaciones o asistiendo a una concentración en otro estado.
Pero la minería de Twitter también tiene sus ventajas: permite a los investigadores muestrear datos de forma rápida, continua y económica en una escala que supera con creces las aproximadamente 1000 respuestas que los encuestadores luchan cada vez más por reunir utilizando técnicas tradicionales. En un estudio, por ejemplo, Luo yWang pudo caracterizar a 322,116 seguidores de Trump o Clinton que posteriormente se convirtieron en "no seguidores".
"Este es un enfoque que es ampliamente aplicable", dice Luo. "Si desea probar la reacción pública a la próxima generación de iPhones, o a un nuevo modelo de automóvil, puede usar el mismo enfoque para ver qué les gusta a los consumidoreso no me gusta. Nos permite rastrear a millones de personas y obtener lecturas confiables sobre sus preferencias ".
Fuente de la historia :
Materiales proporcionado por Universidad de Rochester . Original escrito por Bob Marcotte. Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :