Al escanear 66 millones de tweets vinculados a casi 1,400 eventos del mundo real, los investigadores del Instituto de Tecnología de Georgia han creado un modelo de lenguaje que identifica palabras y frases que conducen a niveles de credibilidad percibidos fuertes o débiles en Twitter. Sus hallazgos sugieren que las palabrasde millones de personas en las redes sociales tienen información considerable sobre la credibilidad de un evento, incluso cuando un evento aún está en curso.
"Ha habido muchos estudios sobre la credibilidad de las redes sociales en los últimos años, pero se sabe muy poco acerca de qué tipos de palabras o frases crean percepciones de credibilidad durante los eventos que se desarrollan rápidamente", dijo Tanushree Mitra, el candidato de doctorado de Georgia Tech quedirigió la investigación.
El equipo examinó los tweets que rodearon los eventos en 2014 y 2015, incluida la aparición del ébola en África occidental, el ataque de Charlie Hebdo en París y la muerte de Eric Garner en la ciudad de Nueva York. Pidieron a las personas que juzgaran las publicaciones por su credibilidadde "ciertamente precisa" a "ciertamente inexacta". Luego, el equipo introdujo las palabras en un modelo que las dividió en 15 categorías lingüísticas diferentes. Las clasificaciones incluyeron emociones positivas y negativas, coberturas y refuerzos, y ansiedad.
La computadora de Georgia Tech luego examinó las palabras para juzgar si los tweets eran creíbles o no. Coincidía con las opiniones de los humanos aproximadamente el 68 por ciento de las veces. Eso es significativamente más alto que la línea de base aleatoria del 25 por ciento.
"Tweets con palabras de refuerzo, como 'innegable' y términos de emoción positiva, como 'ansioso' y 'excelente', fueron vistos como altamente creíbles", dijo Mitra. "Palabras que indican un sentimiento positivo pero burlándose de la impracticabilidad deleventos, como 'ha', 'sonrisas' o 'bromas', fueron vistos como menos creíbles. También lo fueron las palabras de cobertura, incluyendo 'cierto nivel' y 'sospechosos' ".
Un mayor número de retweets también se correlacionó con puntajes de credibilidad más bajos. Se consideró que las respuestas y retweets con mensajes más largos eran más creíbles.
"Podría ser que la longitud de los mensajes más largos proporcione más información o razonamiento, por lo que son vistos como más confiables", dijo. "Por otro lado, un mayor número de retweets, que obtuvo una puntuación más baja en credibilidad, podría representarun intento de provocar el razonamiento colectivo en tiempos de crisis o incertidumbre "
El sistema aún no se puede implementar, pero el equipo de Georgia Tech dice que eventualmente podría convertirse en una aplicación que muestre la confianza percibida de un evento a medida que se desarrolla en las redes sociales.
"Cuando se combina con otras señales, como temas de eventos o información estructural, nuestro resultado lingüístico podría ser un componente importante de un sistema automatizado", dijo Eric Gilbert, asesor de Mitra y profesor asistente en la Escuela de Computación Interactiva de Georgia Tech."Twitter es parte del problema con la difusión de noticias falsas en línea. Pero también puede ser parte de la solución".
El documento, "Un modelo de lenguaje parsimonioso de la credibilidad de las redes sociales en eventos distintos", se presentará en febrero en la XX Conferencia de ACM sobre trabajo cooperativo y computación social con apoyo informático en Portland, Oregón.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Georgia . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :