Las palabras que las personas usan en las redes sociales pueden revelar un significado oculto para aquellos que saben dónde buscar.
Los lingüistas han estado fascinados durante mucho tiempo por esta noción, conectando las palabras de una persona con la edad, el género e incluso el estado socioeconómico. Ahora los científicos informáticos de la Universidad de Pennsylvania y otros lugares han ido un paso más allá, vinculando el comportamiento en línea de más de 5,000 usuarios de Twittera su nivel de ingresos. Publicaron sus resultados en la revista PLOS UNO .
Daniel Preotiuc-Pietro, investigador postdoctoral en el Centro de Psicología Positiva de Penn en la Escuela de Artes y Ciencias, dirigió la investigación, colaborando con Svitlana Volkova de la Universidad Johns Hopkins, Vasileios Lampos y Nikolaos Aletras del University College London y Yoram Bachrach de MicrosoftInvestigación.
El equipo adoptó un enfoque opuesto a lo que los psicólogos y lingüistas han hecho históricamente: en lugar de hacer preguntas directas, los científicos observaron las publicaciones de los participantes en las redes sociales, a menudo llenas de detalles íntimos a pesar de la falta de privacidad que estos medios ofrecen. Investigadores de Penn'sEl Proyecto de Bienestar Mundial, del cual forma parte Preotiuc-Pietro, siente curiosidad por las redes sociales como una herramienta de investigación que puede respaldar, o incluso reemplazar, encuestas costosas, limitadas y potencialmente sesgadas.
Para este experimento, los investigadores comenzaron mirando las ocupaciones autodescritas de los usuarios de Twitter.
En el Reino Unido, un sistema de código de trabajo clasifica la ocupación en nueve clases. Usando esa jerarquía, los investigadores determinaron el ingreso promedio para cada código, luego buscaron una muestra representativa de cada uno. Después de eliminar manualmente perfiles ambiguos, por ejemplo, listados de referenciasla película La hija del minero del carbón se agrupa como "minero del carbón" por profesión: el equipo terminó con 5,191 usuarios de Twitter y más de 10 millones de tweets para analizar.
"Es el conjunto de datos más grande de este tipo para este tipo de investigación", dijo Preotiuc-Pietro. "El conjunto de datos nos permitió hacer algo que nadie había hecho antes".
A partir de ahí, crearon un algoritmo estadístico de procesamiento del lenguaje natural que incluía palabras que las personas en cada clase de código usan claramente. La mayoría de las personas tienden a usar las mismas palabras o similares, por lo que el trabajo del algoritmo era "entender" cuáles eran las más predictivaspara cada clase, los humanos analizaron estos grupos y les asignaron significantes cualitativos.
Algunos de los resultados validaron lo que ya se sabe, por ejemplo, que las palabras de una persona pueden revelar la edad y el género, y que están vinculadas a los ingresos. Pero Preotiuc-Pietro dijo que también hubo algunas sorpresas; por ejemplo, aquellos que ganan mástienden a expresar más miedo y enojo en Twitter. Los optimistas percibidos tienen un ingreso promedio más bajo. El texto de los que están entre paréntesis de ingresos más bajos incluye más palabras groseras, mientras que los que están entre corchetes más altos discuten con mayor frecuencia sobre política, corporaciones y el mundo sin fines de lucro.
Aletras notó una imagen general que surgió sobre el uso de Twitter.
"Los usuarios de bajos ingresos o aquellos de un nivel socioeconómico más bajo usan Twitter más como un medio de comunicación entre ellos", dijo. "Las personas de altos ingresos lo usan más para difundir noticias, y lo usan de manera más profesional que personal".
Las fuertes correlaciones como estas, entre lo que los investigadores describen como expresión en línea y demografía fuera de línea, por ejemplo, agrupación de ocupaciones o nivel de ingresos, también resultaron intrigantes, agregó Lampos. "Este trabajo intenta resaltar algunos de los posibles factores causales enestas relaciones "
Tales hallazgos actuarán como una línea de base para el trabajo futuro, algunos de los cuales investigarán cómo las percepciones sobre los ingresos del usuario se alinean con la realidad.
Fuente de la historia :
Materiales proporcionado por Universidad de Pennsylvania . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :