Los detectores de noticias falsas, que han sido implementados por plataformas de redes sociales como Twitter y Facebook para agregar advertencias a publicaciones engañosas, tradicionalmente han marcado los artículos en línea como falsos según el título o el contenido de la historia. Sin embargo, los enfoques recientes han considerado otras señales, comocomo funciones de red e interacciones de los usuarios, además del contenido de la historia para aumentar su precisión.
Sin embargo, una nueva investigación de un equipo de la Facultad de Ciencias de la Información y Tecnología de Penn State muestra cómo estos detectores de noticias falsas pueden manipularse a través de los comentarios de los usuarios para marcar las noticias verdaderas como falsas y las noticias falsas como verdaderas. Este enfoque de ataque podría dar a los adversarios la capacidadpara influir en la evaluación de la historia por parte del detector, incluso si no es el autor original de la historia.
"Nuestro modelo no requiere que los adversarios modifiquen el título o el contenido del artículo de destino", explicó Thai Le, autor principal del artículo y estudiante de doctorado en la Facultad de IST. "En cambio, los adversarios pueden usar fácilmente cuentas aleatorias en las redes socialespara publicar comentarios maliciosos para degradar una historia real como noticias falsas o promover una historia falsa como noticias reales ".
Es decir, en lugar de engañar al detector atacando el contenido o la fuente de la historia, los comentaristas pueden atacar el detector en sí.
Los investigadores desarrollaron un marco, llamado Malcom, para generar, optimizar y agregar comentarios maliciosos que fueran legibles y relevantes para el artículo en un esfuerzo por engañar al detector. Luego, evaluaron la calidad de los comentarios generados artificialmente porpara ver si los humanos podían diferenciarlos de los generados por usuarios reales. Finalmente, probaron el rendimiento de Malcom en varios detectores de noticias falsas populares.
Malcom funcionó mejor que la línea de base para los modelos existentes al engañar a cinco de los principales detectores de noticias falsas basados en redes neuronales más del 93% del tiempo. Según el conocimiento de los investigadores, este es el primer modelo que ataca a los detectores de noticias falsas utilizando este método..
Este enfoque podría resultar atractivo para los atacantes porque no necesitan seguir los pasos tradicionales de difusión de noticias falsas, que implican principalmente la propiedad del contenido. Los investigadores esperan que su trabajo ayude a los encargados de crear detectores de noticias falsas a desarrollar modelos más sólidos yfortalecer los métodos para detectar y filtrar comentarios maliciosos y, en última instancia, ayudar a los lectores a obtener información precisa para tomar decisiones informadas.
"Las noticias falsas se han promovido con la intención deliberada de ampliar las brechas políticas, socavar la confianza de los ciudadanos en las figuras públicas e incluso crear confusión y dudas entre las comunidades", escribió el equipo en su documento, que se presentará virtualmente durante elConferencia internacional IEEE 2020 sobre minería de datos.
Le agregó: "Nuestra investigación ilustra que los atacantes pueden aprovechar esta dependencia de la participación de los usuarios para engañar a los modelos de detección publicando comentarios maliciosos en artículos en línea, y destaca la importancia de contar con modelos sólidos de detección de noticias falsas que puedan defenderse de los ataques adversarios. "
Los colaboradores del proyecto incluyen a Dongwon Lee, profesor asociado, y Suhang Wang, profesor asistente, ambos en la Facultad de Ciencias de la Información y Tecnología de Penn State. Este trabajo fue apoyado por la National Science Foundation.
Fuente de la historia :
Materiales proporcionado por Penn State . Original escrito por Jordan Ford. Nota: el contenido se puede editar por estilo y longitud.
cite esta página :