Noticias de ciencia

de organizaciones de investigación

Las IAs que detestan el habla de odio son tontas por el "amor"

Los humanos muestran los nuevos detectores que ocultan los discursos de odio en línea fácilmente, muestra un nuevo estudio.

Fecha :: 16 de septiembre de 2018
Fuente :: Universidad de Aalto
Resumen :: El texto odioso y los comentarios son un problema cada vez mayor en los entornos en línea, pero abordar el problema desenfrenado se basa en la capacidad de identificar contenido tóxico. Un nuevo estudio ha descubierto debilidades en muchos detectores de aprendizaje automático que actualmente se utilizan para reconocer y mantener el discurso de odio enbahía
Compartir :

HISTORIA COMPLETA

Los humanos muestran los nuevos detectores que ocultan los discursos de odio en línea fácilmente, muestra un nuevo estudio.

anuncio

El texto odioso y los comentarios son un problema cada vez mayor en los entornos en línea, pero abordar el problema desenfrenado se basa en la capacidad de identificar contenido tóxico. Un nuevo estudio realizado por el grupo de investigación de Sistemas Seguros de la Universidad de Aalto ha descubierto debilidades en muchos detectores de aprendizaje automático actualmentesolía reconocer y mantener a raya el discurso de odio.

Muchas redes sociales populares y plataformas en línea utilizan detectores de discurso de odio que un equipo de investigadores dirigido por el profesor N. Asokan ahora ha demostrado que es frágil y fácil de engañar. La mala gramática y la ortografía incómoda, intencional o no, pueden ser tóxicoslos comentarios en las redes sociales son más difíciles de detectar para los detectores de IA.

El equipo puso a prueba siete detectores de discurso de odio de última generación. Todos fallaron.

Las técnicas modernas de procesamiento del lenguaje natural PNL pueden clasificar el texto en función de caracteres individuales, palabras u oraciones. Cuando se enfrentan a datos textuales que difieren de los utilizados en su entrenamiento, comienzan a confundirse.

"Insertamos errores tipográficos, cambiamos los límites de las palabras o agregamos palabras neutrales al discurso de odio original. Eliminar espacios entre palabras fue el ataque más poderoso, y una combinación de estos métodos fue efectiva incluso contra el sistema de clasificación de comentarios de Google Perspectiva", dice TommiGröndahl, estudiante de doctorado en la Universidad de Aalto.

Google Perspective clasifica la "toxicidad" de los comentarios utilizando métodos de análisis de texto. En 2017, investigadores de la Universidad de Washington demostraron que Google Perspective puede ser engañado introduciendo errores tipográficos simples. Gröndahl y sus colegas ahora han descubierto que Perspective se ha vuelto resistente desde entoncesa errores tipográficos simples aún pueden ser engañados por otras modificaciones, como eliminar espacios o agregar palabras inocuas como 'amor'.

Una oración como 'Te odio' se deslizó por el tamiz y dejó de ser odiosa cuando se modificó en 'Te amo'.

Los investigadores señalan que en diferentes contextos la misma expresión puede considerarse odiosa o simplemente ofensiva. El discurso de odio es subjetivo y específico del contexto, lo que hace que las técnicas de análisis de texto sean insuficientes como soluciones independientes.

Los investigadores recomiendan que se preste más atención a la calidad de los conjuntos de datos utilizados para entrenar modelos de aprendizaje automático, en lugar de refinar el diseño del modelo. Los resultados indican que la detección basada en caracteres podría ser una forma viable de mejorar las aplicaciones actuales.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad de Aalto . Nota: El contenido puede ser editado por estilo y longitud.

Referencia del diario :

Tommi Gröndahl, Luca Pajola, Mika Juuti, Mauro Conti, N.Asokan. Todo lo que necesitas es "amor": evadir la detección del discurso de odio . enviado a arXiv , 2018 [ enlace ]

Cite esta página :

Universidad de Aalto. "Los IA que detestan el discurso de odio son tontos por el" amor ": los humanos pueden engañar fácilmente a los detectores de última generación que detectan el discurso de odio en línea, muestra un nuevo estudio ..." ScienceDaily. ScienceDaily, 16Septiembre de 2018. .

Universidad de Aalto. 2018, 16 de septiembre. Las IAs detectoras de odio son tontas para el "amor": los humanos pueden detectar fácilmente detectores de última generación que detectan el discurso de odio en línea. ScienceDaily . Recuperado el 9 de julio de 2020 de www.science-things.com/releases/2018/09/180916152719.htm

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Las IAs que detestan el habla de odio son tontas por el "amor"

Los humanos muestran los nuevos detectores que ocultan los discursos de odio en línea fácilmente, muestra un nuevo estudio.

1

2

3

4

5

1

2

3

4

5

Mayor concentración de metal en los cráteres de la luna proporciona nuevas ideas sobre su origen

Para encontrar agujeros negros gigantes, comience con Júpiter

Un misterio cósmico: el telescopio de ESO captura la desaparición de una estrella masiva

El mejor material para las mascarillas caseras puede ser una combinación de dos telas

matar el coronavirus con un dispositivo portátil de luz ultravioleta puede ser factible

¿Qué hace que los barcos disminuyan o se detengan misteriosamente, aunque los motores estén funcionando?

Sin claves para el reino: el nuevo algoritmo de inicio de sesión único proporciona una privacidad superior

Hacia un láser lo suficientemente potente como para investigar un nuevo tipo de física

¿Cómo corre el riesgo de contraer un virus en un avión?

El poder colectivo de los cuerpos oscuros e helados del sistema solar

El viaje cósmico hacia la formación de estrellas y planetas

Nueva colección de estrellas, no nacidas en nuestra galaxia, descubiertas en la Vía Láctea

Los globos programables allanan el camino para nuevos dispositivos de transformación de formas

Ciencia detrás de la técnica tradicional de fabricación de mezcal

Los científicos crean un nuevo dispositivo para iluminar el camino para las tecnologías cuánticas

Sistema portátil que aumenta la precisión del láser a temperatura ambiente

Nueva evidencia ayuda a formar la reconstrucción digital del santuario medieval más importante

Hacer el plástico más transparente al tiempo que agrega conductividad eléctrica