¿Las redes sociales estropearon la película de Avengers 'Endgame para ti? ¿O tal vez uno de los libros de Juego de Tronos? Un equipo de investigadores de la Universidad de California en San Diego está trabajando para asegurarse de que eso no vuelva a suceder. Han desarrolladoun sistema basado en inteligencia artificial que puede marcar spoilers en reseñas en línea de libros y programas de televisión.
"Los spoilers están en todas partes en Internet y son muy comunes en las redes sociales. Como usuarios de internet, entendemos el dolor de los spoilers y cómo pueden arruinar la experiencia de uno", dijo Ndapa Nakashole, profesora de ciencias de la computación en la Universidad de California SanDiego y uno de los autores principales del artículo.
Algunos sitios web permiten a las personas marcar manualmente sus publicaciones con etiquetas que sirven como señales de advertencia de "spoiler adelante". Pero esto no siempre sucede. Por lo tanto, los investigadores querían desarrollar una herramienta de inteligencia artificial impulsada por redes neuronales para detectar automáticamente spoilers.llamado la herramienta SpoilerNet.
En un nivel teórico, los investigadores quieren comprender mejor cómo las personas escriben spoilers y qué tipo de patrones lingüísticos y conocimiento común marcan una oración como spoiler.
Los investigadores presentarán sus hallazgos en la reunión anual de 2019 de la Asociación de Lingüística Computacional en Florencia, Italia, del 28 de julio al 2 de agosto. La herramienta que desarrollaron los investigadores podría usarse para construir una extensión de navegador para proteger a las personas de los spoilers.
Para entrenar y probar SpoilerNet, el equipo de UC San Diego buscó grandes conjuntos de datos de oraciones que contienen spoilers. ¡Alerta de spoiler! No encontraron ninguna. Así que crearon la suya recolectando más de 1.3 millones de reseñas de libros anotadas con etiquetas de spoiler por los revisores de libros.Las etiquetas abarcan oraciones que incluyen spoilers y las ocultan detrás de un enlace "ver spoiler" en el texto. Las reseñas fueron recopiladas de Goodreads, un sitio de redes sociales que permite a las personas hacer un seguimiento de lo que leen y compartir pensamientos y reseñas con otros lectores..
"Hasta donde sabemos, este es el primer conjunto de datos con anotaciones de spoiler a esta escala y con una granularidad tan fina", dijo Mengting Wan, un estudiante de doctorado en ciencias de la computación en UC San Diego y el primer autor del artículo.
Los investigadores encontraron que las oraciones de spoiler tienden a agruparse en la última parte de las revisiones. Pero también encontraron que diferentes usuarios tenían diferentes estándares para etiquetar spoilers, y las redes neuronales debían calibrarse cuidadosamente para tener esto en cuenta.
Además, la misma palabra puede tener diferentes significados semánticos en diferentes contextos. Por ejemplo, 'verde' es solo un color en una reseña de un libro, pero puede ser el nombre de un personaje importante y una señal para spoilers en otro libroIdentificar y comprender estas diferencias es un desafío, dijo Wan.
Los investigadores entrenaron a SpoilerNet en el 80 por ciento de las revisiones en Goodreads, ejecutando el texto a través de varias capas de redes neuronales. El sistema podía detectar spoilers con una precisión del 89 al 92 por ciento.
También ejecutaron SpoilerNet en un conjunto de datos de más de 16,000 revisiones de una sola oración de aproximadamente 880 programas de televisión. La precisión de la herramienta para detectar spoilers fue del 74 al 80 por ciento.
La mayoría de los errores provienen del sistema que se distrae con palabras que generalmente están cargadas y son reveladoras, por ejemplo, asesinato o asesinato.
Mirando hacia el futuro, el conjunto de datos Goodreads se puede usar como una herramienta poderosa para entrenar algoritmos para detectar spoilers en diferentes tipos de contenido, por ejemplo, tweets que contienen spoilers.
Fuente de la historia :
Materiales proporcionado por Universidad de California - San Diego . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :