Noticias de ciencia

de organizaciones de investigación

Rellenar espacios en blanco de textos históricos

Fecha :: 23 de diciembre de 2015
Fuente :: Universidad del Noroeste
Resumen :: Digitalizar libros publicados antes de 1700 ha creado un "problema de punto negro" estético y bastante pragmático en textos traducidos, con la palabra "amor", por ejemplo, apareciendo como "lo • e".
Compartir :

HISTORIA COMPLETA

Digitalizar libros publicados antes de 1700 ha creado un "problema de punto negro" estético y bastante pragmático en textos traducidos, con la palabra "amor", por ejemplo, apareciendo como "lo • e".

anuncio

Llevando la comprensión digital de la era actual un paso más allá, los estudiantes de ingeniería de la Universidad Northwestern en la Escuela de Ingeniería y Ciencias Aplicadas McCormick han venido al rescate de las palabras estropeadas y a veces indescifrables que pueblan las versiones traducidas de los primeros textos en inglés.

Trabajando en conjunto con estudiantes universitarios de la Facultad de Artes y Ciencias de Weinberg, los estudiantes de ingeniería diseñaron un programa de computadora que utiliza modelos de lenguaje, similar a los programas de autocorrección y reconocimiento de voz, para ayudar a completar los espacios en blanco de las palabras incompletas.

Los puntos se arrastran en el proceso debido a las dificultades de traducir textos antiguos que a menudo se doran, se manchan y se cortan en los márgenes. Cuando los traductores no podían leer o comprender una parte de un texto, reemplazaban un carácter desconocido con un negropunto.

Desde 1999, cerca de 50,000 textos han sido transcritos por la Asociación de Creación de Texto sin fines de lucro, pero las obras tienen aproximadamente 5 millones de palabras incompletas. Las traducciones de los libros andrajosos también se vieron comprometidas por escaneos de baja calidad.

El modelado del lenguaje encuentra errores ortográficos y "palabras de puntos negros" creados cuando la computadora encuentra un carácter desconocido. Una vez que se encuentra un error, se evalúan los caracteres cercanos y se hacen sugerencias de reemplazo, con una probabilidad asignada a cada opción según el contexto.

La palabra "lo • e" podría ser "amor", pero también podría ser "solitario", "saber" o "perder". Un modelo de lenguaje usa el contexto para elegir la opción correcta. Si el contexto es "ella"estaba enamorado de él ", entonces el programa asume que la palabra que falta es, de hecho," amor ".

El verano pasado, los estudiantes de Weinberg trabajaron en los acertijos lingüísticos al examinar las opciones y seleccionar la correcta. Mientras tanto, los estudiantes de ingeniería han creado un sitio donde los académicos de humanidades pueden buscar palabras en diferentes textos y corregir errores en el acto.los usuarios aceptan o rechazan las correcciones.

"Los aprendices de máquinas también pueden aprender de esos comentarios", dijo el líder del proyecto Doug Downey, profesor asociado de ingeniería eléctrica y ciencias de la computación en la Escuela de Ingeniería McCormick. "Un poco de crowdsourcing como ese podría ser muy útil. Eventualmente,podríamos tener transcripciones de súper alta calidad "

Podría decirse que los lectores modernos podrían revisar los textos y corregir todos los errores, pero un humano podría tardar varios minutos en solucionar un solo error, dijo Martin Mueller, profesor emérito de inglés y clásicos en Northwestern. Para abordar todos los errores, llevaría una persona años de trabajo ininterrumpido, una tarea poco práctica, si no humanamente imposible.

Los resultados iniciales de la colaboración indican que aproximadamente las tres cuartas partes de las obras transcritas de forma incompleta o incorrecta pueden corregirse definitivamente con una combinación de aprendizaje automático y edición asistida por máquina, sin la necesidad de consultar el texto impreso original. Esto podría reducir drásticamenteel costo del tiempo humano de minutos a segundos por palabra.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad del Noroeste . Original escrito por Julie Deardorff. Nota: El contenido puede ser editado por estilo y longitud.

Cite esta página :

Northwestern University. "Rellenar espacios en blanco de textos históricos". ScienceDaily. ScienceDaily, 23 de diciembre de 2015. .

Northwestern University. 2015, 23 de diciembre. Rellenar espacios en blanco de textos históricos. ScienceDaily . Recuperado el 8 de julio de 2020 de www.science-things.com/releases/2015/12/151223164854.htm

Northwestern University. "Rellenar espacios en blanco de textos históricos". ScienceDaily. Www.science-things.com/releases/2015/12/151223164854.htm consultado el 8 de julio de 2020.

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Rellenar espacios en blanco de textos históricos

1

2

3

4

5

1

2

3

4

5

Un misterio cósmico: el telescopio de ESO captura la desaparición de una estrella masiva

Mayor concentración de metal en los cráteres de la luna proporciona nuevas ideas sobre su origen

Para encontrar agujeros negros gigantes, comience con Júpiter

El mejor material para las mascarillas caseras puede ser una combinación de dos telas

matar el coronavirus con un dispositivo portátil de luz ultravioleta puede ser factible

¿Por qué las plantas son verdes?

Sin claves para el reino: el nuevo algoritmo de inicio de sesión único proporciona una privacidad superior

¿Cómo corre el riesgo de contraer un virus en un avión?

Hacia un láser lo suficientemente potente como para investigar un nuevo tipo de física

El poder colectivo de los cuerpos oscuros e helados del sistema solar

El viaje cósmico hacia la formación de estrellas y planetas

Nueva colección de estrellas, no nacidas en nuestra galaxia, descubiertas en la Vía Láctea

Ciencia detrás de la técnica tradicional de fabricación de mezcal

Los científicos crean un nuevo dispositivo para iluminar el camino para las tecnologías cuánticas

¿Qué hace que los barcos disminuyan o se detengan misteriosamente, aunque los motores estén funcionando?

Nueva evidencia ayuda a formar la reconstrucción digital del santuario medieval más importante

Hacer el plástico más transparente al tiempo que agrega conductividad eléctrica

La investigación refleja cómo la IA ve a través del espejo