Noticias científicas

de organizaciones de investigación

1

2

Un nuevo estudio prueba el aprendizaje automático en la detección de palabras prestadas en idiomas del mundo

Los resultados decepcionantes subrayan la complejidad de la evolución del lenguaje al tiempo que se muestran prometedores en algunas aplicaciones actuales

Fecha :: 9 de diciembre de 2020
Fuente :: Instituto Max Planck para la ciencia de la historia humana
Resumen :: Los investigadores han investigado la capacidad de los algoritmos de aprendizaje automático para identificar préstamos léxicos utilizando listas de palabras de un solo idioma. Los resultados muestran que los métodos actuales de aprendizaje automático por sí solos son insuficientes para la detección de préstamos, lo que confirma que se necesitan datos adicionales y conocimiento experto para abordar uno delos desafíos más urgentes de la lingüística histórica.
Compartir :

HISTORIA COMPLETA

El préstamo léxico, o la transferencia directa de palabras de un idioma a otro, ha interesado a los estudiosos durante milenios, como ya se evidencia en el diálogo de Kratylos de Platón, en el que Sócrates analiza el desafío impuesto por las palabras prestadas a los estudios etimológicos.Los préstamos ayudan a los investigadores a rastrear la evolución de las lenguas modernas e indican el contacto cultural entre distintos grupos lingüísticos, ya sean recientes o antiguos. Sin embargo, las técnicas para identificar palabras prestadas se han resistido a la formalización, exigiendo que los investigadores se basen en una variedad de información indirecta y la comparación demúltiples idiomas.

"La detección automática de préstamos léxicos sigue siendo una de las tareas más difíciles que enfrentamos en la lingüística histórica computacional", dice Johann-Mattis List, quien dirigió el estudio.

En el estudio actual, los investigadores de la PUCP y MPI-SHH emplearon diferentes técnicas de aprendizaje automático para entrenar modelos de lenguaje que imitan la forma en que los lingüistas identifican los préstamos cuando consideran solo la evidencia proporcionada por un solo idioma: los sonidos o las formas en quelos sonidos combinados para formar palabras son atípicos cuando se comparan con otras palabras en el mismo idioma, lo que a menudo sugiere préstamos recientes. Luego, los modelos se aplicaron a una versión modificada de la base de datos World Loanword, un catálogo de información de préstamos para una muestra de 40idiomas de diferentes familias de idiomas en todo el mundo, para ver con qué precisión las palabras dentro de un idioma dado se clasificarían como prestadas o no por las diferentes técnicas.

En muchos casos, los resultados no fueron satisfactorios, lo que sugiere que la detección de préstamos es demasiado difícil para los métodos de aprendizaje automático más utilizados. Sin embargo, en situaciones específicas, como en listas con una alta proporción de préstamos o en idiomas cuyos préstamos provienen principalmente de unidioma de un solo donante, los modelos de lenguaje léxico de los equipos se mostraron prometedores.

"Después de estos primeros experimentos con préstamos léxicos monolingües, podemos proceder a replantear otros aspectos del problema, pasando a enfoques multilingües e interlingüísticos", dice John Miller de la PUCP, coautor principal del estudio.

"Nuestro enfoque asistido por computadora, junto con el conjunto de datos que estamos publicando, arrojará una nueva luz sobre la importancia de los métodos asistidos por computadora para la comparación de idiomas y la lingüística histórica", agrega Tiago Tresoldi, otro coautor principal del estudio deMPI-SHH.

El estudio se suma a los esfuerzos en curso para abordar uno de los problemas más desafiantes de la lingüística histórica, y muestra que la detección de palabras prestadas no puede depender únicamente de información monolingüe. En el futuro, los autores esperan desarrollar enfoques mejor integrados que tomeninformación en cuenta.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Instituto Max Planck para la ciencia de la historia humana . Nota: el contenido se puede editar por estilo y longitud.

Referencia de la revista :

John E. Miller, Tiago Tresoldi, Roberto Zariquiey, César A. Beltrán Castañón, Natalia Morozova, Johann-Mattis List. Uso de modelos de lenguaje léxico para detectar préstamos en listas de palabras monolingües . PLOS ONE , 2020; 15 12: e0242709 DOI: 10.1371 / journal.pone.0242709

cite esta página :

Instituto Max Planck para la Ciencia de la Historia Humana. "Un nuevo estudio prueba el aprendizaje automático en la detección de palabras prestadas en idiomas del mundo: los resultados decepcionantes subrayan la complejidad de la evolución del lenguaje y son prometedores en algunas aplicaciones actuales". ScienceDaily. ScienceDaily, 9 de diciembre2020. .

Instituto Max Planck para la Ciencia de la Historia Humana. 2020, 9 de diciembre. Un nuevo estudio prueba el aprendizaje automático en la detección de palabras prestadas en idiomas del mundo: los resultados decepcionantes subrayan la complejidad de la evolución del lenguaje y son prometedores en algunas aplicaciones actuales. ScienceDaily . Obtenido el 13 de febrero de 2021 de www.science-things.com/releases/2020/12/201209170653.htm

Instituto Max Planck para la Ciencia de la Historia Humana. "Un nuevo estudio evalúa el aprendizaje automático en la detección de palabras prestadas en idiomas del mundo: los resultados decepcionantes subrayan la complejidad de la evolución del lenguaje y son prometedores en algunas aplicaciones actuales". ScienceDaily. Www.science-things.com/releases/2020/12/201209170653.htm consultado el 13 de febrero de 2021.

1

2

3

4

5

HISTORIAS RELACIONADAS

DESDE LA WEB

ScienceDaily comparte enlaces con sitios en red TrendMD y obtiene ingresos de anunciantes externos, cuando se indique.

1

2

Un nuevo estudio prueba el aprendizaje automático en la detección de palabras prestadas en idiomas del mundo

Los resultados decepcionantes subrayan la complejidad de la evolución del lenguaje al tiempo que se muestran prometedores en algunas aplicaciones actuales

1

2

3

4

5

1

2

3

4

5

El cambio climático puede haber impulsado la aparición del SARS-CoV-2

La dieta infantil tiene un impacto de por vida

Se descubre que Venus atrapamoscas producen campos magnéticos

Los océanos saludables necesitan paisajes sonoros saludables

COVID-19 bloquea las temperaturas globales temporalmente elevadas, según muestra una investigación

El aplauso del ala de mariposa explica el misterio del vuelo

¿Niño o niña? Está en los genes del padre

La segunda ola pandémica de 1918 tuvo consecuencias fatales

Cómo una alteración de un solo gen pudo haber separado a los humanos modernos de los predecesores

Los lémures muestran que no hay una fórmula única para el amor duradero

Las canciones de las ballenas de aleta ofrecen una nueva vía para los estudios sísmicos de la corteza oceánica

El juego y la comida carnosa reducen la caza de gatos

Los lazos familiares explican la misteriosa vida social de los gobios de coral

La concha antigua resuena después de 18.000 años

Las libélulas realizan volteretas hacia atrás al revés para enderezarse

La evolución genética no siempre toma millones de años

¿Puede una aleta convertirse en una extremidad?

Uso de la ciencia para explorar un misterio ruso de 60 años