El préstamo léxico, o la transferencia directa de palabras de un idioma a otro, ha interesado a los estudiosos durante milenios, como ya se evidencia en el diálogo de Kratylos de Platón, en el que Sócrates analiza el desafío impuesto por las palabras prestadas a los estudios etimológicos.Los préstamos ayudan a los investigadores a rastrear la evolución de las lenguas modernas e indican el contacto cultural entre distintos grupos lingüísticos, ya sean recientes o antiguos. Sin embargo, las técnicas para identificar palabras prestadas se han resistido a la formalización, exigiendo que los investigadores se basen en una variedad de información indirecta y la comparación demúltiples idiomas.
"La detección automática de préstamos léxicos sigue siendo una de las tareas más difíciles que enfrentamos en la lingüística histórica computacional", dice Johann-Mattis List, quien dirigió el estudio.
En el estudio actual, los investigadores de la PUCP y MPI-SHH emplearon diferentes técnicas de aprendizaje automático para entrenar modelos de lenguaje que imitan la forma en que los lingüistas identifican los préstamos cuando consideran solo la evidencia proporcionada por un solo idioma: los sonidos o las formas en quelos sonidos combinados para formar palabras son atípicos cuando se comparan con otras palabras en el mismo idioma, lo que a menudo sugiere préstamos recientes. Luego, los modelos se aplicaron a una versión modificada de la base de datos World Loanword, un catálogo de información de préstamos para una muestra de 40idiomas de diferentes familias de idiomas en todo el mundo, para ver con qué precisión las palabras dentro de un idioma dado se clasificarían como prestadas o no por las diferentes técnicas.
En muchos casos, los resultados no fueron satisfactorios, lo que sugiere que la detección de préstamos es demasiado difícil para los métodos de aprendizaje automático más utilizados. Sin embargo, en situaciones específicas, como en listas con una alta proporción de préstamos o en idiomas cuyos préstamos provienen principalmente de unidioma de un solo donante, los modelos de lenguaje léxico de los equipos se mostraron prometedores.
"Después de estos primeros experimentos con préstamos léxicos monolingües, podemos proceder a replantear otros aspectos del problema, pasando a enfoques multilingües e interlingüísticos", dice John Miller de la PUCP, coautor principal del estudio.
"Nuestro enfoque asistido por computadora, junto con el conjunto de datos que estamos publicando, arrojará una nueva luz sobre la importancia de los métodos asistidos por computadora para la comparación de idiomas y la lingüística histórica", agrega Tiago Tresoldi, otro coautor principal del estudio deMPI-SHH.
El estudio se suma a los esfuerzos en curso para abordar uno de los problemas más desafiantes de la lingüística histórica, y muestra que la detección de palabras prestadas no puede depender únicamente de información monolingüe. En el futuro, los autores esperan desarrollar enfoques mejor integrados que tomeninformación en cuenta.
Fuente de la historia :
Materiales proporcionado por Instituto Max Planck para la ciencia de la historia humana . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :