Más del 99% de las veces, dos palabras son suficientes para que las personas con audición normal distingan la voz de un amigo cercano o pariente entre otras voces, dice Julien Plante-Hébert de la Universidad de Montreal. Su estudio, presentado en la 18a.El Congreso Internacional de Ciencias Fonéticas, que incluía la reproducción de grabaciones para francófonos canadienses, a quienes se les pidió que reconocieran en múltiples juicios cuál de las diez voces masculinas que escucharon les era familiar. "Merci beaucoup" resultó ser todo lo que necesitaban escuchar.
Plante-Hébert es un estudiante de doctorado de reconocimiento de voz en el Departamento de Lingüística y Traducción de la universidad. "Las capacidades auditivas de los humanos son excepcionales en términos de identificación de voces familiares. Al nacer, los bebés ya pueden reconocer la voz de sus madres y distinguir elsonidos de lenguas extranjeras ", dijo Plante-Hébert. Para evaluar estas capacidades auditivas, creó una serie de" alineaciones "de voz, una técnica inspirada en el conocido procedimiento de identificación visual utilizado por la policía, en el que un grupo de personas que compartenlos rasgos físicos se colocan ante un testigo. "Una formación de voces es un procedimiento análogo en el que se presentan varias voces con aspectos acústicos similares. En mi estudio, cada formación de voces contenía diferentes longitudes de enunciados que variaban de una a dieciocho sílabas. Familiaridad entre el objetivola voz y el identificador se definieron por el grado de contacto entre los interlocutores. "Participaron 44 personas de entre 18 y 65 años.
Plante-Hébert descubrió que los participantes no podían identificar los enunciados cortos independientemente de su familiaridad con la persona que habla. Sin embargo, con los enunciados de cuatro o más sílabas, como "merci beaucoup", la tasa de éxito fue casi total para familiares muy familiares"Las tasas de identificación superan las que se obtienen actualmente con los sistemas automáticos", dijo. De hecho, en su opinión, los mejores sistemas de reconocimiento de voz son mucho menos eficientes que el sistema auditivo en el mejor de los casos, hay una tasa de éxito del 92% en comparación con más del 99.9%para humanos.
Además, en un entorno ruidoso, los humanos pueden superar el reconocimiento basado en la máquina debido a la capacidad de nuestro cerebro para filtrar el ruido ambiental. "El reconocimiento automático de los altavoces es, de hecho, el factor biométrico menos preciso en comparación con las huellas dactilares o el reconocimiento de la cara o el iris", Plante-Hébert dijo: "Si bien las tecnologías avanzadas pueden capturar una gran cantidad de información del habla, hasta ahora solo los humanos pueden reconocer voces familiares con una precisión casi total", concluyó.
Fuente de la historia :
Materiales proporcionado por Universidad de Montreal . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :