¿Cuáles son las características de la forma en que dices "hola" o cualquier otra cosa que te haga reconocible por teléfono? A pesar de la creciente cantidad de literatura sobre la calidad de la voz personal, realmente se sabe muy poco acerca de cómopara caracterizar el sonido de un altavoz individual.
Dos investigadores de UCLA en Los Ángeles, California, Patricia Keating y Jody Kreiman, están uniendo fuerzas como lo han hecho muchas veces en el pasado para aplicar herramientas acústicas a su investigación lingüística, investigando esta pregunta. Keating y Kreiman presentaránhallazgos preliminares de su investigación en la 172a Reunión de la Acoustical Society of America y la 5ta Reunión conjunta con la Acoustical Society of Japan, celebrada del 28 de noviembre al 2 de diciembre de 2016, en Honolulu, Hawai.
Esencialmente, Keating y Kreimen quieren saber cómo medir cómo suena la gente. "No hay forma de cuantificar lo que eso significa", dijo Kreiman. "Cuando cambias algo físico, ¿puedes predecir cómo sonará?"
La voz de una persona individual puede variar con el tiempo debido a su estado emocional, salud, el contexto de la conversación o una serie de otros factores que hacen que la cuantificación de esta medición sea particularmente difícil.
Una gran cantidad de evidencia de fonética, psicología cognitiva y neuropsicología indica que los oyentes organizan toda esta variabilidad dentro del hablador en un prototipo para cada hablador, una representación "promedio" y un conjunto de desviaciones de ese prototipo. Incluso ununa sola sílaba puede llevar suficiente información para distinguir una voz de otra, pero aún no está claro cuáles son específicamente las características de identificación más importantes dentro de tal prototipo, o cuánto debe variar cada característica antes de que la voz se vuelva irreconocible.
"La calidad de la voz va a vagar", dijo Keating. "Estamos viendo el punto en el que dejas de sonar como tú y comienzas a sonar como alguien más".
Keating y Kreiman analizaron digitalmente grabaciones de cincuenta mujeres, todas hablantes nativas de inglés, que leyeron cinco oraciones dos veces en tres días diferentes. Este análisis examinó múltiples parámetros acústicos para los sonidos de vocales y consonantes que componen las oraciones leídas, como fundamentalfrecuencia, intensidades de frecuencias armónicas entre sí y cómo se comparan con los niveles de ruido subyacentes dentro de la voz.
Estas oraciones proporcionaron a cada característica un rango y un promedio cuantitativo, cuya colección formó una especie de perfil de voz de identificación potencial. Al comparar a todos los hablantes con este conjunto de características, el perfil de voz de una persona en particular, usando un azarconjunto de sus oraciones de muestra, se podría comprobar su precisión para distinguir al hablante correcto y compararlo con qué tan bien actúan otros conjuntos de características para distinguir una voz en particular.
Este trabajo se expande sobre el trabajo previo que los dos han completado con éxito con una muestra de solo tres altavoces. El tamaño de muestra más grande ofrece más información para comprender qué características y por qué margen hacen que una voz reconocible sea irreconocible. Es por eso que el conjunto delas muestras estaban compuestas por hablantes similares, todos hablantes de inglés femenino y nativo.
"¿Quién debería ser confundible y bajo qué circunstancias?", Preguntó Kreiman. "¿Cuánto de un cambio acústico es perceptible?" Mirando hacia el futuro, responder estas preguntas puede ayudar a generar predicciones sobre la confusión en el contexto de ambos oyentes humanos, quienes tiendenpara poder discernir de manera reconocible en cuestión de segundos, y algoritmos informáticos, que generalmente requieren muestras más cercanas a un minuto de duración.
Fuente de la historia :
Materiales proporcionado por Sociedad Acústica de América ASA . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :