Ya sea que dedique su mejor esfuerzo o el peor, el software de síntesis de voz desarrollado en la Agencia de Ciencia, Tecnología e Investigación de Singapur A * STAR lo hará sonar como el cantante melodioso que siempre quiso ser. Llamado I2R Speech2Singing, este software es el primero en ofrecer cantos de alta calidad automáticamente, al tiempo que conserva el carácter original de su voz natural.
"A muchas personas les gusta cantar pero carecen de las habilidades para hacerlo", dice Minghui Dong, líder del proyecto en el Instituto de Investigación de Infocomunicaciones I2R de A * STAR. "Queremos utilizar nuestra tecnología para ayudar a la persona promedio a cantar bien"."
El discurso consta de tres elementos clave: contenido, prosodia y timbre. El contenido se transmite usando palabras; la prosodia o melodía en el caso del canto, se expresa a través del ritmo y el tono; y el timbre es la cualidad distintiva que hace que un banjo suene diferentede una trompeta y la voz de un cantante diferente a la de otro. I2R Speech2Singing funciona puliendo la melodía mientras conserva el contenido original y el timbre de un sonido.
Las tecnologías existentes que se centran en corregir la melodía intentan alinear los sonidos desafinados con la nota más cercana en la escala musical o con la nota exacta en la partitura original. La primera funciona bien para cantantes profesionales que pueden estar ligeramente desafinados perono puede arreglar a quienes cantan drásticamente fuera de tono o simplemente leen en voz alta. Este último es mejor para corregir melodías discordantes, pero ignora muchos otros aspectos de la melodía, como el vibrato y el estiramiento de las vocales.
I2R Speech2Singing utiliza grabaciones de cantantes profesionales como plantillas para corregir la melodía de una voz que canta o para convertir una voz que habla en una que canta. El software detecta la sincronización de cada sonido fonético utilizando la tecnología de reconocimiento de voz y luego estira o comprime la duraciónde la señal usando la tecnología de conversión de voz para hacer coincidir el ritmo con el de un cantante profesional. Luego, un sintetizador de voz combina la voz con corrección de tiempo con datos de tono y música de fondo para producir un hermoso solo.
"Cuando comparamos la salida con otras aplicaciones disponibles actualmente, nos dimos cuenta de que nuestro software generaba una calidad de voz mucho mejor", dice el Dr. Dong.
Los singapurenses se presentaron por primera vez al software en 2013 a través de "Sing for Singapore", parte de la aplicación móvil oficial de National Day Parade 2013. Y en 2014, I2R Speech2Singing ganó el premio a la mejor contribución Show & Tell en INTERSPEECH, un importanteLugar global para la investigación sobre la ciencia y la tecnología de la comunicación oral.
El Dr. Dong y su equipo ahora están desarrollando una solución para agregar canciones rápidamente al software para que las bases de datos de canciones a gran escala se puedan construir fácilmente.
Fuente de la historia :
Materiales proporcionado por Agencia de Ciencia, Tecnología e Investigación A * STAR . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :