Dirigido por el Laboratorio X-LANCE de la Universidad Jiao Tong de Shanghai, una de las principales entidades de investigación audiovisual y de procesamiento del verbo de China, el maniquí se claridad Habibi, que significa “querida” en árabe.
Al presentar sus hallazgos, el equipo de investigación encabezado por Chen Yushen describió el esquema en un artículo como “el primer ámbito de código descubierto para la síntesis de voz árabe dialectal unificada”.
“Hasta donde sabemos, no existe investigación sobre TTS en árabe dialectal unificado, sin mencionar un ámbito de código descubierto”, dijeron los autores en el artículo “Habibi: Colocando las bases de código descubierto para la síntesis del deje en árabe dialectal unificado”. Fue publicado el mes pasado en arXiv, un repositorio de ataque descubierto que no está revisado por pares.
Habibi tiene la capacidad de “disparo cero”, lo que significa que el maniquí puede clonar fácilmente una voz usando solo un breve clip de audio de narración, sin una capacitación previa, explícita o extensa. Esto permite aplicaciones en escenarios en extremo eficientes y sobre la marcha.
