Cuando la IA del habla se encuentra con la larga cola de idiomas: Dentro del dataset VAANI
El dataset VAANI, desarrollado por ARTPARK en el Indian Institute of Science (IISc), aborda la escasez de datos de voz de alta calidad para idiomas de bajos recursos, especialmente en India. Recopila 31.255 horas de audio de 156.534 hablantes en 109 idiomas cubriendo 165 distritos y 28 estados más 3 territorios de la unión. Incluye 59 idiomas indic absententes en otros datasets y 8 no listados en el censo de 2011, además de 288.429 imágenes para enfoques multimodales. VAANI prioriza la diversidad geográfica, dialectal y sociolingüística, revelando variaciones profundas en el habla real. Este dataset establece un nuevo estándar para la investigación en reconocimiento automático del habla multilingüe.
VAANIARTPARKIIScdataset de vozidiomas minoritariosreconocimiento de vozIndia
Leer noticia original