Cuando la IA del habla se encuentra con la larga cola de lenguajes: Dentro del dataset VAANI
El dataset VAANI, desarrollado por ARTPARK en el Indian Institute of Science (IISc), aborda la escasez de datos de voz de alta calidad para lenguajes de baja recurso, especialmente en India. Recopila 31.255 horas de audio de 156.534 hablantes en 109 lenguajes y 165 distritos, incluyendo 59 lenguajes ausentes en otros datasets abiertos. Su metodología de recolección por distritos preserva la diversidad lingüística, dialectal y geográfica. Además, incorpora casi 300.000 imágenes para enfoques multimodales. VAANI establece un nuevo estándar para datasets de reconocimiento de voz multilingüe y es crucial para el avance de la IA del habla en lenguajes minoritarios.
VAANIARTPARKIIScreconocimiento de vozdatasets de IAlenguajes minoritariosdiversidad lingüística
Leer noticia original