Vividh-ASR: Diagnóstico y solución del sesgo de estudio en Whisper para lenguas índicas
Adalat AI presenta Vividh-ASR, un benchmark para evaluar modelos de reconocimiento de voz (ASR) en lenguas índicas, centrándose en el "sesgo de estudio" de modelos existentes como Whisper. Han desarrollado una receta de ajuste fino de Whisper que mejora la robustez en diferentes condiciones acústicas (conversación espontánea, ruido), especialmente utilizando una alta tasa de aprendizaje. Sus modelos superan a otros públicos, incluso con menos parámetros, lo que ofrece un camino para un ASR más eficaz en entornos judiciales indios.
Vividh-ASRWhisperreconocimiento de vozlenguas índicasAdalat AIajuste finosesgo de estudio
Leer noticia original