Ir al contenido principal
Hugging Face Blog

¿Pueden los agentes de voz entender a clientes bilingües? Evaluación de ASR de vanguardia en el habla con cambio de código

Un nuevo estudio de ServiceNow-AI evalúa el rendimiento de los sistemas de reconocimiento automático de voz (ASR) frente al "code-switching" o cambio de código, una práctica común entre hablantes bilingües donde se alternan idiomas en una misma conversación. El estudio revela que los modelos de ASR de vanguardia, como ElevenLabs Scribe V2, Gemini 3 Flash y Assembly AI Universal 3-Pro, manejan el habla con cambio de código con penalizaciones mínimas en comparación con el habla monolingüe. Sin embargo, se observa que los errores de transcripción tienden a concentrarse en las porciones en inglés de las locuciones, lo que sugiere que el cambio de código expone diferencias en la robustez de los modelos y no solo aumenta la dificultad general.

reconocimiento automático de vozASRcambio de códigocode-switchingbilingüeGemini 3 FlashElevenLabs Scribe V2
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h