Hugging Face Blog

El cuadro de clasificación de agentes abiertos

19 de mayo de 2026

Elron Bandel e IBM Research han lanzado el "Open Agent Leaderboard", un nuevo marco de evaluación abierto para comparar sistemas de agentes de IA completos, no solo los modelos subyacentes. Este benchmark busca medir la generalidad y el coste de los agentes de IA en diversas tareas, incluyendo codificación, servicio al cliente y soporte técnico. Se basa en seis benchmarks preexistentes y un protocolo unificado para estandarizar las pruebas. La iniciativa es completamente de código abierto, con la herramienta Exgentic para reproducir evaluaciones y un artículo científico que describe la metodología.

Open Agent Leaderboardagentes de IAevaluación de agentesExgenticIBM ResearchHugging Facemodelos de lenguaje

Leer noticia original

Volver a Noticias IA

WhatsApp con nuestro agente IAEscríbenos y te atiende nuestro agente IA de WhatsApp. Es una demo real: el mismo que montamos para clientes.Llama y habla con nuestra IA de vozLlámanos al 941 72 25 19 y resuelve tus dudas por teléfono hablando con nuestra IA de voz. Otra demo real, funcionando.