El ranking abierto de agentes de IA
Hugging Face e IBM Research lanzan el Open Agent Leaderboard, un sistema de evaluación abierto para comparar sistemas de agentes de IA completos, no solo los modelos subyacentes. Este ranking, acompañado del marco Exgentic, mide la calidad y el coste de los agentes en diversas tareas exigentes como la codificación, el servicio al cliente y la investigación, buscando establecer un estándar para la generalidad y el rendimiento de los agentes en entornos complejos y no sintonizados. Se busca fomentar la transparencia y la colaboración en la evaluación de estas tecnologías modulares, permitiendo a la comunidad entender qué impulsa los resultados en términos de modelo y diseño del agente.
agentes de IAevaluación de IAOpen Agent LeaderboardExgenticHugging FaceIBM Researchsistemas de agentes
Leer noticia original