Construyendo entornos SWE de horizonte largo en Hugging Face: Frontier SWE × OpenEnv
El equipo ha empaquetado y adaptado cuatro tareas de FrontierSWE como servicios en formato OpenEnv, desplegados en Hugging Face Spaces. Implementaron un bucle de entrenamiento offline estilo RL utilizando datasets públicos, métricas de Trackio y un entrenador en Space. Estos entornos Dockerizados comparten una API estilo Gym y herramientas MCP para planificación y envío de tareas. Incluyen un adaptador de harness personalizado y una rúbrica multicapa para evaluación de episodios largos. Este proyecto avanza el desarrollo de agentes para tareas complejas de ingeniería de software, ofreciendo entornos reproducibles y observables.
Frontier SWEOpenEnvHugging Face Spacesentornos SWERL offlineTrackioingeniería de software
Leer noticia original