La comunidad de código abierto apoya OpenEnv para el aprendizaje por refuerzo agéntico
OpenEnv, una herramienta para crear entornos de ejecución agénticos como terminales o navegadores, está adoptando un modelo más abierto. Ahora será coordinado por un comité que incluye a Meta-PyTorch, Reflection, Unsloth, Modal, Prime Intellect, Nvidia, Mercor, Fleet AI y Hugging Face. El proyecto busca hacer más accesibles los entornos de entrenamiento para agentes de IA de código abierto, estandarizando cómo se publican, despliegan y consumen los entornos de RL. Esto permitirá entrenar modelos locales eficientemente con "harnesses" especializados, fomentando la innovación en el ecosistema abierto de IA.
OpenEnvaprendizaje por refuerzoagentes de IAcódigo abiertoHugging FacePyTorchNvidia
Leer noticia original