OpenAI publica pesos open-weight: gpt-oss-120b y gpt-oss-20b disponibles

SAPIENSDATAAI - MIGUEL MARÍN PASCUAL
open-weightgpt-oss-120bgpt-oss-20bOpenAIHugging FaceApache 2.080 GB GPU16 GB RAMchain-of-thoughtmultimodalidad limitada

OpenAI ha publicado por primera vez desde 2019 nuevos modelos de "open-weight": gpt-oss-120b y gpt-oss-20b, disponibles para descarga en Hugging Face. Aunque no se trata de una liberación completa de código y datos de entrenamiento, la entrega de pesos entrenados marca un punto de inflexión en la estrategia de la compañía y abre nuevas posibilidades para desarrolladores, investigadores y entusiastas que quieran ejecutar o adaptar modelos grandes fuera de la nube. (Fuente: Engadget).

Open-weight vs. open-source: diferencia clave

La distinción central es que un modelo de pesos abiertos (open-weight) comparte únicamente los valores numéricos aprendidos durante el entrenamiento —los pesos— pero no necesariamente el código de entrenamiento ni los conjuntos de datos usados. Como explica Benjamin C. Lee, profesor de ingeniería y computación, “un open-weight permite usar el modelo tal cual o ajustarlo (fine-tune) para aplicaciones concretas, mientras que un open-source incluiría además el código de entrenamiento y facilitaciones para reproducir todo el proceso”. En la práctica, eso sitúa a los open-weight a medio camino entre un sistema cerrado (black box comercial) y un proyecto open-source completo.

Especificaciones técnicas y requisitos de hardware

Las diferencias principales entre los dos modelos son de escala y requisito de ejecución:

  • gpt-oss-120b: identificado como 117.000 millones de parámetros; OpenAI recomienda al menos una GPU de 80 GB para un uso eficiente en entornos locales.
  • gpt-oss-20b: alrededor de 21.000 millones de parámetros; OpenAI afirma que puede correr en un equipo moderno con 16 GB de RAM, lo que facilita su uso offline por individuos o pymes.

Ambos modelos se distribuyen bajo licencia Apache 2.0, lo que otorga libertad para modificar y redistribuir las versiones adaptadas, aunque sin incluir los elementos privados del proceso de entrenamiento.

Capacidades y limitaciones funcionales

Los modelos soportan técnicas avanzadas que se han popularizado en las versiones more-frontier de OpenAI: razonamiento por pasos (chain-of-thought) y uso de herramientas (tool use), incluyendo invocación de APIs web o ejecución de código en Python para auxiliar tareas complejas. Sin embargo, presentan limitaciones evidentes:

  • No son multimodales: por sí solos no procesan entradas de imagen, vídeo o voz. Para esas capacidades seguirá siendo necesario usar los modelos comerciales en la nube.
  • Open-weight ≠ open-source completo: no se publican los datos ni el código de entrenamiento, lo cual dificulta auditorías completas del dataset o la reproducción exacta del entrenamiento.

Rendimiento y relación con las familias comerciales de OpenAI

OpenAI indica que los métodos de entrenamiento empleados para estas versiones open-weight aplican técnicas usadas en o3 y otros sistemas frontier recientes. En pruebas de programación competitiva, gpt-oss-120b alcanzó un rendimiento apenas inferior al de o3, mientras que gpt-oss-20b se situó entre o3-mini y o4-mini. Esos indicadores son prometedores, aunque la evaluación en escenarios de producción y la comparación con rivales requerirán pruebas más extensas y variadas.

Contexto estratégico y consideraciones de seguridad

La liberación llega después de retrasos orientados a pruebas de seguridad y afinado, y en un momento en el que OpenAI recibe críticas por alejarse de su misión original de "beneficio para toda la humanidad". Entregar pesos entrenados pero no código ni datos puede entenderse como un equilibrio: se democratiza el acceso a modelos potentes sin facilitar completamente la ingeniería inversa del proceso completo de entrenamiento ni exponer conjuntos de datos propietarios.

El movimiento también contrasta con la estrategia pública de otros actores: Meta ha señalado una reducción en la publicación de modelos de pesos abiertos, lo que hace que la decisión de OpenAI tenga impacto simbólico y práctico en la comunidad de desarrolladores y en el ecosistema de modelos accesibles.

Impacto para la comunidad y casos de uso

Las implicaciones prácticas incluyen:

  • Democratización técnica: proyectos y equipos sin acceso a centros de datos a escala podrán ejecutar y adaptar modelos relativamente potentes en hardware asequible (especialmente con gpt-oss-20b).
  • Investigación y auditoría: investigadores pueden probar comportamientos y adaptar los pesos para estudios de seguridad, sesgo y robustez, aunque la falta de datos dificultará auditorías completas del origen de los sesgos.
  • Desarrollo de productos offline o híbridos: empresas pueden integrar modelos locales para latencia o privacidad, y delegar a los modelos comerciales la multimodalidad o capacidades avanzadas cuando convenga.

Como señala Lee, “open-weight democratiza el acceso a modelos capaces sin que cada actor tenga que construir la infraestructura masiva”, lo que subraya su valor para desarrolladores independientes y organizaciones con recursos limitados.

Despliegue inicial y perspectiva a futuro

OpenAI ya está colaborando con organizaciones para desplegar variantes de estos modelos; por ejemplo, trabaja con AI Sweden, el centro nacional de IA aplicada de Suecia. El equipo describe la liberación como un experimento: la retroalimentación de la comunidad y el uso en el mundo real influirán en la probabilidad de futuras liberaciones de modelos open-weight.

En términos prácticos, esto abre la puerta a una mayor diversidad de implementaciones —desde forks comunitarios hasta integraciones empresariales—, pero también plantea preguntas sobre gobernanza del modelo, mitigación de usos indebidos y mecanismos de responsabilidad cuando los pesos se redistribuyen bajo una licencia permisiva como Apache 2.0.

Conclusión

La publicación de gpt-oss-120b y gpt-oss-20b representa una decisión estratégica intermedia: facilita el acceso a pesos entrenados para fines de experimentación y despliegue local, sin entregar el conjunto completo de herramientas para reconstruir el entrenamiento. Para la comunidad técnica es una oportunidad importante para testar, adaptar y auditar comportamientos en entornos controlados; para los responsables de políticas y seguridad, plantea el reto de equilibrar apertura y mitigación de riesgos en un ecosistema cada vez más fragmentado entre opciones locales y ofertas comerciales en la nube.

Solicitar diagnóstico gratuito
Asesor VirtualAsesor Virtual 24h