Introducción: Un Hit Histórico para la IA

En una fecha marcada para la historia de la inteligencia artificial, el 5 de agosto de 2025, OpenAI ha anunciado oficialmente el lanzamiento de GPT-OSS. Este evento representa un punto de inflexión significativo, marcando el regreso de OpenAI a la distribución de pesos abiertos desde la liberación de GPT-2 en 2019. A diferencia de las versiones cerradas de GPT-4 o GPT-5, GPT-OSS está diseñado para democratizar el acceso a la última tecnología de procesamiento de lenguaje natural, permitiendo que ingenieros e investigadores auditen, modifiquen y desplieguen el modelo en sus propias infraestructuras.

La decisión de OpenAI de abrir los pesos de sus modelos más avanzados responde a una demanda creciente del ecosistema de desarrollo de agentes autónomos y sistemas empresariales que requieren latencia reducida y control total sobre los datos. Con la publicación de GPT-OSS, la compañía está redefiniendo sus estándares de transparencia, ofreciendo variantes de 20 mil millones y 120 mil millones de parámetros para cubrir desde tareas de baja latencia hasta inferencias de alta complejidad.

Primeros modelos de peso abierto de OpenAI desde GPT-2.
Lanzamiento oficial el 5 de agosto de 2025.
Diseñado para agentes autónomos y uso empresarial.
Soporte para inferencia local y en la nube.

Características Clave y Arquitectura

GPT-OSS se presenta con una arquitectura mixta de expertos (MoE) optimizada para eficiencia energética y velocidad de inferencia. El modelo base cuenta con 120 mil millones de parámetros, aunque existe una variante ligera de 20 mil millones de parámetros para dispositivos con recursos limitados. Ambos modelos han sido entrenados con un contexto nativo de 1 millón de tokens, superando significativamente las ventanas de contexto estándar de modelos anteriores.

La arquitectura incorpora mejoras en la llamada de herramientas y capacidades multimodales, permitiendo la interacción fluida con interfaces gráficas y sistemas operativos. OpenAI ha integrado GPT-OSS con AWS para facilitar su despliegue en entornos empresariales seguros, asegurando que las implementaciones de bajo recurso mantengan un rendimiento comparable al de las versiones premium.

Parámetros: 20B y 120B.
Ventana de contexto: 1 millón de tokens.
Arquitectura MoE (Mixture of Experts).
Capacidad multimodal nativa.

Rendimiento y Benchmarks

En términos de rendimiento, GPT-OSS 120B demuestra una competencia notable en pruebas estándar. Según los resultados preliminares, el modelo alcanza un puntaje del 89% en MMLU (Massive Multitask Language Understanding) y un 92% en HumanEval para tareas de código. Sin embargo, es importante notar que modelos más pequeños de competidores, como el Qwen3.5-9B de Alibaba, han logrado superar a GPT-OSS en benchmarks específicos de eficiencia y ejecución en laptops estándar, lo que indica una fuerte competencia en el espacio de modelos abiertos.

GPT-OSS: El Modelo Abierto de OpenAI que Cambia el Juego

Introducción: Un Hit Histórico para la IA

Características Clave y Arquitectura

Rendimiento y Benchmarks

Precios de API y Valor

Tabla de Comparación

Casos de Uso Recomendados

Cómo Empezar

Comparison

Sources