Введение: Новый этап для OpenAI

5 августа 2025 года OpenAI совершила сенсационный ход, представив GPT-OSS, первую модель с открытыми весами с момента релиза GPT-2 в 2019 году. Это событие знаменует собой фундаментальный сдвиг в стратегии компании, направленный на демократизацию передовых языковых моделей. В отличие от предыдущих закрытых архитектур, GPT-OSS предназначен для широкого сообщества разработчиков, исследователей и энтузиастов, стремящихся к прозрачности и совместной работе над технологиями ИИ.

Релиз модели стал ответом на растущий спрос на независимые решения в условиях геополитической напряженности и ограничений на экспорт технологий. OpenAI подчеркивает, что GPT-OSS — это не просто эксперимент, а стратегический инструмент для развития экосистемы искусственного интеллекта. Модель создана для обеспечения высокой производительности при работе с ограниченными ресурсами, что делает её идеальной для локального развертывания и использования в корпоративных средах.

Первый открытый весовой продукт OpenAI с 2019 года.
Фокус на низкоресурсную производительность и агентские задачи.
Два варианта: 20B и 120B параметров для гибкости.

Ключевые функции и архитектура

Архитектура GPT-OSS основана на улучшенной версии трансформера с использованием механизмов Mixture of Experts (MoE). Это позволяет модели эффективно обрабатывать сложные задачи, активируя только необходимые нейронные сети для конкретных запросов. Доступны два основных варианта: компактный 20B для быстрых задач и мощный 120B для сложных вычислений. Обе версии поддерживают контекстное окно до 1 миллиона токенов, что критически важно для обработки длинных документов и кодовых баз.

Мультимодальные возможности модели включают нативную поддержку изображений и аудио, что расширяет сферу её применения за пределы текстового генеративного контента. OpenAI также внедрила улучшенную систему вызова инструментов (tool-calling), позволяющую модели автономно взаимодействовать с внешними API и компьютерными интерфейсами. Эти функции делают GPT-OSS конкурентоспособным с закрытыми моделями, такими как GPT-5.4, в задачах, требующих глубокого понимания контекста.

Параметры: 20B и 120B.
Контекстное окно: до 1 млн токенов.
Технология: MoE (Mixture of Experts).
Поддержка: Текст, изображения, аудио.

Производительность и бенчмарки

В тестировании GPT-OSS продемонстрировал выдающиеся результаты на стандартных бенчмарках. На MMLU модель набрала 88.5%, что сопоставимо с закрытыми флагманами предыдущего поколения. В HumanEval тесте на генерацию кода результат составил 92%, что подтверждает её мощь в программной разработке. На SWE-bench, где проверяется способность решать реальные задачи из репозиториев GitHub, GPT-OSS показала прирост эффективности на 15% по сравнению с предыдущими открытыми версиями.

OpenAI GPT-OSS: Исторический шаг в открытый исходный код

Введение: Новый этап для OpenAI

Ключевые функции и архитектура

Производительность и бенчмарки

Ценообразование API

Сравнение с конкурентами

Сценарии использования

Как начать работу

Comparison

Sources