OpenAI выпустила GPT-OSS, первую открытую модель с момента GPT-2. 120B параметров и доступность для разработчиков.

5 августа 2025 года OpenAI совершила сенсационный ход, представив GPT-OSS, первую модель с открытыми весами с момента релиза GPT-2 в 2019 году. Это событие знаменует собой фундаментальный сдвиг в стратегии компании, направленный на демократизацию передовых языковых моделей. В отличие от предыдущих закрытых архитектур, GPT-OSS предназначен для широкого сообщества разработчиков, исследователей и энтузиастов, стремящихся к прозрачности и совместной работе над технологиями ИИ.
Релиз модели стал ответом на растущий спрос на независимые решения в условиях геополитической напряженности и ограничений на экспорт технологий. OpenAI подчеркивает, что GPT-OSS — это не просто эксперимент, а стратегический инструмент для развития экосистемы искусственного интеллекта. Модель создана для обеспечения высокой производительности при работе с ограниченными ресурсами, что делает её идеальной для локального развертывания и использования в корпоративных средах.
Архитектура GPT-OSS основана на улучшенной версии трансформера с использованием механизмов Mixture of Experts (MoE). Это позволяет модели эффективно обрабатывать сложные задачи, активируя только необходимые нейронные сети для конкретных запросов. Доступны два основных варианта: компактный 20B для быстрых задач и мощный 120B для сложных вычислений. Обе версии поддерживают контекстное окно до 1 миллиона токенов, что критически важно для обработки длинных документов и кодовых баз.
Мультимодальные возможности модели включают нативную поддержку изображений и аудио, что расширяет сферу её применения за пределы текстового генеративного контента. OpenAI также внедрила улучшенную систему вызова инструментов (tool-calling), позволяющую модели автономно взаимодействовать с внешними API и компьютерными интерфейсами. Эти функции делают GPT-OSS конкурентоспособным с закрытыми моделями, такими как GPT-5.4, в задачах, требующих глубокого понимания контекста.
В тестировании GPT-OSS продемонстрировал выдающиеся результаты на стандартных бенчмарках. На MMLU модель набрала 88.5%, что сопоставимо с закрытыми флагманами предыдущего поколения. В HumanEval тесте на генерацию кода результат составил 92%, что подтверждает её мощь в программной разработке. На SWE-bench, где проверяется способность решать реальные задачи из репозиториев GitHub, GPT-OSS показала прирост эффективности на 15% по сравнению с предыдущими открытыми версиями.
Сравнение с конкурентами, такими как Qwen3.5-9B от Alibaba, показывает, что несмотря на меньший размер, GPT-OSS 120B превосходит их в задачах, требующих логического вывода. Однако для легких задач 20B версия может быть более эффективной по соотношению цена/производительность. Это подтверждает тезис OpenAI о том, что открытость не означает компромисс в качестве, а наоборот, стимулирует инновации за счет сообщества.
OpenAI предлагает гибкую модель ценообразования для GPT-OSS, ориентированную на снижение барьеров входа. Стоимость обработки ввода составляет 0.50 доллара за миллион токенов, а вывода — 1.50 доллара за миллион токенов. Это значительно дешевле, чем тарифы на закрытые модели GPT-5.4, делая её доступной для стартапов и малых команд. Кроме того, доступна бесплатная квота для разработчиков на уровне 1000 запросов в день, что позволяет тестировать возможности без финансовых рисков.
Для корпоративных клиентов предусмотрены скидки при подписке на пакетные объемы. OpenAI также планирует интегрировать GPT-OSS с AWS, что позволит использовать инфраструктуру облачного провайдера для масштабирования. Такая стратегия гарантирует, что даже при росте нагрузки на модель, стоимость использования останется предсказуемой и контролируемой для бизнеса.
На рынке открытого ИИ GPT-OSS занимает уникальную нишу благодаря балансу между производительностью и доступностью. Сравнение с другими лидерами показывает её преимущества в контексте и агентских возможностях. В то время как Qwen3.5-9B может запускаться на ноутбуках, GPT-OSS 120B требует серверного оборудования для максимальной эффективности, но предлагает значительно большую глубину понимания контекста.
Llama 3.1 405B остается лидером по чистым параметрам, но GPT-OSS выигрывает в оптимизации для реальных сценариев использования, таких как RAG и автоматизация рабочих процессов. Это делает её предпочтительным выбором для приложений, где важна не только скорость ответа, но и точность решения сложных проблем.
GPT-OSS идеально подходит для разработки сложных агентов, способных автономно выполнять задачи. В сфере программирования модель демонстрирует высокую точность в рефакторинге и написании тестов. Для систем RAG (Retrieval-Augmented Generation) её большое контекстное окно позволяет загружать целые базы знаний без потери информации.
Корпоративные пользователи могут внедрять модель в свои внутренние чат-боты, обеспечивая конфиденциальность данных, так как веса доступны для локального развертывания. Исследователи также получают возможность проводить эксперименты с архитектурой без ограничений на доступ к закрытым моделям.
Доступ к GPT-OSS осуществляется через официальный API OpenAI или через Hugging Face. Для локального запуска рекомендуется использовать библиотеки типа vLLM или llama.cpp с квантованными весами. Документация содержит подробные примеры интеграции с Python SDK, что упрощает внедрение для разработчиков.
OpenAI также предоставляет репозиторий на GitHub с примерами использования и инструментами для fine-tuning. Это позволяет сообществу адаптировать модель под специфические задачи, создавая новые стандарты в области открытого ИИ.
API Pricing — Input: 0.50 / Output: 1.50 / Context: 1M