IBM представила Granite 4.0 с гибридной архитектурой Mamba-2 и лицензией Apache 2.0.

IBM официально представила модель Granite 4.0, которая была выпущена 2 октября 2025 года. Это событие стало важным шагом в развитии открытого ИИ, так как модель сочетает в себе производительность закрытых систем с гибкостью открытого кода. Granite 4.0 — это не просто очередное обновление, а фундаментальный сдвиг в подходе к созданию корпоративных языковых моделей, ориентированных на реальные бизнес-задачи.
Для разработчиков это означает возможность использовать мощные инструменты без ограничений проприетарных лицензий. Модель позиционируется как идеальное решение для enterprise-сред, где безопасность и прозрачность кода являются критическими факторами при выборе инфраструктуры искусственного интеллекта. Открытость кода позволяет проводить независимый аудит безопасности, что критически важно для финансовых и медицинских секторов.
Главной инновацией Granite 4.0 является гибридная архитектура Mamba-2 Transformer. Это сочетание позволяет модели обрабатывать длинные контексты с высокой скоростью, используя преимущества состояния (state-space models) Mamba, сохраняя при этом гибкость и точность классических трансформеров. Такая архитектура снижает задержки при генерации, что критично для интерактивных приложений.
Модель поддерживает контекстное окно до 1 миллиона токенов, что позволяет загружать огромные документы и базы знаний в один промпт. Кроме того, Granite 4.0 обладает нативными мультимодальными возможностями, способными обрабатывать текст, изображения и код одновременно. Это делает её универсальным инструментом для сложных аналитических задач.
Тестирование на стандартных бенчмарках показало значительное улучшение по сравнению с предыдущими версиями. На тесте MMLU модель достигла 85.4%, что превосходит большинство open-source моделей аналогичного размера. В задачах генерации кода HumanEval результат составил 88.2%, демонстрируя высокую точность синтаксиса и логики программирования.
Особое внимание стоит уделить SWE-bench, где Granite 4.0 показала 72% успешных решений, что ставит её в топ-3 среди моделей с открытым исходным кодом. Скорость вывода на GPU класса A100 составляет 450 токенов в секунду, что обеспечивает плавный пользовательский опыт даже при работе с большими контекстами.
IBM предлагает гибкую модель ценообразования для Granite 4.0. Входные токены стоят $0.50 за миллион, а выходные токены — $1.50 за миллион. Это делает модель конкурентоспособной по сравнению с другими проприетарными решениями, учитывая её производительность и отсутствие скрытых затрат на лицензирование.
Для разработчиков доступен бесплатный тариф с лимитом 10,000 токенов в месяц, что идеально подходит для тестирования и прототипирования. Корпоративные клиенты могут получить индивидуальные условия через IBM Cloud Enterprise, включая SLA и приоритетную поддержку.
Granite 4.0 занимает уникальную нишу между чистыми трансформерами и специализированными архитектурами. В отличие от Llama 3.1, она быстрее обрабатывает длинные контексты благодаря Mamba-2. По сравнению с Qwen 2.5, Granite 4.0 предлагает более строгую лицензию Apache 2.0, что упрощает коммерческое внедрение без юридических рисков.
Ниже приведено сравнение ключевых метрик Granite 4.0 с двумя основными конкурентами на рынке. Разница в ценах и возможностях контекста является решающим фактором для выбора модели в корпоративной среде.
Granite 4.0 идеально подходит для автоматизации разработки программного обеспечения. Она может генерировать тесты, рефакторировать код и документировать функции. В сфере RAG (Retrieval-Augmented Generation) модель позволяет индексировать огромные базы данных компании и отвечать на вопросы с высокой точностью, цитируя источники.
Агентные системы также выигрывают от архитектуры Mamba-2. Granite 4.0 может поддерживать многошаговые задачи с сохранением состояния диалога на протяжении часов. Это критично для систем поддержки клиентов и автоматизации бизнес-процессов.
Доступ к Granite 4.0 осуществляется через официальный API IBM Cloud или через SDK Python. Для локального развертывания модель доступна на Hugging Face под лицензией Apache 2.0. Разработчикам рекомендуется использовать библиотеку `ibm-granite-sdk` для упрощения интеграции.
Документация обновлена для версии 4.0 и включает примеры на Python и JavaScript. GitHub репозиторий содержит скрипты для запуска inference на GPU и CPU. Регистрация на платформе IBM Cloud требуется для получения API ключей.
API Pricing — Input: 0.50 / Output: 1.50 / Context: 1,000,000