Mistral AI представила Small 4 с 119B параметрами MoE, объединяющую Pixtral, Magistral и Devstral в одном Apache 2.0 лицензионном продукте.

Mistral Small 4, выпущенная 16 марта 2026 года, представляет собой значительный шаг вперед в архитектуре открытых моделей от Mistral AI. Эта модель объединяет функции инструкций, логического вывода, программирования и мультимодальности в единый пакет. Для разработчиков это означает существенное упрощение стека технологий, так как больше не нужно переключаться между разными специализированными моделями для различных задач. Apache 2.0 лицензия позволяет свободное использование в коммерческих и исследовательских проектах без ограничений, что делает её предпочтительным выбором для многих компаний.
Рынок искусственного интеллекта столкнулся с проблемой фрагментации, когда для каждой задачи требовалась своя модель. Small 4 решает эту проблему, консолидируя Magistral (логика), Pixtral (зрение) и Devstral (код). Это не просто обновление, а фундаментальная перестройка подхода к открытым весам, позволяющая снизить стоимость инференса без потери качества. Для инженеров это означает возможность развертывать сложные системы на одном узле, экономя ресурсы и упрощая обслуживание инфраструктуры.
Архитектура модели основана на Mixture of Experts (MoE) с общим количеством параметров 119B, из которых активно используется 6.5B. Это обеспечивает высокую эффективность инференса при сохранении качества больших моделей. Окно контекста составляет 256K токенов, что позволяет обрабатывать длинные документы и сложные цепочки размышлений. Модель поддерживает настраиваемый уровень логического вывода, что дает гибкость в настройке под конкретные задачи.
Техническая реализация оптимизирована для аппаратного обеспечения последних поколений, включая актуальные GPU NVIDIA Blackwell и процессоры AMD Zen 5. Это позволяет достичь высокой пропускной способности даже на кластерах среднего размера. Поддержка мультимодальности встроена на уровне архитектуры, а не как отдельный модуль, что ускоряет обработку смешанных запросов.
В тестах MMLU модель показала результат 88.5%, превосходя предыдущие версии и многие закрытые аналоги. На HumanEval она достигла 92% точности, что делает её лидером в генерации кода среди открытых решений. В SWE-bench модель заняла второе место среди открытых моделей, демонстрируя сильную способность решать реальные задачи разработки. Эти метрики подтверждают, что объединение модулей не ухудшило качество, а улучшило общую согласованность ответов.
Сравнение с конкурентами показывает, что Small 4 превосходит Llama 3.1 405B по эффективности на активные параметры. В задачах агентов модель демонстрирует лучшую способность к планированию и использованию инструментов. Это критически важно для сложных RAG-систем, где требуется не только поиск, но и логическая обработка найденной информации.
Стоимость использования модели доступна для широкого круга пользователей благодаря оптимизированной архитектуре MoE. Входные токены стоят $0.10 за миллион, а выходные — $0.40 за миллион. Это значительно дешевле, чем аналогичные закрытые решения от OpenAI или Google. Для небольших проектов доступен бесплатный тариф с лимитом на количество запросов, что позволяет тестировать модель без финансовых рисков.
Платформа Mistral Forge позволяет бизнесу развертывать модель локально или в облаке с полной защитой данных. Это соответствует требованиям суверенитета ИИ для европейских и глобальных предприятий. Интеграция с существующими инструментами происходит через стандартные SDK для Python, Node.js и Go.
Для наглядности представлено сравнение Mistral Small 4 с ключевыми конкурентами на рынке. Модель выигрывает в гибкости и лицензии, предлагая лучший баланс между стоимостью и производительностью. Контекстное окно и способность к многозадачности делают её универсальным выбором для новых проектов.
В таблице ниже приведены основные характеристики. Обратите внимание на стоимость вывода, где Small 4 предлагает конкурентное преимущество при сохранении высокого качества генерации.
Модель идеально подходит для агентных систем, автоматизации поддержки клиентов и анализа данных. Разработчики могут внедрять её в существующие RAG-пайплайны без значительных изменений. Мультимодальные возможности позволяют обрабатывать изображения и видео напрямую, что расширяет область применения в медиа и дизайне.
В корпоративном секторе Small 4 используется для внутреннего поиска знаний и генерации документации. Благодаря 256K контексту, она может анализировать целые базы знаний компании за один запрос. Это снижает нагрузку на человеческий персонал и ускоряет процессы принятия решений.
Доступна через Hugging Face и официальный API Mistral. SDK доступны для Python, Node.js и Go. Документация обновлена под новую версию и содержит примеры кода для быстрой интеграции. Регистрация аккаунта занимает несколько минут, после чего можно получить ключи API.
Для локального запуска используйте Docker-контейнеры с оптимизированными весами. Поддерживаются форматы GGUF и Safetensors. Следите за обновлениями на GitHub репозитории Mistral AI для получения новых функций и исправлений безопасности.
API Pricing — Input: $0.10 / Output: $0.40 / Context: 256K