Mistral AI выпустила Mistral Small 3.0 с 24B параметрами и лицензией Apache 2.0. Модель демонстрирует SOTA результаты в бенчмарках и доступна для коммерческого использования.

15 января 2025 года Mistral AI представила свою последнюю итерацию модели Small — Mistral Small 3.0. Это событие знаменует собой значительный сдвиг в ландшафте открытых языковых моделей, предлагая конкурентам уровня Frontier с эффективностью, ранее доступной только в закрытых системах. Разработчики получают доступ к инструментам, которые ранее требовали огромных вычислительных ресурсов, теперь упакованным в компактный пакет.
Модель не просто обновляет предыдущую версию, она пересматривает стандарты производительности для своего класса. В условиях, когда метамодели становятся все более сложными, Mistral Small 3.0 доказывает, что оптимальное соотношение цены и качества достигается через архитектуру, оптимизированную для реальных задач. Это особенно актуально в 2025 году, когда спрос на AGI ускоряется, а стоимость вычислений остается критическим фактором.
Техническая спецификация Mistral Small 3.0 включает 24 миллиарда параметров, что делает её мощной моделью среднего размера. Архитектура построена на основе MoE (Mixture of Experts), что позволяет модели динамически активировать необходимые части сети для конкретных задач, снижая задержки при генерации. Это обеспечивает высокую скорость вывода без потери точности, что критично для агентов и чат-ботов.
Одной из главных особенностей является поддержка контекстного окна до 128 000 токенов. Это позволяет обрабатывать длинные документы, код репозиториев или многопользовательские логи без потери информации. Модель поддерживает мультимодальные возможности, что расширяет её применение за пределы чистого текста, включая анализ изображений и структурированных данных.
На тестовых площадках Mistral Small 3.0 демонстрирует результаты, приближающиеся к моделям категории Frontier. В бенчмарке MMLU модель набирает 85.2%, что значительно выше предыдущих версий Small. Это подтверждает способность модели понимать сложные логические связи и контекстные нюансы, ранее недоступные для моделей меньшего размера.
В задачах программирования и кодинга показатели также впечатляют. На HumanEval модель достигает 90% точности, а на SWE-bench демонстрирует улучшение на 15% по сравнению с конкурентами. Эти цифры важны для инженеров, которые ищут надежный инструмент для автоматизации разработки без необходимости развертывания гигантских моделей.
Для разработчиков доступен API Mistral Small 3.0 через платформу Mistral Cloud. Стоимость ввода составляет 0.20 доллара за миллион токенов, что делает её одной из самых доступных моделей на рынке. Выходные токены стоят 0.60 доллара за миллион, что является стандартной маркой для моделей такого класса.
Кроме того, модель доступна в открытом виде на Hugging Face, что позволяет запускать её локально на мощных GPU. Для небольших проектов существует бесплатный тариф с лимитом на количество запросов, что идеально подходит для прототипирования и тестирования гипотез перед масштабированием.
Mistral Small 3.0 занимает уникальную нишу между легковесными моделями и тяжелыми гигантами. Сравнение показывает, что она превосходит Llama 3.1 8B по точности, но стоит значительно дешевле, чем Llama 3.1 70B. Это делает её идеальным выбором для приложений, где важна скорость отклика и стоимость за запрос.
Google Gemma 3 также является сильным конкурентом, особенно в контексте поддержки 128k окон. Однако Mistral Small 3.0 выигрывает за счет более гибкой лицензии Apache 2.0, которая не накладывает ограничений на коммерческое использование и модификацию кода, что критично для энтерпрайз-сектора.
Лучше всего Mistral Small 3.0 подходит для задач автоматизации кода, написания тестов и рефакторинга. Благодаря высокой точности на HumanEval, разработчики могут интегрировать её в IDE для подсказок кода в реальном времени. Это снижает время написания кода и уменьшает количество багов на ранних стадиях разработки.
Также модель эффективна для RAG-систем и чат-ботов. Возможность обработки больших контекстов позволяет загружать базы знаний компании и задавать вопросы без потери деталей. Агенты, использующие эту модель, способны выполнять сложные многошаговые задачи с меньшим количеством галлюцинаций.
Для доступа к модели используйте официальный API Mistral Cloud. Подключите библиотеку SDK для Python или JavaScript к эндпоинту модели. Документация предоставляет подробные примеры интеграции, включая управление токенами и обработку ошибок.
Если вы предпочитаете локальное развертывание, скачайте веса модели с Hugging Face. Используйте библиотеки типа vLLM для оптимизации инференса на GPU. Это позволит вам сохранить полный контроль над данными и избежать затрат на облачные API при больших объемах трафика.
API Pricing — Input: 0.20 / Output: 0.60 / Context: 128k