Введение: Почему Mistral Small 3.1 важен для разработчиков

17 марта 2025 года Mistral AI официально представила новую версию своей открытой архитектуры — Mistral Small 3.1. Это событие знаменует собой значительный сдвиг в ландшафте открытых моделей, объединяя высокую эффективность с новыми мультимодальными возможностями. В отличие от предыдущих версий, ориентированных исключительно на текст, Small 3.1 теперь способен обрабатывать изображения, что открывает новые горизонты для приложений компьютерного зрения и анализа данных.

Для инженерных команд и энтузиастов этот релиз означает доступ к модели с параметрами 24 миллиарда, которая остается компактной по сравнению с frontier-моделями, но предлагает значительно улучшенные способности к пониманию контекста. Лицензия Apache 2.0 гарантирует полную свободу коммерческого использования, что делает ее идеальным выбором для интеграции в корпоративные продукты без юридических ограничений.

Дата выпуска: 17 марта 2025 года
Лицензия: Apache 2.0
Категория: Open Source
Провайдер: Mistral AI

Ключевые особенности и архитектура

Архитектура Mistral Small 3.1 построена на основе улучшенного механизма внимания с поддержкой смешанных экспертов (MoE), что позволяет модели эффективно обрабатывать сложные запросы без чрезмерного потребления вычислительных ресурсов. Важнейшим обновлением стала интеграция мультимодальных способностей, позволяющая модели не только генерировать текст, но и анализировать визуальные данные в реальном времени.

Контекстное окно увеличено до впечатляющих 128 тысяч токенов, что позволяет обрабатывать длинные документы, видео-транскрипции и большие наборы данных за один проход. Это критически важно для задач RAG (Retrieval-Augmented Generation) и анализа долгосрочных диалогов. Модель сохраняет высокую плотность знаний, характерную для предыдущих версий, при этом значительно улучшая точность в задачах, требующих визуального восприятия.

Параметры: 24B
Контекстное окно: 128K токенов
Мультимодальность: Да (Текст + Изображения)
Лицензия: Apache 2.0

Производительность и бенчмарки

В тестировании Mistral Small 3.1 продемонстрировал выдающиеся результаты на стандартных бенчмарках. На MMLU (Massive Multitask Language Understanding) модель достигла 82.5%, что ставит ее в ряд с более тяжелыми моделями. В задачах программирования на HumanEval оценка составила 91.2%, подтверждая способность Small 3.1 к генерации качественного кода.

Mistral Small 3.1: Новая эра открытых мультимодальных моделей

Введение: Почему Mistral Small 3.1 важен для разработчиков

Ключевые особенности и архитектура

Производительность и бенчмарки

Цены API и экономическая эффективность

Сравнение с конкурентами

Сценарии использования

Начало работы с моделью

Comparison

Sources