Релиз MiniMax-M3 знаменует исторический момент: первая open-weights модель, объединившая передовое кодирование, мультимодальность и контекстное окно в 1 млн токенов.

1 июня 2026 года индустрия искусственного интеллекта столкнулась с фундаментальным сдвигом. Компания MiniMax представила MiniMax-M3 — модель с открытыми весами, которая стирает грань между закрытыми проприетарными решениями уровня GPT-4/Opus и доступным open-source сообществом. Это не просто очередное обновление линейки M-series; это технологический манифест.
Это первая модель в мире, которая одновременно достигает фронтирных показателей в написании кода, поддерживает нативную мультимодальность и предлагает контекстное окно объемом в один миллион токенов. Для разработчиков и AI-инженеров это означает конец эпохи компромиссов между мощностью модели и гибкостью её развертывания.
В основе MiniMax-M3 лежит революционная архитектура MiniMax Sparse Attention (MSA). В отличие от традиционных плотных моделей, MSA позволяет эффективно обрабатывать сверхдлинные последовательности, минимизируя вычислительные затраты. Это критически важно для агентских циклов, где каждый новый шаг требует пересчета контекста.
Архитектура MSA обеспечивает гарантированное минимальное окно в 512K токенов с возможностью расширения до 1 миллиона. Согласно предварительным данным, использование MSA позволяет ускорить этап prefilling (предзаполнения) почти в 9.7 раз при работе с контекстом в 1 млн токенов, что радикально снижает задержки (latency) в сложных агентских задачах.
MiniMax-M3 демонстрирует феноменальные результаты в задачах, требующих глубокого логического вывода и автономности. Модель специализируется на агентском поведении (agentic reasoning), демонстрируя выдающиеся способности к автономной декомпозиции задач, использованию инструментов (tool use) и многошаговому рассуждению.
Особого внимания заслуживает результат на бенчмарке BrowseComp, где M3 набрала 83.5 балла, обойдя даже Opus 4.7, чей показатель составил 79.3. В задачах программирования модель показывает результаты, сопоставимые с лучшими закрытыми моделями, что делает её идеальным инструментом для автоматизации разработки ПО и сложного рефакторинга.
Для тех, кто предпочитает использовать модель через API, MiniMax предлагает крайне конкурентную и прозрачную структуру цен. Модель оптимизирована под разные объемы контекста, что позволяет эффективно планировать бюджет при масштабировании приложений.
Одной из наиболее привлекательных функций является поддержка кэширования промптов (prompt caching). Это позволяет существенно снизить стоимость при работе с длинными контекстами, что особенно актуально для RAG-систем и долгоживущих агентских сессий.
Благодаря сочетанию огромного контекста и высокой скорости, MiniMax-M3 открывает двери для создания приложений нового поколения. В задачах RAG (Retrieval-Augmented Generation) модель может «проглатывать» целые библиотеки документации без потери точности.
Для разработчиков ПО M3 становится полноценным AI-напарником, способным не просто писать функции, но и понимать архитектуру всего проекта. В агентских сценариях, где модель должна постоянно обращаться к внешним инструментам и API, архитектура MSA обеспечивает необходимую скорость отклика, предотвращая «зависание» логических циклов.
Доступ к MiniMax-M3 осуществляется через официальную платформу MiniMax API. Разработчики могут интегрировать модель, используя стандартные SDK или прямые HTTP-запросы к эндпоинтам.
Рекомендуется начать с тестирования возможностей декомпозиции задач на небольших наборах данных, чтобы оценить, насколько эффективно архитектура MSA справляется с вашим специфическим рабочим процессом.
API Pricing — Input: $0.60 / M tokens (≤ 512k), $1.20 / M tokens (> 512k) / Output: $2.40 / M tokens (≤ 512k), $4.80 / M tokens (> 512k) / Context: 1M tokens