Разбор революционной open-source модели Macaron-V1-Preview-749B, использующей архитектуру MoL для создания по-настоящему специализированных ИИ-агентов.

7 июня 2026 года индустрия искусственного интеллекта столкнулась с новой вехой. MindLab Research представила Macaron-V1-Preview-749B — модель, которая меняет само представление о масштабируемости и специализации больших языковых моделей. Это не просто очередной релиз; это переход от монолитных архитектур к динамическим агентским системам.
Это первая модель класса 749B, построенная на инновационной архитектуре Mixture-of-LoRA (MoL), которая позволяет сочетать колоссальную базу знаний с узкоспециализированными навыками в реальном времени. Для разработчиков и AI-инженеров это означает возможность развертывания системы, которая ведет себя как эксперт в кодинге, дизайне интерфейсов или управлении личной жизнью, не теряя при этом общей эрудиции.
В основе Macaron-V1-Preview-749B лежит замороженная база GLM-5.1 объемом 744B параметров. Однако магия происходит благодаря пяти специализированным LoRA-адаптерам (по ~1B параметров каждый), которые подключаются динамически. Такая структура позволяет модели сохранять стабильность базовых знаний, одновременно обучаясь новым паттернам через адаптеры.
Уникальность подхода заключается в Router Tool дизайне. Выбор специалиста не является «черным ящиком» — модель использует явный вызов инструмента `change_model` для переключения между LoRA. Это делает процесс маршрутизации полностью отлаживаемым и совместимым с vLLM OpenAI server mode. Кроме того, модель поддерживает контекстное окно в 202,752 токена и работает с точностью bfloat16.
Модель поставляется с пятью пре-тренированными экспертами, каждый из которых оптимизирован под конкретные задачи: L0 (общий чат), L1 (личные задачи), L2 (программирование), L3 (Generative UI через протокол A2UI) и L4 (агентские задачи в стиле OpenClaw).
Особого внимания заслуживает интеграция с Harness Context Protocol (HCP). Благодаря совместной разработке с Production Agent Harness, маршрутизация, управление памятью и токенизация вызовов инструментов идентичны как при обучении, так и при инференсе. Это минимизирует разрыв между лабораторными исследованиями и реальным продакшеном.
MindLab Research внедрили R3 (Rollout Routing Replay) для обеспечения доказуемого соответствия экспертным путям во время RL-обучения MoE. Это сочетается с коррекцией роллаутов в стиле IcePop и исправлениями DSA-внимания, что гарантирует высокую точность маршрутизации.
Более того, Macaron обладает способностью к самоэволюции через цикл AutoResearch + Context Learning. Модель способна самостоятельно улучшать свои промпты и структуры (scaffolds), а затем дистиллировать улучшенные траектории обратно в параметры, создавая петлю непрерывного самосовершенствования.
Для оценки способностей Macaron был разработан Macaron LivingBench — динамический бенчмарк для личных агентов, включающий динамический шум, изменяющуюся среду и симуляцию поведения пользователя. Это делает оценку гораздо более реалистичной, чем стандартные статические тесты.
В задачах Generative UI модель демонстрирует феноменальную производительность благодаря обучению на протоколе A2UI, достигая задержки TPOT всего в 3 мс в интерактивных сценариях. Для оценки корректности протокола используется A2UI-Bench, который анализирует не только точность выполнения задачи, но и реальный пользовательский опыт (UX) с визуальной оценкой.
На текущий момент Macaron-V1-Preview-749B доступна в виде open-source репозитория на Hugging Face под лицензией MIT. Весь код и веса (база в корне, LoRA в папках l0-l4) доступны для локального развертывания.
Для тех, кто предпочитает управляемый инференс, MindLab анонсировала запуск платформы MinT, где скоро появится управляемый доступ к модели. Также планируется выпуск полнофункциональных версий (non-preview) размером 30B и 200B параметров.
Macaron-V1-Preview-749B — это не просто модель, это полноценный фреймворк для создания следующего поколения ИИ-агентов. Благодаря интеграции MindForge agentic RL и протоколам HCP, разработчики получают инструменты, которые раньше были доступны только закрытым проприетарным системам.
Вы можете начать с изучения репозитория на Hugging Face или протестировать возможности модели через live-превью на официальном сайте. Будущее агентских систем уже здесь, и оно открыто для всех.