Macaron-V1-Preview-749B: Новая эра Mixture-of-LoRA и агентских систем от MindLab Research

Разбор революционной open-source модели Macaron-V1-Preview-749B, использующей архитектуру MoL для создания по-настоящему специализированных ИИ-агентов.

7 июня 2026 г.

Model ReleaseMacaron-V1-Preview-749B

Введение: Исторический момент для Open Source

7 июня 2026 года индустрия искусственного интеллекта столкнулась с новой вехой. MindLab Research представила Macaron-V1-Preview-749B — модель, которая меняет само представление о масштабируемости и специализации больших языковых моделей. Это не просто очередной релиз; это переход от монолитных архитектур к динамическим агентским системам.

Это первая модель класса 749B, построенная на инновационной архитектуре Mixture-of-LoRA (MoL), которая позволяет сочетать колоссальную базу знаний с узкоспециализированными навыками в реальном времени. Для разработчиков и AI-инженеров это означает возможность развертывания системы, которая ведет себя как эксперт в кодинге, дизайне интерфейсов или управлении личной жизнью, не теряя при этом общей эрудиции.

Дата релиза: 07.06.2026
Тип: Open-source (MIT License)
Архитектура: Mixture-of-LoRA (MoL)
Разработчик: MindLab Research

Архитектура и технические характеристики: Сила MoL

В основе Macaron-V1-Preview-749B лежит замороженная база GLM-5.1 объемом 744B параметров. Однако магия происходит благодаря пяти специализированным LoRA-адаптерам (по ~1B параметров каждый), которые подключаются динамически. Такая структура позволяет модели сохранять стабильность базовых знаний, одновременно обучаясь новым паттернам через адаптеры.

Уникальность подхода заключается в Router Tool дизайне. Выбор специалиста не является «черным ящиком» — модель использует явный вызов инструмента `change_model` для переключения между LoRA. Это делает процесс маршрутизации полностью отлаживаемым и совместимым с vLLM OpenAI server mode. Кроме того, модель поддерживает контекстное окно в 202,752 токена и работает с точностью bfloat16.

Общий объем параметров: 749B (744B base + 5x1B LoRA)
Контекстное окно: 202,752 токена
Точность: bfloat16
Механизм маршрутизации: Explicit `change_model` tool call

Специализированные адаптеры и агентские возможности

Модель поставляется с пятью пре-тренированными экспертами, каждый из которых оптимизирован под конкретные задачи: L0 (общий чат), L1 (личные задачи), L2 (программирование), L3 (Generative UI через протокол A2UI) и L4 (агентские задачи в стиле OpenClaw).

Macaron-V1-Preview-749B: Новая эра Mixture-of-LoRA и агентских систем от MindLab Research

Введение: Исторический момент для Open Source

Архитектура и технические характеристики: Сила MoL

Специализированные адаптеры и агентские возможности

Инновации в обучении: R3 и самоэволюция

Бенчмарки и производительность

Стоимость и доступность

Заключение: Как начать работу

Sources