Baidu представила ERNIE-5.1-Preview с рекордной эффективностью MoE и лидерскими показателями в LMArena. Разбор архитектуры и результатов.

9 мая 2026 года компания Baidu официально представила модель ERNIE-5.1-Preview, ставшую значимым событием в индустрии больших языковых моделей. Эта версия标志着 Baidu's возвращение к гонке эффективности, предлагая конкурентоспособную производительность при значительно сниженных затратах на обучение. Модель была выпущена в рамках стратегии по оптимизации инфраструктуры на базе PaddlePaddle, что позволяет ей конкурировать с глобальными игроками, такими как OpenAI и Google, не расходуя ресурсы в прежнем объеме.
Главная цель релиза заключалась в демонстрации того, что снижение стоимости предобучения не обязательно ведет к компромиссу в качестве. ERNIE-5.1-Preview достигла выдающихся результатов в LMArena, заняв первое место среди китайских лабораторий и четвертое место в мире по общей текстовой способности. Это достижение особенно важно для разработчиков, ищущих высокопроизводительные решения без необходимости работать с гигантскими параметрами, характерными для предыдущих версий.
Техническая основа ERNIE-5.1-Preview построена на архитектуре MoE (Mixture of Experts), которая кардинально отличается от предыдущей версии ERNIE-5.0. Общее количество параметров сократилось примерно до трети от предыдущей модели, при этом активные параметры составляют около половины от ERNIE-5.0. Это достигается благодаря использованию Once-For-All эластичной системы обучения, которая позволяет гибко управлять глубиной, шириной и разреженностью модели.
Для пост-обучения используется четырехэтапный конвейер: SFT, обучение модели эксперта в области, On-Policy Distillation и General Online RL. Особое внимание уделено методу Multi-Teacher On-Policy Distillation (MOPD), который обеспечивает высокую точность. Инфраструктура полностью асинхронна и декупирована, что значительно ускоряет процесс обучения и вывода. Благодаря этому Baidu утверждает, что достигла ведущих результатов, используя всего около 6% стоимости предобучения по сравнению с сопоставимыми моделями.
ERNIE-5.1-Preview продемонстрировала впечатляющие результаты на независимых тестах LMArena. Модель заняла #4 место глобально и #1 среди китайских моделей с общим баллом 1,223. В специализированных категориях модель также показывает выдающиеся результаты: она лидирует (#1) в категориях Legal & Government и занимает #9 в Math, что свидетельствует о высоком уровне логического мышления.
В задачах, связанных с бизнесом и финансами, модель заняла #4 место глобально, а в категории Software & IT Services — #7. Отдельного упоминания заслуживает результат в AIME26, где модель набрала 99.6 баллов с использованием инструментов, уступив только Gemini 3.1 Pro. Кроме того, ERNIE-5.1 обошла DeepSeek-V4-Pro на задачах tau-cubed-bench и SpreadsheetBench-Verified, что подтверждает ее превосходство в агентских операциях и работе с данными.
На данный момент точная информация о стоимости API для ERNIE-5.1-Preview не была официально опубликована в открытом доступе. Baidu, как и многие китайские провайдеры, часто использует внутренние системы ценообразования для своих облачных сервисов, которые могут меняться в зависимости от региона и объема использования. Разработчикам рекомендуется обращаться к документации Baidu Cloud или связываться с отделом продаж для получения коммерческих предложений.
Однако известно, что модель уже развернута на более чем 10 платформах для творческих производственных агентов, включая ISEKAI ZERO и Mulan AI. Это означает, что доступ к модели может быть получен через интеграцию с этими платформами, если вы разрабатываете приложения в соответствующих нишах. Отсутствие публичной таблицы цен на момент релиза Preview версии указывает на то, что модель находится в стадии активного тестирования и внедрения.
ERNIE-5.1-Preview идеально подходит для задач, требующих глубокого понимания контекста и точного выполнения инструкций. Благодаря лидерству в категориях Legal & Government, модель может быть использована для автоматизации юридических исследований, анализа контрактов и подготовки правительственных отчетов. Высокий рейтинг в Software & IT Services делает ее отличным выбором для генерации кода, рефакторинга и технической документации.
Агентские возможности модели позволяют ей не просто отвечать на вопросы, но и выполнять многошаговые задачи. В сочетании с использованием инструментов (tool use), модель достигает 99.6 баллов в AIME26, что делает ее пригодной для сложных математических расчетов и анализа финансовых таблиц. Творческие возможности также находятся на уровне Gemini 3.1 Pro, что открывает перспективы для использования в контент-маркетинге и разработке игровых сценариев.
Для интеграции ERNIE-5.1-Preview в свои проекты разработчикам необходимо использовать официальные SDK Baidu или облачные API. Поскольку модель не является open source, доступ к весам модели ограничен. Лучший способ начать — зарегистрироваться в Baidu Cloud и получить доступ к API через их консоль управления. В документации указано, что модель доступна через 10+ платформ для агентов, поэтому стоит проверить совместимость с такими сервисами, как ISEKAI ZERO.
Разработчикам следует учитывать, что модель оптимизирована для работы на инфраструктуре PaddlePaddle. Это может повлиять на выбор хостинга и оптимизацию вывода. Рекомендуется внимательно изучить документацию по пост-обучению, чтобы понять, как MOPD влияет на поведение модели в специфических доменах. Официальные ссылки на блог Baidu предоставляют актуальные обновления по развертыванию и поддержке модели.