Введение: Новое поколение китайских LLM

9 мая 2026 года компания Baidu официально представила модель ERNIE-5.1-Preview, ставшую значимым событием в индустрии больших языковых моделей. Эта версия标志着 Baidu's возвращение к гонке эффективности, предлагая конкурентоспособную производительность при значительно сниженных затратах на обучение. Модель была выпущена в рамках стратегии по оптимизации инфраструктуры на базе PaddlePaddle, что позволяет ей конкурировать с глобальными игроками, такими как OpenAI и Google, не расходуя ресурсы в прежнем объеме.

Главная цель релиза заключалась в демонстрации того, что снижение стоимости предобучения не обязательно ведет к компромиссу в качестве. ERNIE-5.1-Preview достигла выдающихся результатов в LMArena, заняв первое место среди китайских лабораторий и четвертое место в мире по общей текстовой способности. Это достижение особенно важно для разработчиков, ищущих высокопроизводительные решения без необходимости работать с гигантскими параметрами, характерными для предыдущих версий.

Дата релиза: 2026-05-09
Статус: Preview (не является open source)
Платформа: Baidu Cloud / PaddlePaddle

Архитектура и ключевые особенности

Техническая основа ERNIE-5.1-Preview построена на архитектуре MoE (Mixture of Experts), которая кардинально отличается от предыдущей версии ERNIE-5.0. Общее количество параметров сократилось примерно до трети от предыдущей модели, при этом активные параметры составляют около половины от ERNIE-5.0. Это достигается благодаря использованию Once-For-All эластичной системы обучения, которая позволяет гибко управлять глубиной, шириной и разреженностью модели.

Для пост-обучения используется четырехэтапный конвейер: SFT, обучение модели эксперта в области, On-Policy Distillation и General Online RL. Особое внимание уделено методу Multi-Teacher On-Policy Distillation (MOPD), который обеспечивает высокую точность. Инфраструктура полностью асинхронна и декупирована, что значительно ускоряет процесс обучения и вывода. Благодаря этому Baidu утверждает, что достигла ведущих результатов, используя всего около 6% стоимости предобучения по сравнению с сопоставимыми моделями.

Архитектура: MoE (1/3 total params, 1/2 active params)
Фреймворк: Once-For-All elastic training
RL: Decoupled fully-asynchronous reinforcement learning
Post-training: 4-stage pipeline with MOPD

Производительность и бенчмарки

ERNIE-5.1-Preview продемонстрировала впечатляющие результаты на независимых тестах LMArena. Модель заняла #4 место глобально и #1 среди китайских моделей с общим баллом 1,223. В специализированных категориях модель также показывает выдающиеся результаты: она лидирует (#1) в категориях Legal & Government и занимает #9 в Math, что свидетельствует о высоком уровне логического мышления.

Baidu ERNIE-5.1: Моделю эффективности и лидерства

Введение: Новое поколение китайских LLM

Архитектура и ключевые особенности

Производительность и бенчмарки

API Pricing и доступность

Сценарии использования

Как начать работу с моделью

Sources