Meituan выпускает LongCat-2.0 — революционную MoE-модель с 1.6T параметров, которая обходит GPT-5.5 в сложных задачах программирования.
30 июня 2026 года индустрия искусственного интеллекта зафиксировала важную веху. Компания Meituan официально представила LongCat-2.0 — модель, которая не просто расширяет границы возможного, но и меняет правила игры в сегменте open-source решений для разработчиков. До этого момента самые мощные возможности в написании кода и глубоком рассуждении были прерогативой закрытых проприетарных систем, но LongCat-2.0 доказывает обратное.
Эта модель является полноценным релизом той самой архитектуры, которая ранее была доступна в ограниченном режиме под названием Owl Alpha на платформе OpenRouter. Теперь разработчики по всему миру могут получить доступ к мощностям, сопоставимым с топовыми коммерческими решениями, используя открытые веса и передовую архитектуру MoE (Mixture of Experts).
LongCat-2.0 — это колоссальная модель с общим количеством параметров 1.6T. Однако, благодаря архитектуре Mixture of Experts (MoE), она не требует бесконечных вычислительных ресурсов для каждого токена. В процессе инференса активно задействуется около 48B параметров, что обеспечивает идеальный баланс между интеллектуальной мощностью и скоростью работы.
Ключевой инновацией является концепция 'Zero-Compute Experts'. Система динамически активирует от 33B до 56B параметров на каждый токен, исключая любые напрасные вычисления. Это позволяет модели быть невероятно гибкой: в зависимости от сложности задачи, она 'подтягивает' именно те нейронные связи, которые необходимы в данный момент.
Для современного разработчика контекст — это всё. LongCat-2.0 поддерживает контекстное окно объемом в 1 000 000 токенов. Это позволяет модели 'проглатывать' целые репозитории кода, многостраничную документацию и огромные логи систем за один проход.
Достичь такой масштабируемости без деградации производительности удалось благодаря технологии LongCat Sparse Attention (LSA). LSA оптимизирует механизмы внимания, позволяя эффективно обрабатывать сверхдлинные последовательности, что делает модель незаменимой для задач глубокого анализа legacy-кода и построения сложных системных архитектур.
Результаты бенчмарков LongCat-2.0 заставляют пересмотреть текущий рейтинг SOTA-моделей. В наиболее критичном для разработчиков тесте SWE-bench Pro модель набрала 59.5 баллов, что официально превзошло показатель GPT-5.5 (58.6). Это означает, что LongCat-2.0 лучше справляется с реальным решением инженерных задач в автономном режиме.
Модель также демонстрирует выдающиеся результаты в мультиязычном программировании (77.3 на SWE-bench Multilingual) и работе с терминалом (70.8 на Terminal-Bench 2.1). Высокие баллы в тестах FORTE (73.2), RWSearch (78.8) и BrowseComp (79.9) подтверждают её превосходство в навигации по информации и выполнении сложных инструкций.
Meituan предлагает крайне агрессивную и конкурентоспособную ценовую политику. Одной из самых привлекательных особенностей является стоимость при использовании кэшированных данных (Cache Hit), которая снижает затраты почти в 20 раз по сравнению со стандартным вводом.
Такая структура цен делает LongCat-2.0 идеальным выбором для построения RAG-систем и агентских циклов, где повторное использование контекста является нормой. Разработчики могут масштабировать свои приложения, не опасаясь взрывного роста счетов за API.
Благодаря архитектуре MOPD, где эксперты разделены на группы (Agent, Reasoning, Interaction), LongCat-2.0 идеально подходит для создания автономных ИИ-агентов. Она может не только писать код, но и планировать шаги, взаимодействовать с пользователем и использовать внешние инструменты.
В области RAG (Retrieval-Augmented Generation) контекстное окно в 1 млн токенов позволяет практически полностью отказаться от сложной предварительной сегментации данных, предоставляя модели возможность самостоятельно находить связи в огромных массивах информации.
Доступ к LongCat-2.0 уже открыт. Вы можете использовать модель через официальные API-эндпоинты Meituan, интегрировать её в свои проекты через стандартные SDK или развернуть локально, используя открытые веса, если позволяют ваши вычислительные мощности.
Для быстрого тестирования рекомендуем начать с использования API, поддерживающего кэширование, чтобы оценить эффективность LSA и Zero-Compute архитектуры на ваших реальных задачах.
API Pricing — Input: 0.75 / Output: 2.95 / Context: 1000000