Qwen3-Next: Революция эффективности в открытых LLM от Alibaba Cloud

Alibaba Cloud представила Qwen3-Next, объединяя 80B параметров MoE с высокой производительностью при минимальных затратах. Apache 2.0 лицензия открывает новые горизонты.

10 сентября 2025 г.

Model ReleaseQwen3-Next

Введение: Почему Qwen3-Next важен для разработчиков

Qwen3-Next от Alibaba Cloud — это прорыв в области эффективных больших языковых моделей, который меняет правила игры для индустрии искусственного интеллекта. Выпущенная 10 сентября 2025 года, эта модель решает ключевую проблему современной разработки: баланс между колоссальной мощностью вычислений и реальной доступностью для конечных пользователей. Для разработчиков это означает возможность развертывать мощные LLM на локальных серверах или маломощных инстансах облачных провайдеров без необходимости использовать огромные GPU-кластеры, что ранее было недоступно.

В отличие от закрытых аналогов, Qwen3-Next открыто доступна под лицензией Apache 2.0, что позволяет не только использовать модель, но и модифицировать её под специфические задачи бизнеса. Это решение особенно актуально для компаний, стремящихся к суверенитету данных и полному контролю над цепочкой создания ценности AI-продуктов. Alibaba Cloud продолжает демонстрировать лидерство в области открытых технологий, предоставляя инструменты для глобального сообщества инженеров и исследователей.

Главная цель релиза — показать, что высокая производительность не требует бесконечного потребления энергии. Команда Qwen достигла этого через оптимизацию архитектуры Mixture of Experts, сохраняя при этом уровень интеллекта, сопоставимый с более тяжелыми моделями. Это открывает путь для внедрения сложных агентов в edge-устройствах и локальных сетях предприятий.

Дата релиза: 10 сентября 2025 года
Лицензия: Apache 2.0
Поставщик: Alibaba Cloud

Архитектура и ключевые характеристики модели

Техническая реализация Qwen3-Next базируется на передовой архитектуре Mixture of Experts (MoE), которая кардинально меняет подход к распределению вычислительной нагрузки. Модель содержит 80 миллиардов параметров в общей сложности, однако в каждом конкретном запросе активируется всего 3 миллиарда активных параметров. Это позволяет достичь высокой точности предсказаний при минимальном потреблении памяти и вычислительных ресурсов во время инференса.

Контекстное окно модели расширено до 256 000 токенов, что критически важно для работы с длинными документами, кодовыми репозиториями и сложными техническими спецификациями. Поддержка мультимодальных возможностей позволяет обрабатывать не только текст, но и изображения, что делает модель универсальным инструментом для RAG-систем и визуального анализа данных. Эти характеристики делают Qwen3-Next идеальным выбором для enterprise-задач.

Оптимизация весов модели выполнена с использованием квантования, сохраняющего точность, что позволяет запускать модель на потребительском оборудовании. Команда разработчиков предоставила подробные инструкции по развертыванию, включая оптимизированные версии для GPU и CPU, что значительно снижает порог входа для стартапов.

Qwen3-Next: Революция эффективности в открытых LLM от Alibaba Cloud

Введение: Почему Qwen3-Next важен для разработчиков

Архитектура и ключевые характеристики модели

Производительность и бенчмарки

Стоимость API и тарификация

Сравнение с конкурентами

Сценарии использования и приложения

Как начать работу с моделью

Comparison

Sources