Shanghai AI Lab представил InternLM 3 — open-source модель 8B с режимом глубокого мышления, которая превосходит Llama 3.1 и Qwen2.5 в бенчмарках.

5 марта 2025 года команда Shanghai AI Lab официально объявила о выпуске InternLM 3. Это новая open-source модель, разработанная специально для балансировки производительности и эффективности. В отличие от предыдущих версий, InternLM 3 вводит режим глубокого мышления, что позволяет ей решать сложные логические задачи с точностью, ранее недостижимой для моделей такого размера.
Выпуск этой модели знаменует собой важный шаг в демократизации мощных языковых моделей. Благодаря лицензии Apache 2.0, разработчики могут свободно использовать, модифицировать и распространять модель без ограничений. Это открывает новые возможности для создания кастомных решений в корпоративном секторе и научных исследованиях.
Главная цель релиза — показать, что модели с 8 миллиардами параметров могут конкурировать с более крупными закрытыми аналогами. InternLM 3 оптимизирована для работы с большими контекстами и требует значительно меньше ресурсов для обучения и инференса.
Архитектура InternLM 3 построена на базе плотной модели с 8 миллиардами параметров. Несмотря на компактный размер, она оснащена окном контекста в 128K токенов, что позволяет обрабатывать огромные документы и видео-транскрипты. Обучение проходило на 4 триллионах токенов, что обеспечило глубокое понимание мира и контекста.
Одной из главных инноваций является режим глубокого мышления (Deep Thinking Mode). Эта функция активирует дополнительные вычислительные ресурсы для сложных задач, таких как математика или кодирование. Производительность модели была оптимизирована на 75% по сравнению с предыдущими поколениями, что снижает затраты на инфраструктуру.
Модель поддерживает билингвальную работу с английским и китайским языками без потери качества. Это делает её идеальным выбором для азиатского рынка, где китайский язык является доминирующим.
На независимых тестах InternLM 3 демонстрирует превосходство над Llama 3.1 8B и Qwen2.5 7B. На бенчмарке MMLU модель набрала 84.5%, что на 3.2% выше ближайшего конкурента. В задачах программирования HumanEval она показала результат 91.2%, что подтверждает её пригодность для автоматизации разработки.
Особое внимание стоит уделить SWE-bench, где InternLM 3 успешно решает 65% сложных задач из репозиториев GitHub. Это редкий случай для модели с 8B параметрами. В тестах на логическое рассуждение модель также показала стабильные результаты, превзойдя Qwen2.5 7B в задачах Chain-of-Thought.
Точность генерации кода и способность к рефакторингу были проверены в стресс-тестах. Модель демонстрирует высокую устойчивость к галлюцинациям, что критически важно для enterprise-приложений.
Хотя модель является open-source, Shanghai AI Lab также предлагает платформу для быстрого инференса через API. Стоимость использования зависит от объема токенов и сложности запроса. Для разработчиков доступен бесплатный тариф с лимитом 1000 запросов в день, что идеально подходит для тестирования и прототипирования.
Для коммерческих проектов предусмотрены тарифы с оплатой за использование. Стоимость ввода и вывода токенов рассчитывается в долларах за миллион. Это позволяет точно прогнозировать расходы на внедрение модели в производственные системы.
Для наглядности мы сравнили InternLM 3 с двумя основными конкурентами в сегменте 7-8B моделей. Сравнение включает контекстное окно, максимальную длину вывода и стоимость использования. InternLM 3 выигрывает за счет более глубокого контекста и лучшей стоимости при сопоставимом качестве.
Llama 3.1 8B остается лидером по общей популярности, но InternLM 3 обгоняет его в задачах, требующих длительного контекста. Qwen2.5 7B сильна в китайском языке, но InternLM 3 предлагает более универсальный набор функций для мультиязычных приложений.
InternLM 3 идеально подходит для систем RAG, где требуется анализ больших объемов документации. Благодаря 128K контексту, модель может индексировать целые базы знаний без потери информации. Это критически важно для юридических и медицинских приложений.
В сфере разработки код, модель может использоваться как ассистент для написания unit-тестов и рефакторинга. Её способность понимать сложные архитектуры делает её мощным инструментом для команд, работающих над legacy-кодом.
Для чат-ботов и виртуальных агентов модель обеспечивает естественное взаимодействие с пользователем. Режим глубокого мышления позволяет агентам планировать шаги для выполнения многошаговых задач, таких как бронирование билетов или анализ финансовых отчетов.
Доступ к InternLM 3 открыт через официальные репозитории на Hugging Face и GitHub. Для локального запуска достаточно скачать веса модели и использовать библиотеки типа vLLM или TGI. Документация содержит подробные инструкции по настройке окружения и оптимизации памяти.
Для быстрого старта используйте официальный API. Регистрация занимает несколько минут, после чего вы получаете ключи для доступа к эндпоинтам. SDK для Python и Node.js уже доступны для интеграции в существующие приложения.
API Pricing — Input: 0.15 / Output: 0.25 / Context: 128K