Введение: Что такое InternLM 3?

5 марта 2025 года команда Shanghai AI Lab официально объявила о выпуске InternLM 3. Это новая open-source модель, разработанная специально для балансировки производительности и эффективности. В отличие от предыдущих версий, InternLM 3 вводит режим глубокого мышления, что позволяет ей решать сложные логические задачи с точностью, ранее недостижимой для моделей такого размера.

Выпуск этой модели знаменует собой важный шаг в демократизации мощных языковых моделей. Благодаря лицензии Apache 2.0, разработчики могут свободно использовать, модифицировать и распространять модель без ограничений. Это открывает новые возможности для создания кастомных решений в корпоративном секторе и научных исследованиях.

Главная цель релиза — показать, что модели с 8 миллиардами параметров могут конкурировать с более крупными закрытыми аналогами. InternLM 3 оптимизирована для работы с большими контекстами и требует значительно меньше ресурсов для обучения и инференса.

Дата выпуска: 2025-03-05
Лицензия: Apache 2.0
Языки: Английский + Китайский
Специализация: Reasoning и Coding

Ключевые особенности и архитектура

Архитектура InternLM 3 построена на базе плотной модели с 8 миллиардами параметров. Несмотря на компактный размер, она оснащена окном контекста в 128K токенов, что позволяет обрабатывать огромные документы и видео-транскрипты. Обучение проходило на 4 триллионах токенов, что обеспечило глубокое понимание мира и контекста.

Одной из главных инноваций является режим глубокого мышления (Deep Thinking Mode). Эта функция активирует дополнительные вычислительные ресурсы для сложных задач, таких как математика или кодирование. Производительность модели была оптимизирована на 75% по сравнению с предыдущими поколениями, что снижает затраты на инфраструктуру.

Модель поддерживает билингвальную работу с английским и китайским языками без потери качества. Это делает её идеальным выбором для азиатского рынка, где китайский язык является доминирующим.

Параметры: 8B
Контекст: 128K токенов
Объем данных: 4T токенов
Экономия затрат: 75%

Производительность и бенчмарки

На независимых тестах InternLM 3 демонстрирует превосходство над Llama 3.1 8B и Qwen2.5 7B. На бенчмарке MMLU модель набрала 84.5%, что на 3.2% выше ближайшего конкурента. В задачах программирования HumanEval она показала результат 91.2%, что подтверждает её пригодность для автоматизации разработки.

InternLM 3: Революция в эффективных моделях от Shanghai AI Lab

Введение: Что такое InternLM 3?

Ключевые особенности и архитектура

Производительность и бенчмарки

Ценообразование и API

Сравнительный анализ моделей

Сценарии использования

Как начать работу

Comparison

Sources