Введение: Исторический прорыв в Open Source

5 апреля 2025 года Meta AI официально объявила о выпуске Llama 4, что стало одним из самых значимых событий в истории генеративного искусственного интеллекта. В отличие от предыдущих версий, которые часто ограничивались текстовыми задачами, Llama 4 представляет собой нативный мультимодальный фреймворк, способный обрабатывать текст, изображения и видео одновременно. Это решение знаменует переход от моделей, которые просто анализируют данные, к системам, которые действительно понимают контекст через раннюю фьюзию (early fusion).

Для разработчиков и инженеров это означает доступ к инструментам уровня корпоративных моделей, но с открытым весом. Open-source природа Llama 4 позволяет исследователям модифицировать архитектуру, что критически важно для специализированных задач. Историческая значимость модели заключается в том, что она закрывает разрыв между закрытыми проприетарными решениями, такими как GPT-4o или Claude 3.5, и доступными для сообщества моделями, предлагая производительность, ранее недостижимую в рамках open-weight.

Дата релиза: 5 апреля 2025 года
Категория: Open-source, Open-weight
Провайдер: Meta AI

Ключевые особенности и Архитектура

Архитектура Llama 4 базируется на Massive Mixture of Experts (MoE), что позволяет модели эффективно использовать вычислительные ресурсы. Модель разделена на две основные версии для разных сценариев использования: Scout и Maverick. Scout ориентирован на доступность, имея 109 миллиардов параметров, и способен запускаться на одном GPU H100. Это делает его идеальным для локальных развертываний и edge-вычислений.

Версия Maverick, напротив, является флагманом с 400+ миллиардами параметров MoE. Для работы Maverick требуется мощная H100 DGX система, что открывает возможности для сложных задач, требующих глубокого анализа. Обе версии поддерживают контекстное окно до 10 миллионов токенов, что позволяет обрабатывать целые книги или часовые видеофайлы без потери информации. Нативная мультимодальность реализована через early fusion, объединяя данные на уровне токенизации, что повышает точность понимания визуального и текстового контекста.

Scout: 109B параметров, 1 H100 GPU
Maverick: 400B+ параметров, H100 DGX
Контекст: 10M токенов
Возможности: Текст, Изображение, Видео

Производительность и Бенчмарки

В тестах Llama 4 показывает результаты, превосходящие предыдущие версии Llama 3.1. На бенчмарке MMLU модель набирает 88.5%, что ставит её на уровень лучших проприетарных решений. В задачах кодинга HumanEval результат составляет 92.1%, демонстрируя высокую эффективность в генерации и отладке программного кода. Для инженеров, работающих с реальными системами, показатель SWE-bench (Software Engineering Benchmark) является критическим, и Llama 4 здесь достигает 75% решения реальных задач.

Llama 4: Революция Open Source AI от Meta

Введение: Исторический прорыв в Open Source

Ключевые особенности и Архитектура

Производительность и Бенчмарки

Тарифы на API и Доступность

Сравнительный анализ

Сценарии использования

Начало работы

Comparison

Sources