Введение

Meta AI официально анонсировала выпуск Llama 3.3 6 декабря 2024 года, что стало поворотным моментом для индустрии больших языковых моделей. Это событие демонстрирует стремление компании сделать передовые технологии доступными для всех разработчиков и инженеров.

Главная цель разработки заключалась в создании модели, которая объединяет высокую производительность с экстремальной эффективностью использования ресурсов. Это решает проблему вычислительной стоимости, которая тормозила развитие открытых решений в последние годы.

Разработчики получили мощный инструмент, который может работать на мощных серверах и предлагать результаты, ранее доступные только в закрытых системах. Llama 3.3 открывает новые горизонты для локального деплоя и корпоративных применений.

Дата выпуска: 6 декабря 2024 года
Статус: Open Source
Поставщик: Meta AI

Ключевые функции и архитектура

Архитектура Llama 3.3 построена на основе 70 миллиардов параметров. Это позволяет достичь баланса между скоростью инференса и точностью ответа, что критично для продакшена.

Модель поддерживает контекстное окно до 128 000 токенов, что критически важно для обработки длинных документов и сложных технических задач без потери информации.

Инженеры могут использовать эту модель для создания агентов, способных выполнять многошаговые задачи с минимальным количеством ошибок.

Параметры: 70B
Контекстное окно: 128k токенов
Мультимодальность: Поддержка текста и кода
Лицензия: Apache 2.0

Производительность и бенчмарки

Производительность Llama 3.3 сопоставима с Llama 3.1 405B. Это подтверждено независимыми бенчмарками и тестами на стандартных наборах данных.

На MMLU модель набрала 85.2, что является выдающимся результатом для архитектуры такого размера. На HumanEval модель показала 92.0, что подтверждает её мощь в генерации кода.

В тестах SWE-bench модель достигла 78.5, демонстрируя способность решать сложные задачи программного обеспечения, ранее недоступные для 70B моделей.

MMLU: 85.2
HumanEval: 92.0
SWE-bench: 78.5
Efficiency: 5x быстрее 405B версии

Цены API

Meta предлагает доступную тарификацию для API Llama 3.3. Это делает её конкурентоспособной по сравнению с GPT-4 и Claude 3.5.

Meta Llama 3.3: Новая Эра Эффективности в 70B

Введение

Ключевые функции и архитектура

Производительность и бенчмарки

Цены API

Сравнение моделей

Сценарии использования

Начало работы

Comparison

Sources