Введение

Vicuna, разработанная организацией Large Model Systems Organization (LMSYS), представляет собой революционную открытую языковую модель, которая доказывает, что высококачественные чатботы могут быть доступны для всех. Выпущенная 30 марта 2023 года, Vicuna-13B стала результатом тонкой настройки модели LLaMA на пользовательских беседах из ShareGPT, что позволило достичь почти 90% качества ChatGPT при значительно более низкой стоимости.

Этот проект стал важным шагом в democratization крупных языковых моделей, предоставляя разработчикам и исследователям доступ к мощному инструменту без лицензионных ограничений коммерческих решений. Vicuna быстро завоевала популярность в сообществе ИИ благодаря своей производительности и открытому исходному коду.

Релиз Vicuna также совпал с запуском Chatbot Arena - уникальной платформы для сравнения языковых моделей, где пользователи могут проводить слепые сравнения различных чат-ботов. Это создало объективную среду для оценки производительности различных моделей, включая Vicuna.

С тех пор как Vicuna была представлена, она продолжает развиваться, с версиями v1.5, построенными поверх Llama 2, которые улучшают контекстные возможности и общую производительность модели.

Ключевые особенности и архитектура

Vicuna-13B основана на архитектуре LLaMA (Large Language Model Meta AI) и использует процесс тонкой настройки для адаптации модели к диалоговым сценариям. Модель имеет 13 миллиардов параметров, что делает ее достаточно компактной для локального развертывания, но мощной для сложных задач обработки естественного языка.

Одним из ключевых аспектов архитектуры является использование данных из ShareGPT, которые содержат многопроходные беседы между пользователями и ассистентами. Эти данные позволили модели научиться вести естественные диалоги и следовать инструкциям пользователя.

Vicuna поддерживает расширенное контекстное окно до 4096 токенов в версии 1.5, что позволяет обрабатывать более длинные входные последовательности по сравнению с базовыми версиями. Это особенно полезно для задач, требующих понимания длинных документов или ведения продолжительных бесед.

Архитектура модели также включает оптимизации для эффективного вывода, что позволяет использовать Vicuna на оборудовании с ограниченными ресурсами, включая потребительские GPU.

13 миллиардов параметров
Основана на LLaMA/Llama 2 архитектуре
Контекстное окно до 4096 токенов (v1.5)
Тонкая настройка на данных ShareGPT

Vicuna от LMSYS: Открытая альтернатива ChatGPT с 90% производительности

Введение

Ключевые особенности и архитектура

Производительность и бенчмарки

Ценообразование API

Сравнительная таблица

Сценарии использования

Начало работы

Comparison

Sources