Nous Hermes 2: Открытая революция в локальных ИИ моделях

Nous Hermes 2 от NousResearch представляет собой мощную 34B параметрическую модель с открытым исходным кодом, оптимизированную для локального развертывания.

13 ноября 2023 г.

Model ReleaseNous Hermes 2

Введение

Nous Hermes 2, представленная NousResearch 13 ноября 2023 года, представляет собой значительный прорыв в области открытых языковых моделей. Эта 34B параметрическая модель стала результатом тщательной доработки сообщества на основе базовых архитектур Mistral и Yi, обеспечивая исключительную точность выполнения инструкций. Модель быстро завоевала популярность среди разработчиков, создающих локальные ИИ решения, благодаря своей способности эффективно работать на потребительском оборудовании.

Nous Hermes 2 демонстрирует, как сообщество может улучшать существующие модели через тонкую настройку и оптимизацию. Она особенно выделяется в задачах, требующих строгого следования инструкциям, что делает ее идеальной для автоматизации рабочих процессов, генерации контента и взаимодействия с пользователями.

Релиз Nous Hermes 2 стал важным шагом в democratization искусственного интеллекта, предоставляя разработчикам доступ к высококачественной модели без необходимости полагаться на закрытые API или облачные сервисы. Это особенно актуально для приложений, где конфиденциальность данных и контроль над инфраструктурой являются критическими требованиями.

Ключевые особенности и архитектура

Nous Hermes 2 построена на архитектуре с 34 миллиардами параметров, что делает ее одной из самых крупных открытых моделей, подходящих для локального развертывания. Модель использует различные подходы к тонкой настройке, включая DPO (Direct Preference Optimization), что позволяет достичь более качественных результатов по сравнению с базовыми моделями.

Одной из ключевых особенностей является поддержка контекстных окон до 4096 токенов, что позволяет обрабатывать относительно длинные входные последовательности. Архитектура основана на проверенных подходах, таких как Mistral и Yi, но улучшена за счет применения современных методов оптимизации.

Модель также поддерживает функциональные вызовы и генерацию JSON-вывода, что делает ее особенно полезной для интеграции в программные системы. Эти возможности обеспечивают гибкость в использовании модели для различных задач автоматизации и интеграции.

34B параметров
Контекстное окно до 4096 токенов
Поддержка функциональных вызовов
Генерация JSON-вывода
DPO-оптимизация
Поддержка локального развертывания

Производительность и бенчмарки

Nous Hermes 2 показывает отличные результаты на стандартных бенчмарках. На тесте AGIEval модель достигает ~65%, что значительно превышает результаты предыдущих версий Hermes. В BigBench Reasoning модель набирает ~72%, демонстрируя сильные навыки логического мышления и рассуждения.

Nous Hermes 2: Открытая революция в локальных ИИ моделях

Введение

Ключевые особенности и архитектура

Производительность и бенчмарки

Ценообразование API

Сравнительная таблица

Применения

Начало работы

Comparison

Sources