Introduction

Le paysage de l'intelligence artificielle open-source vient de connaître une avancée significative avec la sortie de Nous Hermes 2 par NousResearch le 13 novembre 2023. Ce modèle représente une évolution majeure dans la famille des modèles Hermes, offrant aux développeurs et ingénieurs IA une solution puissante et accessible pour déployer des applications d'IA locales.

Conçu comme un modèle communautaire finetuné sur les architectures Mistral et Yi, Nous Hermes 2 s'impose comme une alternative crédible aux modèles propriétaires, tout en respectant les principes de transparence et d'accessibilité chers à la communauté open-source.

Avec ses variantes allant de 7B à 34B de paramètres, ce modèle s'adresse aussi bien aux développeurs souhaitant exécuter des tâches simples sur des machines modestes qu'aux entreprises nécessitant des capacités de traitement plus importantes.

La popularité croissante de Nous Hermes 2 pour l'IA locale témoigne de sa capacité à offrir des performances comparables à celles des grands modèles tout en fonctionnant sur des infrastructures locales.

Caractéristiques clés et architecture

Nous Hermes 2 se décline en plusieurs variantes architecturales, avec des modèles allant de 7 milliards à 34 milliards de paramètres. La version la plus populaire, Nous Hermes 2 Mistral 7B DPO, est basée sur l'architecture Mistral et a été optimisée via Direct Preference Optimization (DPO).

Les modèles exploitent des contextes allant jusqu'à 8000 tokens dans certaines variantes, permettant des conversations plus longues et des traitements de documents plus volumineux. L'architecture repose sur des fondations solides issues des travaux de Teknium sur OpenHermes-2.5-Mistral-7B.

Parmi les variantes disponibles figurent Nous-Hermes-2-Yi-34B, Nous-Hermes-2-Mixtral-8x7B-SFT (46.7B effectifs), et Nous-Hermes-2-Solar-10.7B, chacune optimisée pour des cas d'utilisation spécifiques.

Le modèle supporte nativement les appels de fonctions et la génération de JSON, ce qui en fait un choix idéal pour les applications nécessitant une interaction programmable avec des systèmes externes.

Paramètres : 7B, 8B, 10.7B, 34B, 46.7B (Mixtral 8x7B)
Contexte max : Jusqu'à 8000 tokens
Architecture : Basée sur Mistral, Yi, Llama-3, Mixtral
Fonctionnalités : Appel de fonctions, génération JSON

Performances et benchmarks

Les résultats de benchmark montrent que Nous Hermes 2 surpasse ses prédécesseurs et rivalise avec les modèles concurrents. La variante Mistral 7B DPO a obtenu des scores impressionnants sur AGIEval, BigBench Reasoning, GPT4All, et TruthfulQA, démontrant une amélioration globale par rapport à OpenHermes-2.5-Mistral-7B.

Nous Hermes 2 : Le modèle open-source qui révolutionne l'IA locale

Introduction

Caractéristiques clés et architecture

Performances et benchmarks

Pricing API

Tableau comparatif

Cas d'utilisation

Premiers pas

Comparison

Sources