Introduction

Dans le paysage en constante évolution des modèles linguistiques open-source, une nouvelle entrée remarquable fait sensation : Yi 34B, développé par 01.AI, fondé par le légendaire expert de l'IA Kai-Fu Lee. Ce modèle bilingue de 34 milliards de paramètres représente une avancée significative dans la création de systèmes capables de rivaliser avec des modèles beaucoup plus volumineux comme Llama 2 70B.

Lancé le 2 novembre 2023, Yi 34B s'est rapidement imposé comme un concurrent sérieux sur les benchmarks open-source, démontrant des performances exceptionnelles tant en anglais qu'en chinois. Cette capacité bilingue native distingue Yi des autres modèles du marché et en fait un choix privilégié pour les applications internationales.

Le modèle est disponible gratuitement sous licence Apache 2.0, ce qui permet aux développeurs et chercheurs d'explorer pleinement ses capacités sans contraintes de coût ou de licence restrictives. Cette approche ouverte reflète la philosophie d'innovation collaborative d'01.AI.

Caractéristiques clés et architecture

Yi 34B est construit sur une architecture transformer de pointe optimisée pour les tâches bilingues. Le modèle a été entraîné sur un jeu de données massif de 3 billions de tokens, couvrant à la fois le contenu en anglais et en chinois. Cette base d'entraînement étendue lui confère une compréhension profonde des deux langues et leur culture respective.

Le modèle dispose d'une fenêtre de contexte de 4 096 tokens, ce qui le rend adapté aux tâches nécessitant une compréhension de texte à long terme. L'architecture inclut des améliorations spécifiques pour la gestion efficace de la mémoire et des temps de réponse rapides.

Outre le modèle de base, 01.AI a également développé des variantes spécialisées, notamment des modèles de discussion (chat models), des modèles à contexte long (jusqu'à 200K tokens), et récemment, des modèles multimodaux Yi-VL intégrant la vision.

34 milliards de paramètres
Fenêtre de contexte : 4 096 tokens
Entraîné sur 3 billions de tokens
Support natif anglais/chinois
Modèles multimodaux disponibles

Performance et benchmarks

Sur les benchmarks standard, Yi 34B obtient des résultats impressionnants qui le placent en concurrence directe avec Llama 2 70B, malgré sa taille inférieure. Sur le classement Hugging Face Open LLM Leaderboard, le modèle a surpassé de nombreux modèles plus volumineux, notamment dans les évaluations multilingues.

Yi 34B : Le modèle open-source bilingue qui défie les géants de l'IA

Introduction

Caractéristiques clés et architecture

Performance et benchmarks

Tarification API

Tableau comparatif

Cas d'utilisation

Commencer à utiliser Yi

Comparison

Sources