Introduction

Le 6 janvier 2025, Allen AI a officiellement annoncé la sortie d'OLMo 2, un événement marquant pour l'écosystème de l'intelligence artificielle open source. Ce modèle représente un tournant majeur car il brise les barrières traditionnelles de la confidentialité des données d'entraînement et des poids du réseau. Contrairement aux modèles propriétaires qui gardent leurs secrets, OLMo 2 offre une transparence totale aux développeurs.

Cette transparence est cruciale pour la confiance et la reproductibilité dans le développement d'applications critiques. Les ingénieurs peuvent désormais auditer le comportement du modèle ligne par ligne, ce qui est impossible avec les modèles fermés comme GPT-5 ou Claude. Pour les entreprises cherchant à déployer des solutions éthiques et vérifiables, OLMo 2 est une opportunité stratégique inégalée sur le marché actuel.

Date de sortie : 6 janvier 2025
Fournisseur : Allen AI
Type : Modèle Open Source Complet

Key Features & Architecture

L'architecture d'OLMo 2 se distingue par sa licencé Apache 2.0, permettant une utilisation commerciale sans restrictions. Le modèle est disponible en deux tailles : 7 milliards et 13 milliards de paramètres. Ces tailles sont optimisées pour offrir un équilibre parfait entre performance et coût de calcul sur le matériel local.

En termes de données, le modèle a été entraîné sur 4 à 5 billions de tokens, couvrant un corpus linguistique diversifié et de haute qualité. La fenêtre de contexte supporte des entrées massives, permettant de traiter des documents longs ou des sessions de conversation étendues sans perte de cohérence.

Tailles : 7B et 13B
Licence : Apache 2.0
Données : 4T-5T tokens
Fenêtre de contexte : 128k tokens

Performance & Benchmarks

Les résultats de benchmark sont impressionnants. OLMo 2 affiche une augmentation de 9 points sur le test MMLU par rapport à OLMo 1, démontrant une amélioration significative de la capacité de raisonnement. Sur HumanEval, le modèle atteint des scores compétitifs avec les leaders du marché, prouvant son utilité pour les tâches de développement logiciel.

Sur SWE-bench, OLMo 2 montre une capacité robuste à résoudre des problèmes de code complexes. Comparé à Llama 3.1 8B, la version 7B d'OLMo 2 rivalise directement, tandis que la version 13B surpasse Gemma 2 9B dans les tâches de logique mathématique. Ces chiffres confirment que l'open source a atteint un niveau de maturité technique élevé.

OLMo 2 : L'Ère de la Transparence IA avec Allen AI

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Comparison Table

Use Cases

Getting Started

Comparison

Sources