Introduction

Mistral AI a officiellement annoncé la sortie de Codestral le 29 mai 2024, marquant un tournant significatif dans l'écosystème des modèles de langage spécialisés. Ce modèle de 22 milliards de paramètres est conçu spécifiquement pour les tâches de développement logiciel, offrant une précision supérieure aux modèles généralistes. Pour les ingénieurs, cela signifie une capacité accrue à générer du code robuste, à déboguer et à comprendre des architectures complexes.

La décision de le rendre open source renforce la position de Mistral dans la compétition contre les géants fermés comme OpenAI. En permettant aux communautés de contribuer et de vérifier les poids, Mistral s'aligne sur les valeurs de transparence qui sont devenues cruciales pour l'adoption industrielle. Ce lancement vise à fournir une alternative performante et éthique pour les entreprises cherchant à intégrer l'IA dans leurs pipelines de développement logiciel.

Date de sortie : 29 mai 2024
Licence : Open Source
Fournisseur : Mistral AI

Key Features & Architecture

L'architecture de Codestral repose sur des choix techniques audacieux pour maximiser l'efficacité. Il gère un contexte de fenêtre de 32K tokens, permettant d'analyser des bases de code entières ou de longs fichiers de documentation. Le modèle supporte plus de 80 langages de programmation, incluant Python, JavaScript, Rust, Go et Java. Une fonctionnalité clé est le support 'fill-in-the-middle', idéal pour compléter des fonctions partielles ou réécrire des blocs de code existants.

Les paramètres sont optimisés pour une inférence rapide tout en maintenant une haute qualité. L'utilisation de techniques MoE (Mixture of Experts) permet de réduire le coût de calcul tout en augmentant la capacité d'apprentissage sur des données techniques variées. Cette architecture permet au modèle de se spécialiser sur des niches spécifiques du code tout en conservant une généralité suffisante pour les tâches de maintenance.

Paramètres : 22B
Contexte : 32K tokens
Langages : 80+
Fonctionnalité : Fill-in-the-middle

Performance & Benchmarks

Les performances de Codestral ont été évaluées sur des benchmarks standards de l'industrie. Sur HumanEval, il atteint des scores compétitifs par rapport aux modèles fermés, démontrant une excellente capacité à générer du code fonctionnel. Le modèle excelle particulièrement dans SWE-bench, démontrant sa capacité à résoudre des problèmes réels de maintenance et de correction de bugs.

Codestral Mistral : Le Modèle Open Source de 22B pour le Développement

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Comparison Table

Use Cases

Getting Started

Comparison

Sources