Introduction

Mistral AI a officiellement lancé le 16 mars 2026 son modèle phare, Mistral Small 4. Ce nouveau venu ne se contente pas d'améliorer les capacités existantes ; il redéfinit l'architecture des modèles open-source en unifiant plusieurs spécialités distinctes. Pour les ingénieurs cherchant à réduire la complexité de leur stack, cette consolidation est une révolution technique majeure.

En combinant raisonnement, vision et codage dans une seule instance, Mistral Small 4 permet d'éliminer la surcharge de maintenance associée à l'utilisation de modèles spécialisés séparés comme Magistral ou Pixtral. L'approche Apache 2.0 garantit une liberté d'utilisation maximale pour les entreprises européennes et internationales, favorisant ainsi l'adoption souveraine de l'IA.

Date de sortie : 16 mars 2026
Licence : Apache 2.0
Unification : Instruct, Reasoning, Coding, Multimodal

Caractéristiques Clés & Architecture

L'architecture sous-jacente repose sur une Mixture of Experts (MoE) massive optimisée pour l'efficacité hardware. Cette structure permet d'activer uniquement les experts nécessaires selon la complexité de la requête, réduisant ainsi la charge d'inférence sans sacrifier la qualité.

Le modèle dispose d'une fenêtre de contexte étendue de 256K tokens, idéale pour le traitement de documents longs et de bases de connaissances complexes. Contrairement aux modèles fermés, Mistral Small 4 est entièrement open-source, permettant aux équipes de recherche de déboguer et d'optimiser le modèle en interne.

Paramètres totaux : 119B
Paramètres actifs : 6.5B
Fenêtre de contexte : 256K tokens
Raisonnement : Paramétrable dynamiquement

Performance & Benchmarks

Les benchmarks indépendants révèlent une progression significative par rapport aux versions précédentes et à la concurrence directe. Mistral Small 4 démontre une supériorité notable dans les tâches de raisonnement logique et d'exécution de code, surpassant souvent les modèles de taille similaire.

Comparé à Llama 3.1 405B, Small 4 offre un ratio coût-performance bien plus favorable pour les applications en temps réel. La latence d'inférence reste compétitive malgré la taille du modèle, grâce à l'activation dynamique des experts et aux optimisations matérielles récentes.

MMLU Score : 88.5%
HumanEval Score : 92.1%

Mistral Small 4 : Le Modèle Unifié de Nouvelle Génération

Introduction

Caractéristiques Clés & Architecture

Performance & Benchmarks

Tarification API

Tableau de Comparaison

Cas d'Usage

Démarrage Rapide

Comparison

Sources