Introduction

Alibaba Cloud a officiellement lancé le 10 septembre 2025 une nouvelle génération de modèles d'intelligence artificielle avec la sortie de Qwen3-Next. Ce modèle marque un tournant significatif dans l'accessibilité des modèles de grande taille pour les développeurs indépendants et les entreprises cherchant à réduire leurs coûts d'infrastructure. Contrairement aux modèles fermés propriétaires, Qwen3-Next est conçu pour offrir des performances de pointe tout en restant accessible via une licence ouverte. L'importance de cette release réside dans sa capacité à fournir une puissance de calcul comparable aux modèles payants les plus avancés, tout en permettant une exécution locale.

Les ingénieurs peuvent désormais intégrer des capacités de raisonnement complexes sans dépendre exclusivement des API cloud coûteuses. Cette démocratisation des modèles de 80 milliards de paramètres change la donne pour le développement d'agents autonomes et de systèmes RAG complexes. Qwen3-Next représente l'équilibre parfait entre performance et efficacité, redéfinissant les standards de l'open source en 2025.

Date de sortie : 10 septembre 2025
Licence : Apache 2.0
Fournisseur : Alibaba Cloud

Key Features & Architecture

L'architecture de Qwen3-Next repose sur une structure MoE (Mixture of Experts) ultra-optimisée qui permet une gestion intelligente des ressources. Avec 80 milliards de paramètres au total, le modèle sélectionne dynamiquement seulement 3 milliards de paramètres actifs pour chaque inférence, réduisant ainsi considérablement la charge de calcul. Cette approche permet d'atteindre des performances élevées avec une consommation énergétique minimale, idéale pour les environnements à ressources limités.

Le modèle supporte également des fenêtres de contexte étendues et des capacités multimodales avancées pour traiter divers types de données. La licence Apache 2.0 garantit une liberté totale pour l'utilisation commerciale et la modification du code source, favorisant l'innovation communautaire autour de l'infrastructure du modèle.

80B paramètres totaux (MoE)
3B paramètres actifs par requête
Licence Apache 2.0
Fenêtre de contexte 128K tokens

Performance & Benchmarks

Les performances de Qwen3-Next surpassent les attentes dans les benchmarks standardisés du secteur. Sur le test MMLU, le modèle atteint un score de 85%, surpassant les modèles de 70B précédents. Pour la génération de code, HumanEval affiche un score de 88%, démontrant une compréhension syntaxique et logique robuste. Sur SWE-bench, il résout efficacement des problèmes de développement logiciel complexes, prouvant son utilité pour les équipes d'ingénierie.

Qwen3-Next : Le Modèle MoE Ultra-Efficace d'Alibaba Cloud

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Comparison Table

Use Cases

Getting Started

Comparison

Sources