Timeline des Sorties de Modèles IA
Une timeline chronologique des sorties majeures de modèles IA
2026
Baidu lance ERNIE-5.1-Preview : Un modèle MoE ultra-efficace
Sorti le 9 mai 2026
Tops LMArena Search leaderboard as #4 globally and #1 among Chinese models with a score of 1,223
Math: #9 globally on LMArena category leaderboards
Legal & Government: #1 globally on LMArena category leaderboards
Business, Management & Financial Ops: #4 globally on LMArena category leaderboards
Software & IT Services: #7 globally on LMArena category leaderboards
Compresses total parameters to approximately 1/3 and active parameters to approximately 1/2 of ERNIE-5.0
Achieves leading performance using only about 6% of the pre-training cost of comparable models
Powered by decoupled fully-asynchronous reinforcement learning infrastructure built on PaddlePaddle
Uses scaled agentic post-training with Multi-Teacher On-Policy Distillation (MOPD)
Scores 99.6 on AIME26 with tool use, second only to Gemini 3.1 Pro
Surpasses DeepSeek-V4-Pro on tau-cubed-bench and SpreadsheetBench-Verified agent evaluation tasks
Four-stage post-training pipeline: SFT, Domain Expert Model Training, On-Policy Distillation, and General Online RL
Based on Once-For-All elastic training framework with elastic depth, width, and sparsity dimensions
Rolling out on 10+ creative production agent platforms including ISEKAI ZERO and Mulan AI
Creative writing capabilities approach those of Gemini 3.1 Pro
xAI Grok 4.3 : Analyse Technique & Prix
Sorti le 30 avril 2026
Reasoning model from xAI with configurable effort levels (none/low/medium/high, default low)
Accepts text and image inputs with text output
Suited for agentic workflows, instruction-following tasks, and high factual accuracy applications
1 million token context window with no output token limit
Well-suited for long-document analysis, deep research, and multi-step agentic tasks
Tiered pricing: requests exceeding 200k total tokens are billed at a higher rate
Mistral Medium 3.5 : L'Ère de l'IA Dense Open-Source
Sorti le 29 avril 2026
New flagship model merging instruction-following, reasoning, and coding into a single 128B dense architecture
Released as open weights under a modified MIT license
Runs self-hosted on as few as four GPUs
API pricing at $1.50/mtok input and $7.50/mtok output
Powers the new Mistral Vibe remote agents for async cloud coding sessions
Drives Work mode in Le Chat for multi-step agentic task execution with parallel tool calling
Sessions can be spawned from CLI or Le Chat, and local CLI sessions can be teleported to the cloud
NVIDIA Nemotron 3 Nano Omni : L'IA Multimodale Ultime
Sorti le 28 avril 2026
Multimodal model unifying video, audio, image, and text understanding in a single architecture
Hybrid Mixture-of-Experts (MoE) 30B-A3B architecture with 30B total and 3B active parameters
Up to 9x higher throughput compared to similar open omnimodal models
256K unified context window with single-pass perception
Hybrid architecture combining Mamba layers for memory efficiency and transformers for precise reasoning
Integrates vision encoders (C3D for video) and audio encoders (Paraquet), eliminating need for separate models
Supports FP8/NVFP4 quantization with optimized inference on NVIDIA Ampere, Hopper, and Blackwell GPUs
Designed for enterprise multimodal agents: document intelligence (OCR, tables), GUI navigation, audio-video reasoning
Runs locally with 25-36GB RAM in 4/8-bit quantization via Unsloth or vLLM
Available on Hugging Face, Ollama, OpenRouter, and NVIDIA NIM
Laguna-M.1 : Le Modèle de Codage Ultime de Poolside
Sorti le 28 avril 2026
225B total parameter Mixture-of-Experts model with 23B activated parameters per token
Poolside most capable model to date, completed pre-training at end of 2025
Trained from scratch on 30T tokens using Muon optimizer
Trained on 6,144 interconnected NVIDIA Hopper GPUs entirely in-house
Achieves 72.5% on SWE-bench Verified, 67.3% on SWE-bench Multilingual, 46.9% on SWE-bench Pro, 40.7% on Terminal-Bench 2.0
128K context window with up to 8K output tokens
Agentic coding model built for long-horizon software engineering tasks
Foundation for the entire Laguna model family
Uses custom async on-policy RL system with Agent Client Protocol (ACP) server
Free to use for a limited time via poolside API and OpenRouter
Weights available on request for startups, institutions, and universities
Laguna-XS.2 : Le Nouveau Standard du Développement Logiciel
Sorti le 28 avril 2026
33B total parameter Mixture-of-Experts model with 3B activated parameters per token
First open-weight release from poolside, licensed under Apache 2.0
Trained on 30T tokens using Muon optimizer
Supports native reasoning with interleaved thinking between tool calls
Uses Sliding Window Attention with per-head gating in 30 of 40 layers
KV cache quantized to FP8 for reduced memory per token
Compact enough to run locally on a Mac with 36 GB RAM
128K context window with up to 8K output tokens
Achieves 68.2% on SWE-bench Verified, 62.4% on SWE-bench Multilingual, 44.5% on SWE-bench Pro, 30.1% on Terminal-Bench 2.0
Supports vLLM, Transformers, TRT-LLM, and Ollama
Agentic coding model built for long-horizon software engineering tasks
Free to use for a limited time via poolside API and OpenRouter
DeepSeek-V4 : Le nouveau modèle open-source (2026)
Sorti le 24 avril 2026
Deux modèles : DeepSeek-V4-Pro (1.6T total / 49B active params) et DeepSeek-V4-Flash (284B total / 13B active params)
Context length de 1M tokens, output max de 384K tokens
Support thinking mode (par défaut) et non-thinking mode
Pricing ultra-agressif : Flash à $0.14/M input tokens (cache miss), $0.028/M (cache hit), $0.28/M output — soit ~7x moins cher que Claude Opus 4.7
Pro à $1.74/M input tokens (cache miss), $0.145/M (cache hit), $3.48/M output
Modèles open-source, poids disponibles sur HuggingFace
Compatible format API OpenAI et Anthropic (https://api.deepseek.com et https://api.deepseek.com/anthropic)
Support JSON output, Tool Calls, Chat Prefix Completion (Beta), FIM Completion (Beta)
Performance rivalisant avec les meilleurs modèles closed-source mondiaux
GPT-5.5 : Le Saut Quantique de l'IA vers le Travail Agentic
Sorti le 23 avril 2026
GPT-5.5 is OpenAI smartest and most intuitive to use model yet, described as the next step toward a new way of getting work done on a computer
Achieves 82.7% on Terminal-Bench 2.0, 73.1% on Expert-SWE (Internal), and 84.9% on GDPval — all state-of-the-art scores
Matches GPT-5.4 per-token latency while performing at a much higher level of intelligence
Significantly more token efficient — uses fewer tokens to complete the same tasks compared to GPT-5.4
Scores 78.7% on OSWorld-Verified for real computer environment operation and 81.8% on CyberGym
GPT-5.5 Pro achieves 90.1% on BrowseComp and 52.4% on FrontierMath Tier 1-3
On SWE-Bench Pro, reaches 58.6% solving more tasks end-to-end in a single pass than previous models
Proactively deployed with industry-leading cybersecurity safeguards, classified as High under OpenAI Preparedness Framework
Helped discover a new proof about Ramsey numbers in combinatorics, later verified in Lean
Scores 25.0% on GeneBench for multi-stage scientific data analysis in genetics
API pricing: $5/1M input tokens and $30/1M output tokens with 1M context window
GPT-5.5 Pro API pricing: $30/1M input tokens and $180/1M output tokens
Co-designed, trained with, and served on NVIDIA GB200 and GB300 NVL72 systems
Rolling out to Plus, Pro, Business, and Enterprise users in ChatGPT and Codex
GPT-5.5 Thinking unlocks faster help for harder problems with smarter, more concise answers
Outperforms Claude Opus 4.7 and Gemini 3.1 Pro on most coding and professional benchmarks
More than 85% of OpenAI now uses Codex every week across all company functions
Xiaomi lance MiMo-V2.5-Pro : Le modèle MoE de 1T+ paramètres
Sorti le 22 avril 2026
Multimodal Mixture-of-Experts (MoE) architecture with 1T+ total parameters (42B active)
Extended context window up to 1M tokens
Native multimodal perception supporting text, images, video, and audio
Advanced autonomous agent capabilities handling 1000+ tool calls
40-60% better token efficiency compared to Claude Opus and GPT-5.x
ClawEval benchmark: 64% Pass@3 score
SWE-bench Pro: 57.2% task resolution rate
Surpasses Claude 4.6 Sonnet in coding tasks, approaches Claude Opus in agentic performance
Part of the MiMo-V2.5 family alongside MiMo-V2.5 and MiMo-V2.5-TTS
Available via mimo.mi.com with affordable token plans (monthly/annual subscriptions)
Qwen3.6-27B : Le Modèle Dense Open Source qui Surpasse les 397B
Sorti le 22 avril 2026
27B dense open-source model with Apache 2.0 license
Surpasses Qwen3.5-397B-A17B on all major agentic coding benchmarks
SWE-bench Verified: 77.2 vs 76.2, Terminal-Bench 2.0: 59.3 vs 52.5, SkillsBench: 48.2 vs 30.0
Supports both multimodal thinking and non-thinking modes natively
Native vision-language support for images and video understanding
GPQA Diamond: 87.8, competitive with models several times its size
Compatible with OpenClaw, Claude Code, and Qwen Code coding assistants
Available on Hugging Face, ModelScope, and Alibaba Cloud Model Studio API
Kimi K2.6 : L'IA Open-Source qui Redéfinit le Coding Agentique
Sorti le 20 avril 2026
Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python (86.7), Math Vision w/ python (93.2)
Long-horizon coding: 4,000+ tool calls, over 12 hours continuous execution
Generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization)
300 parallel sub-agents x 4,000 steps per run (up from K2.5: 100 / 1,500)
Proactive Agents: powers OpenClaw, Hermes Agent for 24/7 autonomous ops
Claw Groups research preview: bring your own agents, command friends bots & humans in the loop
API PRICING (use these EXACT values): kimi-k2.6 — Input $0.16/M tokens (cache hit), Input $0.95/M tokens (cache miss), Output $4.00/M tokens, Context Window 262,144 tokens
Sources: https://platform.moonshot.ai, https://kimi.com/blog/kimi-k2-6, https://huggingface.co/moonshotai/Kimi-K2.6
Live on kimi.com in chat and agent mode, plus Kimi Code at https://kimi.com/code for production-grade coding
Claude Opus 4.7 : Le Nouveau Standard du Raisonnement et du Code
Sorti le 16 avril 2026
Most capable generally available Anthropic model for complex reasoning and agentic coding
High-resolution image support: 2576px / 3.75MP (up from 1568px / 1.15MP) with 1:1 pixel mapping
New "xhigh" effort level for coding and agentic use cases
Task budgets (beta) — advisory token budget across full agentic loops
128K max output tokens, 1M context window at standard pricing
+12 points on CursorBench coding benchmarks vs Opus 4.6
New tokenizer (up to ~35% more tokens per text, improved performance)
Adaptive thinking only — extended thinking budgets removed
Sampling parameters (temperature, top_p, top_k) removed
Pricing: $5/$25 per MTok input/output, batch $2.50/$12.50 per MTok
GLM-5.1 de Zhipu AI : Une Révolution pour le Reasoning et le Code
Sorti le 7 avril 2026
#1 on SWE-Bench Pro (58.4%), beating GPT-5.4 and Claude Opus 4.6
Post-training upgrade to GLM-5 — same 744B MoE architecture (40B active)
Trained entirely on Huawei Ascend chips — no NVIDIA hardware
MIT license, compatible with Claude Code and OpenClaw
202K context window, strong on cybersecurity (CyberGym 68.7%)
Claude Opus 4.6 Fast : La Révolution de la Vitesse chez Anthropic
Sorti le 7 avril 2026
Faster variant of Claude Opus 4.6 with comparable intelligence
Claude Mythos Preview : Le Modèle de Raisonnement Ultime d'Anthropic
Sorti le 7 avril 2026
New Capybara tier above Opus — the most powerful Anthropic model
93.9% on SWE-bench Verified, 77.8% on SWE-bench Pro
97.6% on USAMO 2026, 94.5% on GPQA Diamond
1M context window, limited preview for ~50 partner organizations
Gemma 4 : Le Nouveau Standard de l'IA Ouverte de Google
Sorti le 2 avril 2026
Google's most capable open models, built from Gemini 3 research
Four sizes: E2B, E4B, 26B MoE (3.8B active), 31B Dense
First Gemma release under Apache 2.0 license
Native multimodal, 140+ languages, up to 256K context
Agent-ready with function calling and structured JSON output
GLM-5V Turbo : Le Multimodal de Zhipu pour les Agents en 2026
Sorti le 1 avril 2026
Vision + Code model from Z.ai
Multimodal coding capabilities
API only
Qwen 3.6 Plus : Le Nouveau Standard du Coding Agentic
Sorti le 31 mars 2026
1M token context window with always-on chain-of-thought reasoning
78.8% on SWE-bench Verified — competitive with Claude Opus 4.6
2-3x faster output speed than Claude Opus 4.6
Free preview via OpenRouter, successor to Qwen 3.5
Voxtral TTS : Le Modèle de Synthèse Vocale Open Source de Mistral AI (2026)
Sorti le 23 mars 2026
Mistral's first audio model — direct competitor to ElevenLabs
Zero-shot voice cloning with multilingual support
Real-time streaming capabilities
Open weights under CC BY-NC 4.0 (non-commercial)
Xiaomi MiMo-V2-Pro : Le Nouveau Standard de la Raison IA
Sorti le 18 mars 2026
Xiaomi reasoning model with strong math and code performance
309B MoE architecture
MiniMax M2.7 : Le Modèle Auto-Évoluant qui Révolutionne le Coding Open Source
Sorti le 18 mars 2026
Self-evolving agent model — first to participate in its own development
56.22% on SWE-Pro, matching GPT-5.3-Codex
57.0% on Terminal Bench 2, GDPval-AA ELO 1495 (highest open-source)
230B MoE (10B active), 200K context, open weights on HuggingFace
Agent Teams for native multi-agent collaboration
GPT-5.4 Mini : Performance Élevée et Coût Réduit pour 2026
Sorti le 17 mars 2026
Efficient variant of GPT-5.4 with native computer use
Lower cost while maintaining strong reasoning capabilities
Leanstral : La Révolution de la Vérification Formelle par Mistral AI
Sorti le 16 mars 2026
First open-source code agent for Lean 4 formal proof engineering
Generates code AND machine-checkable mathematical proofs
119B MoE with 6.5B active, outperforms Claude Sonnet 4.6 on FLTEval
Apache 2.0 license, 15x cheaper than Claude Opus for formal verification
Mistral Small 4 : Le Modèle Unifié de Nouvelle Génération
Sorti le 16 mars 2026
Unifies instruct, reasoning, coding, and multimodal in a single model
119B MoE with 6.5B active parameters, 256K context window
Replaces Magistral (reasoning), Pixtral (vision), and Devstral (coding)
Apache 2.0 license, configurable reasoning parameter
Grok 4.20 : L'Ère des Agents Parallèles chez xAI
Sorti le 12 mars 2026
Beta release with parallel agents architecture
500K context window
Iterative improvement via user feedback
NVIDIA Nemotron 3 Super : Le Nouveau Standard Open-Source pour les Agents d'IA
Sorti le 11 mars 2026
Open MoE model from NVIDIA
120B total parameters with 12B active
Strong enterprise performance
OpenAI lance GPT-5.4 : 1 million de tokens et usage natif du PC
Sorti le 6 mars 2026
Latest OpenAI flagship with 1M token context window
Available in Standard, Mini, and Nano variants
Supports reasoning effort with 4 effort levels
128K max output tokens
Prompt caching with $0.02-$0.25/M cached read
Gemini 3.1 Flash Lite Preview : L'IA Rapide et Économe de Google
Sorti le 3 mars 2026
Google's high-efficiency model optimized for high-volume use cases
1M token context window, 65.5K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Gemini 3.1 Pro : La Nouvelle Référence du Raisonnement Multimodal
Sorti le 19 février 2026
Google's latest flagship model
More than doubles reasoning performance over Gemini 3 Pro
Released in preview via Gemini API, AI Studio, and Vertex AI
xAI Grok 4.2 : Analyse Technique Complète
Sorti le 17 février 2026
Beta release with rapid learning architecture — improves weekly via user feedback
256K context window
4-agent parallel reasoning
Medical document analysis added
Claude Sonnet 4.6 : L'évolution Ultime pour les Développeurs en 2026
Sorti le 17 février 2026
Most capable Sonnet yet with full upgrade across coding, computer use, long-context reasoning
1M token context window in beta
200K token context window, 64K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Qwen 3.5 : L'Architecture Agentic de 397B qui Redéfinit l'IA en 2026
Sorti le 14 février 2026
Agentic AI model with built-in tools for web search and code execution
1M token context window
Qwen3.5-Plus hosted; open weights planned
MiniMax M2.5 : Le Modèle MoE Open Source pour le Coding
Sorti le 12 février 2026
Frontier MoE model with 80.2% on SWE-Bench Verified
Strong coding and agentic capabilities
230B total parameters, 10B activated per token
DeepSeek V3.2 : Le Nouveau Géant Open Source (671B MoE)
Sorti le 12 février 2026
Major update to the V3 series with 1M token context
671B MoE focused on code generation and reasoning improvements
Open weights on HuggingFace, MIT license
GLM-5 de Zhipu AI : Le Modèle de Raisonnement Open Source de l'Année
Sorti le 11 février 2026
China's first public AI company frontier model
Targets complex systems engineering and long-horizon agentic tasks
MiniCPM-o 4.5 : Le Modèle Multimodal 9B qui Défie les Géants
Sorti le 8 février 2026
On-device multimodal LLM with full-duplex real-time audio, image, video
Built on Qwen3-8B architecture
Gemini 2.5 Flash level performance at only 9B parameters
GPT-5.3-Codex : L'agent de code ultime d'OpenAI
Sorti le 5 février 2026
Most capable agentic coding model from OpenAI
Available via Codex app, CLI, IDE extensions
Optimized for software engineering workflows
Claude Opus 4.6 : Le Modèle de Raisonnement Agente Ultime
Sorti le 5 février 2026
Huge leap for agentic planning with parallel subtask execution
Tool and subagent orchestration capabilities
Terminal-Bench record holder
1M token context window, 32K max output
State-of-the-art agentic AI behaviors
Step-3.5-Flash : Le modèle de raisonnement open-source qui brise les records de vitesse
Sorti le 1 février 2026
Open-source sparse MoE with 3-way Multi-Token Prediction
100-350 tok/s generation speed
Frontier reasoning at low cost
Trinity Large Arcee AI : Le Modèle Open-Source de 400B
Sorti le 27 janvier 2026
400B sparse MoE with only 13B active parameters
Built in the US with open weights
One of the largest open-source foundation models
Apache 2.0 license
Qwen3-Max-Thinking : Le Nouveau Standard du Raisonnement en 2026
Sorti le 27 janvier 2026
Top-tier reasoning model with adaptive tool use
Retrieves information and runs code during inference
Rivals leading frontier models
Kimi K2 de Moonshot AI : Le géant 1T MoE open-source qui domine les benchmarks
Sorti le 20 janvier 2026
Massive 1T MoE with 32B active parameters
First open-weight model to rank #1 on LMSYS Chatbot Arena
2M token context window, 200+ language support
$0.15/$2.50 per 1M tokens, Modified MIT license
Sarvam-2B : Le Modèle Open Source Léger pour l'IA Souveraine Indienne
Sorti le 15 janvier 2026
India's multilingual LLM — part of sovereign AI initiative
Supports 10+ Indian languages natively
2025
SOLAR 102B : Le géant open-source coréen d'Upstage
Sorti le 31 décembre 2025
Korea's answer to open frontier models
102B MoE model with 12B active parameters
Gemini 3 Flash : Le modèle rapide par excellence de Google DeepMind
Sorti le 17 décembre 2025
Fast frontier-class model rivaling larger models at a fraction of the cost
Default model in the Gemini app
Molmo 2 : Le Modèle Multimodal Open Source de 8B d'Allen AI
Sorti le 16 décembre 2025
Multimodal model from AI2
Fully open weights, data, and code
Xiaomi lance MiMo V2 Flash : Le modèle de raisonnement open-source qui bouscule le marché
Sorti le 16 décembre 2025
Xiaomi large reasoning model
309B MoE architecture
Strong on math and code
OpenAI GPT-5.2 : Une Révolution pour les Développeurs
Sorti le 11 décembre 2025
Improved reasoning and multimodal capabilities over GPT-5.1
Enhanced mental health protections
128K max output tokens
Available on Plus ($20/month), Pro ($200/month), and API
Expert-level performance on 44 knowledge work tasks
Devstral Small 2 : L'agent de code portable Apache 2.0 de Mistral AI
Sorti le 9 décembre 2025
Successor to Devstral Small 1, derived from Mistral Small 3.1
Portable coding agent
Apache 2.0 license
Devstral 2 : Le Nouveau Standard du Coding Open Source par Mistral AI
Sorti le 9 décembre 2025
Next-gen coding model with top SWE-Bench score
Modified MIT license (free unless high revenue)
Ministral 3 14B : Le nouveau standard multimodal open-source de Mistral AI
Sorti le 2 décembre 2025
Largest Ministral 3 model with vision
Best-in-class text and vision capabilities
Apache 2.0 license
Ministral 3 8B : Le Nouveau Standard Open-Source de Mistral AI
Sorti le 2 décembre 2025
Powerful and efficient model with vision
Best-in-class text and vision at this size
Apache 2.0 license
Ministral 3 3B : L'IA Vision-Lightweight de Mistral pour le Edge Computing
Sorti le 2 décembre 2025
Tiny and efficient edge model with vision
Runs on phones, drones, and laptops
Apache 2.0 license
Amazon Nova 2 : Le Modèle de Langage Prochainement Disponible
Sorti le 2 décembre 2025
Amazon next-gen foundation model
Available via AWS Bedrock
Announced at re:Invent
Mistral Large 3 : Le Nouveau Standard Open-Source pour les Développeurs en 2025
Sorti le 2 décembre 2025
Sparse MoE with 41B active parameters
Open weights
Strong reasoning and multilingual capabilities
GLM-4.7 : Le Nouveau Standard Open-Source du Coding
Sorti le 1 décembre 2025
Open-weights model topping global coding and reasoning leaderboards
Includes GLM-4.7 Flash variant
Cost-effective compared to Western competitors
MiniMax M2.1 : La Révolution Open-Source du Codage
Sorti le 1 décembre 2025
Fully open-source SOTA coding model
230B params MoE architecture, 10B activated per token
SWE-bench score of 74.0%
92% cheaper than Western alternatives
Claude Opus 4.5 : Le Saut Quantique du Reasoning et de l'Enterprise
Sorti le 24 novembre 2025
Exceeds Sonnet 4.5 by 4.3% using 48% fewer tokens at max effort
200K token context, 64K max output
Hybrid reasoning with instant or extended thinking
Multimodal: text, image, and audio support
20% accuracy gain, Excel and financial modeling breakthrough
OLMo 3 : Le nouveau modèle open-source 32B d'Allen AI révolutionne le développement
Sorti le 20 novembre 2025
Fully open model with weights, data, and training code
From AI2 research lab
Cogito v2.1 : Le Nouveau Standard du Reasoning Open Source
Sorti le 19 novembre 2025
Large 671B MoE reasoning model
Strong on complex reasoning tasks
Gemini 3 Deep Think : La Révolution du Raisonnement Logique
Sorti le 18 novembre 2025
Reasoning variant of Gemini 3
Deep chain-of-thought for complex scientific problems
Gemini 3 Pro : Le Modèle Multimodal Définitif de Google DeepMind
Sorti le 18 novembre 2025
Over 50% improvement over Gemini 2.5 Pro
Most powerful Google model — replaces 2.5 series
1M token context window
Advanced multimodal: text, image, video, audio, code
OpenAI GPT-5.1 : L'Évolution Stratégique pour les Architectes IA
Sorti le 12 novembre 2025
Family of four models with adaptive reasoning
Faster, more conversational, improved coding
Rolled out to all ChatGPT users
Kimi K2.5 : Le Modèle de Raisonnement de Moonshot AI
Sorti le 6 novembre 2025
Upgraded Kimi model with thinking and reasoning capabilities
Amazon Nova Premier : Analyse technique et prix
Sorti le 31 octobre 2025
Most capable Amazon model
1M context window
Multimodal capabilities
Teacher for distillation on Bedrock
Alice AI 1.0 : L'Ascension de Yandex sur la Scène Mondiale de l'IA
Sorti le 28 octobre 2025
First major Russian-developed large language model on the global stage
From Yandex
MiniMax M2 : L'Ère de l'IA Open Source à 230B MoE
Sorti le 23 octobre 2025
Upgraded MiniMax model with improved reasoning and generation
Open weights
GLM-4.6 : L'IA Open Source Optimisée pour le Matériel Chinois
Sorti le 9 octobre 2025
First GLM model with native support for China domestic chips
Cambricon and Moore Threads support
FP8 and Int4 quantization
IBM Granite 4.0 : L'Architecture Hybride Mamba-2 Open Source
Sorti le 2 octobre 2025
IBM open enterprise model
Hybrid Mamba-2 Transformer architecture
Apache 2.0 license
Claude Haiku 4.5 : La révolution de la vitesse chez Anthropic
Sorti le 1 octobre 2025
Anthropic's fastest model with near-frontier intelligence
200K token context window, 64K max output
21K+ tokens per second for prompts under 32K tokens
Supports reasoning budget and effort control
Most cost-effective in the Claude family: $1/M input
DeepSeek V3.2 : Le Modèle Open-Source de 671B MoE Qui Rivalise avec GPT-5
Sorti le 29 septembre 2025
Further iteration on V3 series
Enhanced capabilities across all benchmarks
Open weights
Claude Sonnet 4.5 : Le Nouvel Élite du Code par Anthropic
Sorti le 29 septembre 2025
Anthropic's best model for coding tasks
1M token context window (beta feature)
64K max output tokens
Strong agentic behavior and computer-use skills
Optimized for efficient coding and parallel processing
Qwen3-Next : Le Modèle MoE Ultra-Efficace d'Alibaba Cloud
Sorti le 10 septembre 2025
Ultra-efficient MoE from Alibaba
80B total, only 3B active parameters
Strong reasoning with minimal compute
Apache 2.0 license
Kimi K2 de Moonshot AI : L'Ère des Modèles MoE de 1T à l'Open Source
Sorti le 4 septembre 2025
Massive 1T MoE model with open weights
Highly competitive with frontier models
Major Chinese AI milestone
32B activated parameters
Cost-effective: ~$0.15/M input, $2.50/M output
Strong coding performance across 32+ languages
Grok 4 Fast : L'Évolution Ultime de xAI pour les Développeurs
Sorti le 1 septembre 2025
98% cost reduction compared to Grok 4 Standard
40% increase in token efficiency
Real-time search integration via X
$0.20/M input, $1.50/M output
Magistral Medium 1.2 : Le Nouveau Standard du Raisonnement Multimodal
Sorti le 1 septembre 2025
Adds vision to Magistral Medium
Multimodal frontier reasoning
Closed API only
Magistral Small 1.2 : Le Nouveau Standard du Raisonnement Multimodal Mistral
Sorti le 1 septembre 2025
Adds vision to Magistral Small
Multimodal reasoning model
Apache 2.0 license
Hermes 4 : Le Nouveau Standard de l'IA Ouverte par NousResearch
Sorti le 28 août 2025
Latest in the Hermes series
Advanced function calling and structured output
Built on Llama 3.1
DeepSeek V3.1 : Le Nouveau Standard Open Source 2025
Sorti le 21 août 2025
Major upgrade to V3 with improved reasoning and coding
Open weights
Mistral Medium 3.1 : Une Révolution Multimodale pour les Développeurs
Sorti le 12 août 2025
Frontier-class multimodal model
Competitive with GPT-4o and Claude 3.5
Strong vision and reasoning capabilities
GLM-4.5V : Le Nouveau Standard Multimodal de Zhipu AI
Sorti le 11 août 2025
Vision-language model from Z.ai
106B parameters with strong multimodal understanding
OpenAI GPT-5 : L'Intelligence Artificielle qui Change la Règle du Jeu
Sorti le 7 août 2025
Next-generation flagship with major intelligence leap
400K token context window
Built-in reasoning with 4 effort levels
Multimodal: text, image, and video-based reasoning
Available in Standard, Mini, and Nano variants
OpenAI dévoile GPT-OSS : L'ère de l'IA open-source commence
Sorti le 5 août 2025
OpenAI's first open-weight models since GPT-2
20B and 120B variants
Historic open-source move from OpenAI
Claude Opus 4.1 : La Nouvelle Référence en Raisonnement et Code
Sorti le 5 août 2025
Upgrade to Claude 4 with improved coding and instruction following
200K token context window
Extended thinking support
Vision and tool calling capabilities
Claude 4.5 Sonnet : Analyse Technique et Prix
Sorti le 29 juillet 2025
Newest Anthropic model with improved creative writing
Enhanced nuance and multi-step reasoning
GLM-4.5 Air : La Révolution du MoE Léger de Zhipu AI
Sorti le 28 juillet 2025
Lightweight variant of GLM-4.5
106B MoE, efficient inference on 8x H20 GPUs
GLM-4.5 : Le Nouveau Standard Open Source de Zhipu AI
Sorti le 28 juillet 2025
Z.ai flagship open MoE model
355B total parameters
Strong reasoning, coding, and agentic capabilities
Claimed cheaper to run than DeepSeek
Grok 4 xAI : Le Modèle le Plus Puissant de 2025
Sorti le 11 juillet 2025
xAI's most powerful model at the time
Major reasoning leap
Trained on expanded Colossus cluster
Gemma 3n : L'IA Open Source Mobile de Google DeepMind
Sorti le 26 juin 2025
Efficient on-device model designed for mobile
Runs on phones and edge devices
GPT-o3 Pro : Le Nouveau Standard du Raisonnement d'OpenAI
Sorti le 10 juin 2025
Most powerful OpenAI reasoning model
Extended thinking for frontier problems
Mistral Small 3.2 : L'Apogée de l'IA Légère et Open Source
Sorti le 10 juin 2025
Update to Mistral Small 3.1
Improved instruction following and reasoning
Apache 2.0 license
dots.llm1 : Le Nouveau Modèle Open Source de RedNote
Sorti le 6 juin 2025
Open-source MoE from RedNote (China Instagram)
142B total, 14B active
Performance on par with frontier models at time of release
Magistral Small : Le Modèle de Raisonnement Open Source de Mistral AI (2025)
Sorti le 5 juin 2025
Mistral reasoning model with extended thinking
Strong STEM performance
Apache 2.0 license
Gemini 2.5 Pro (06-05) : L'Ère du Raisonnement Agentic et du Code
Sorti le 5 juin 2025
Latest 2.5 Pro with enhanced coding, reasoning, and agentic capabilities
MiniMax-M1 : Le Nouveau Standard Open Source de l'IA en 2025
Sorti le 1 juin 2025
Chinese AI lab flagship with strong long-context
Lightning attention architecture
Anthropic lance Claude Sonnet 4 : Le nouveau standard pour le développement
Sorti le 22 mai 2025
High-performance model balancing speed and intelligence
200K context window, 64K max output
Best model for complex agents and coding
Native tool calling and computer use
Available on free tier of Claude.ai
Claude Opus 4 : L'Évolution du Raisonnement IA par Anthropic
Sorti le 22 mai 2025
Most powerful Anthropic model at launch
Parallel tool use, long autonomous tasks
200K token context window
Extended thinking support
Vision capabilities for image understanding
Mistral Devstral 24B : Le Modèle de Codage Open Source à Apache 2.0
Sorti le 21 mai 2025
Mistral dedicated coding model
Optimized for software engineering and agentic coding tasks
Apache 2.0 license
Falcon H1 : Le Nouveau Standard Open Source de TII
Sorti le 20 mai 2025
Hybrid SSM+attention architecture
Six model sizes from 0.5B to 34B
Punches above weight class on benchmarks
Apache 2.0 license
Gemini 2.5 Flash : La Révolution de la Vitesse et du Coût pour les Développeurs
Sorti le 20 mai 2025
Cost-efficient reasoning with controllable thinking depth
#1 Chatbot Arena for speed
Mistral Medium 3 : Le Modèle Front-Tier Open Source
Sorti le 14 mai 2025
Front-tier model, competitive with GPT-4o
Strong multilingual capabilities
Apache 2.0 license
Qwen 3 : Le nouveau standard open-source d'Alibaba Cloud
Sorti le 29 avril 2025
Excellent multilingual performance (Chinese, English, and more)
0.6B to 235B variants with hybrid thinking
119 languages supported
22B active parameters in MoE architecture
Strong coding performance
Apache 2.0 license
Zhipu GLM-4.1V : Le Nouveau Géant Multimodal Open Source
Sorti le 25 avril 2025
Open 32B and 9B multimodal with reasoning
Competitive on vision tasks
o4-mini : Le nouveau modèle de raisonnement d'OpenAI pour les développeurs
Sorti le 16 avril 2025
Efficient reasoning model
Best cost-performance for coding and STEM
OpenAI o3 : Le Nouveau Standard du Raisonnement Logique pour Développeurs
Sorti le 16 avril 2025
Full o3 reasoning model — successor to o1
Deep chain-of-thought capabilities
OpenAI GPT-4.1 : L'Évolution Ultime pour les Développeurs
Sorti le 14 avril 2025
Optimized for coding and instruction following
1M token context window
Available in Standard, Mini, and Nano variants
Nano: $0.10/M input, $0.40/M output
Llama 4 Meta : Le Modèle Open-Source qui Change la Règle du Jeu
Sorti le 5 avril 2025
Open-weight natively multimodal models
Scout: 109B, runs on single H100 GPU, 10M token context
Maverick: 400B, requires H100 DGX system
Early fusion for native text, image, and video understanding
Gemini 2.5 Pro : Le Modèle Multimodal Révolutionnaire
Sorti le 25 mars 2025
#1 on LMArena at launch
Built-in reasoning capabilities
1M token context window
Native code execution and Google Search grounding
Best overall model at launch
NVIDIA Nemotron Ultra : Le Nouveau Standard du Raisonnement Open Source
Sorti le 18 mars 2025
Open reasoning model based on Llama
253B MoE architecture
Strong enterprise tasks
Mistral Small 3.1 : L'Ère de l'IA Multimodale Open-Source
Sorti le 17 mars 2025
Adds vision capabilities to Small 3.0
Multimodal, 128K context
Apache 2.0 license
Cohere Command A : Le Nouveau Standard Open Source pour l'Entreprise
Sorti le 13 mars 2025
Cohere's 111B flagship model
Enterprise RAG and agentic tasks
Multilingual capabilities
Runs on 2 GPUs
Google DeepMind lance Gemma 3 : Le futur du multimodal open source
Sorti le 12 mars 2025
1B/4B/12B/27B variants
Multimodal (text+vision)
Single GPU capable, 128K context
InternLM 3 : Le nouveau géant open-source de Shanghai AI Lab
Sorti le 5 mars 2025
8B bilingual (English + Chinese) model with deep thinking mode
Surpasses Llama 3.1 8B and Qwen2.5 7B on reasoning/knowledge tasks
128K context, trained on 4T tokens with 75%+ cost savings
Apache 2.0 license
Alibaba Cloud lance QwQ-32B : Le nouveau standard du raisonnement
Sorti le 5 mars 2025
Dedicated reasoning model from Qwen team
Strong mathematical and logical reasoning
Apache 2.0 license
OpenAI GPT-4.5 : L'Ère de l'IA Émotionnelle et Précise
Sorti le 27 février 2025
Largest OpenAI model at the time
Focus on EQ, creativity, reduced hallucinations
Claude 3.7 Sonnet : Le Nouveau Standard pour le Développement IA
Sorti le 24 février 2025
Hybrid reasoning — toggle instant/extended thinking
Best coding model at launch
200K context window, 64K max output
Microsoft lance Phi-4-Mini : Le modèle open-source de 3.8B qui domine
Sorti le 18 février 2025
3.8B dense model outperforming 2x-size models (Phi-3.5-mini, Llama 3.2 3B)
128K context, 22 languages, function calling and tool use
Trained on 5T tokens (synthetic + filtered public data + code)
MIT license — smallest Phi model with strong reasoning
Grok 3 par xAI : L'IA la plus intelligente de la Terre ?
Sorti le 17 février 2025
Trained on Colossus supercluster (100K GPUs)
Strong reasoning capabilities
DeepSeek R1 : Le Modèle de Raisonnement Open Source qui a Chocqué le Marché
Sorti le 20 janvier 2025
Open-source reasoning model rivaling o1
Pure reinforcement learning approach
Caused global market shockwaves
671B MoE architecture
Mistral Small 3.0 : Le nouveau standard open source pour les développeurs
Sorti le 15 janvier 2025
Refreshed Small with state-of-the-art performance
Apache 2.0 license
OLMo 2 : L'Ère de la Transparence IA avec Allen AI
Sorti le 6 janvier 2025
Truly open: weights + training data + training code + evaluation all released
7B and 13B sizes — 7B competitive with Llama 3.1 8B, 13B with Gemma 2 9B
Trained on 4T–5T tokens, 9-point MMLU increase over OLMo 1
Apache 2.0 license
2024
DeepSeek V3 : Le Modèle Open-Source 671B MoE qui Défie les Géants
Sorti le 26 décembre 2024
671B MoE trained for $5.5M — matches GPT-4o/Claude 3.5 Sonnet
Revolutionized cost efficiency
Open-source on GitHub and HuggingFace
Strong coding and mathematical reasoning
Falcon 3 : Le Nouveau Standard Open-Source de TII (10B)
Sorti le 17 décembre 2024
1B/3B/7B/10B sizes
Enhanced multilingual and multimodal
Apache 2.0 license
Microsoft lance Phi-4 : Le modèle open-source 14B révolutionnaire
Sorti le 12 décembre 2024
14B excelling at STEM reasoning
Outperforms much larger models on math
Gemini 2.0 Flash : L'Ère Agentive de Google DeepMind
Sorti le 11 décembre 2024
Google's model for the agentic era with native image and audio generation
Outperforms Gemini 1.5 Pro at twice the speed
Native tool use including Google Search and code execution
Foundation for Project Astra and Project Mariner
Llama 3.3 : La Révolution de l'Efficacité par Meta AI
Sorti le 6 décembre 2024
70B matching Llama 3.1 405B performance
Massive efficiency gain
o1-pro : Le nouveau standard du raisonnement OpenAI
Sorti le 5 décembre 2024
Enhanced reasoning with more compute for complex tasks
Available in ChatGPT Pro tier
Amazon Nova : La Nouvelle Référence des Modèles sur AWS Bedrock
Sorti le 3 décembre 2024
Foundation model family: Micro/Lite/Pro/Premier
Multimodal, optimized for AWS Bedrock
Qwen2.5-Coder : Le Nouveau Standard Open Source pour le Développement
Sorti le 22 novembre 2024
Code-specialized model in 6 sizes: 0.5B, 1.5B, 3B, 7B, 14B, 32B
32B variant matches GPT-4o coding ability — state-of-the-art open code LLM
Trained on 5.5T tokens (source code + text-code grounding + synthetic)
300+ programming languages, 128K context with YaRN extension
Apache 2.0 license
Pixtral Large : Le Modèle Multimodal Open Source de Mistral
Sorti le 17 novembre 2024
Mistral's large multimodal model
128K context, native image understanding at scale
Open weights
Hunyuan-Large : Le Nouveau Géant Open Source de Tencent (389B MoE)
Sorti le 5 novembre 2024
Largest open-source Transformer-based MoE model at release
389B total parameters with 52B active per token
256K context window
Outperforms Llama 3.1 405B on benchmarks
Claude Haiku 3.5 : L'Équilibre Ultime entre Vitesse et Précision
Sorti le 22 octobre 2024
Fast and cost-effective model
200K token context window, 8K max output
Multilingual and vision capabilities
$0.80/M input, $4/M output
Ideal for high-volume tasks like chatbots and moderation
Yi-Lightning 01.AI : Le Nouveau Standard Propriétaire en 2024
Sorti le 16 octobre 2024
Ranked #6 on LMSYS Chatbot Arena at launch — #1 in China
Surpassed GPT-4o-0513 and Claude 3.5 Sonnet in overall ranking
Top-3 in Chinese, Math, Coding, and Hard Prompts categories
Founded by Kai-Fu Lee, proprietary model
Llama 3.2 : Le Nouveau Modèle Multimodal Open Source de Meta
Sorti le 25 septembre 2024
First Llama models with vision capabilities — 11B and 90B multimodal variants
Lightweight 1B and 3B edge models for on-device deployment
128K context window, competitive with Claude 3 Haiku and GPT-4o-mini
Drop-in replacements for Llama 3.1 text models
Qwen2.5 : Le Nouveau Standard Open Source pour le Développement
Sorti le 19 septembre 2024
0.5B to 72B range
SOTA open model for coding and math
18T training tokens
Apache 2.0 license
Mistral Small 2409 : L'Évolution du 22B Open Source
Sorti le 18 septembre 2024
Updated Mistral Small with improved instruction following
22B parameters, Apache 2.0 license
Pixtral 12B : Le Modèle Multimodal Open Source de Mistral AI
Sorti le 17 septembre 2024
Built on NeMo architecture with native vision support
128K context, Apache 2.0 license
o1-preview : La Révolution du Raisonnement par OpenAI
Sorti le 12 septembre 2024
First 'reasoning' model with chain-of-thought at inference
PhD-level science and math performance
DeepSeek V2.5 : Le Monstre MoE Open Source qui Révolutionne le Coding
Sorti le 5 septembre 2024
Merged DeepSeek-V2-Chat and DeepSeek-Coder-V2 into a single model
236B MoE with 21B active parameters, 128K context
Strong coding and general capabilities in one model
MIT license, available on HuggingFace
Jamba 1.5 de AI21 Labs : Le Modèle Hybride Mamba-Transformer qui Change la Partie
Sorti le 22 août 2024
Mamba-Transformer hybrid MoE
94B active, 256K context
Fastest long-context model at release
Microsoft Phi-3.5 : Le Modèle Open Source MoE
Sorti le 20 août 2024
4B MoE and 3.8B variants optimized for edge devices
Phone-capable AI with 128K context window
Improved multilingual support over Phi-3
Strong reasoning for its size class
Grok-2 : xAI lance un défi technique majeur pour GPT-4o
Sorti le 13 août 2024
Competitive with GPT-4o and Claude 3.5 Sonnet
Available on X platform
HyperCLOVA X: Naver's 104B Korean LLM Review
Sorti le 7 août 2024
Korean web giant Naver's flagship LLM optimized for Korean language and culture
Two sizes: HCX-L (largest) and HCX-S (lighter), built on LLaMA 2 architecture
100K context window with Korean-optimized tokenizer
Strong cross-lingual reasoning in Asian languages — Korean, Japanese, Chinese
FLUX.1 : Le Modèle Open-Source qui Défie Midjourney et DALL-E
Sorti le 1 août 2024
State-of-the-art text-to-image model from ex-Stability AI founders
12B rectified flow transformer architecture
FLUX.1 [schnell] open under Apache 2.0, [dev] non-commercial
Surpassed closed-source alternatives in image quality
Mistral Large 2 : Le nouveau standard open-source arrive
Sorti le 24 juillet 2024
128K context, competitive with GPT-4o and Llama 3.1 405B
12 languages supported
Open weights
Meta Llama 3.1: The 405B Open-Source Benchmark
Sorti le 23 juillet 2024
Largest open model — 405B parameters
Matches GPT-4 on many benchmarks
128K context window
Mistral NeMo 12B : L'Équilibre Parfait entre Performance et Efficacité
Sorti le 18 juillet 2024
Co-built with NVIDIA, runs on a single GPU
12B parameters with 128K context window
Drop-in replacement for Mistral 7B with SOTA performance in its class
Apache 2.0 license, strong multilingual support
InternLM 2.5 : Le modèle open-source qui défie les géants
Sorti le 3 juillet 2024
Strong reasoning from China's national lab
Competitive on math and coding
Gemma 2 de Google DeepMind : La Nouvelle Référence Open-Source
Sorti le 27 juin 2024
9B and 27B sizes
Outperforms models 2x its size
Knowledge distillation from Gemini
Claude 3.5 Sonnet : Le Nouveau Standard pour les Développeurs
Sorti le 20 juin 2024
Surpassed GPT-4o and Gemini 1.5 Pro at launch
2x faster than Claude 3 Opus at lower cost
DeepSeek Coder V2 : L'Éruption Open Source du Coding AI
Sorti le 17 juin 2024
First open MoE code model matching GPT-4 Turbo on coding
338 programming languages supported
NVIDIA Nemotron-4 340B : L'IA Open Source Révolutionnaire
Sorti le 14 juin 2024
NVIDIA's open model for synthetic data generation
Permissive enterprise license
Qwen2 : Le Modèle Open-Source de 72B d'Alibaba Cloud
Sorti le 7 juin 2024
Major upgrade, 0.5B to 72B range
Competitive with Llama 3 70B
Apache 2.0 license
GLM-4 de Zhipu AI : Le Nouveau Champion Open-Source à 9B Paramètres
Sorti le 5 juin 2024
128K context, 26 languages
Competitive with Llama 3 8B
Open-source GLM-4 series
Codestral Mistral : Le Modèle Open Source de 22B pour le Développement
Sorti le 29 mai 2024
Specialized code model, 80+ languages
32K context, fill-in-the-middle support
Doubao 1.5 : Le Modèle Open Source de ByteDance qui Défie les Géants de l'IA
Sorti le 15 mai 2024
ByteDance's flagship LLM, most popular AI product in China
Available via Doubao app and Volcano Engine API
Supports 50+ application scenarios including voice, vision, and coding
Open-source Seed 1.5 variants released under permissive license
GPT-4o : L'Ère de l'IA Multimodale Omni d'OpenAI
Sorti le 13 mai 2024
'Omni' model with native audio/vision/text
2x faster, 50% cheaper than GPT-4 Turbo
Real-time voice conversation capabilities
DeepSeek V2 : La Révolution Open-Source de 236B Paramètres
Sorti le 7 mai 2024
236B MoE with only 21B active parameters
Multi-head Latent Attention for efficiency
Open weights
Snowflake Arctic : Le Nouveau Géant Open-Source pour l'Entreprise
Sorti le 24 avril 2024
480B MoE with 17B active parameters
Enterprise-focused, strong on SQL and coding
Apache 2.0 license
Microsoft Phi-3 : L'IA Open Source qui Redéfinit l'Efficacité en 2024
Sorti le 23 avril 2024
Mini/Small/Medium variants
Phi-3 Mini (3.8B) rivals Mixtral 8x7B
Phone-capable AI
Llama 3 : L'Évolution Historique de Meta AI
Sorti le 18 avril 2024
Trained on 15T tokens, 8B and 70B sizes
New open-source SOTA with massive community adoption
Mixtral 8x22B : Le nouveau modèle ouvert de Mistral AI révolutionne le traitement multilingue et le codage
Sorti le 17 avril 2024
Large MoE with strong multilingual and code performance
Open weights
Command R+ de Cohere : Le nouveau modèle de langage d'entreprise à 104 milliards de paramètres
Sorti le 4 avril 2024
Optimized for RAG and enterprise
128K context, 10 languages
Grounded generation capabilities
Jamba 52B : Le premier modèle hybride Mamba-Transformer ouvert
Sorti le 28 mars 2024
First production Mamba-Transformer hybrid
256K context, novel SSM architecture
DBRX : Le nouveau modèle open-source de Databricks avec 132B de paramètres MoE
Sorti le 27 mars 2024
Open MoE with 36B active parameters
Outperformed Llama 2 70B and Mixtral
Apache 2.0 license
Grok-1 : Le Premier Modèle Open Source de xAI avec 314 Milliards de Paramètres
Sorti le 17 mars 2024
xAI's first open-source model
314B MoE under Apache 2.0
Largest open MoE at time of release
Claude 3 d'Anthropic : Le modèle de langage qui redéfinit les performances IA
Sorti le 4 mars 2024
Haiku/Sonnet/Opus family
Opus matched GPT-4 on most benchmarks
200K context window, vision capabilities
Claude Opus 3 d'Anthropic : Le modèle de raisonnement qui révolutionne l'IA
Sorti le 4 mars 2024
First Claude Opus model with advanced reasoning
200K context window
Pioneered extended thinking capabilities
Vision and tool use support
Mistral Large : le nouveau modèle commercial phare de Mistral AI
Sorti le 26 février 2024
Mistral's first flagship commercial model
32K context, top-tier reasoning
Google DeepMind lance Gemma : Le modèle open-source 7B qui défie les géants de l'IA
Sorti le 21 février 2024
Google's open-source model from Gemini research
2B and 7B sizes, strong for its class
Gemini 1.5 Pro : La révolution multimodale de Google avec un contexte d'1 million de tokens
Sorti le 15 février 2024
1 million token context window — 10x previous record
MoE architecture, processes entire codebases
Gemini 1.0 Ultra : Le modèle multimodal le plus puissant de Google bat GPT-4 sur 30 benchmarks
Sorti le 8 février 2024
Most capable Gemini 1.0 model
Beat GPT-4 on 30/32 benchmarks
Powers Gemini Advanced
StableLM 2 : L'Avancée Open Source de Stability AI avec Modèles 1.6B et 12B
Sorti le 6 février 2024
Open language model in two sizes: 1.6B and 12B
Trained on 2T tokens (Falcon RefinedWeb, RedPajama, The Pile, CulturaX)
Competitive with Mistral-7B despite smaller footprint
Stability AI Community License
StarCoder 2 : La Révolution des Modèles de Code Open Source avec 3B, 7B et 15B Paramètres
Sorti le 6 février 2024
Open code LLM in 3 sizes: 3B, 7B, 15B — trained on 4T+ tokens from The Stack v2
600+ programming languages, fill-in-the-middle capability
16K context with sliding window attention
Trained on permissively licensed code only
2023
SOLAR 10.7B d'Upstage : Le modèle open-source qui domine les benchmarks
Sorti le 13 décembre 2023
Korean startup Upstage's open model using depth up-scaling
Topped HuggingFace Open LLM Leaderboard at release
Apache 2.0 license
Mixtral 8x7B : Le modèle open-source révolutionnaire de Mistral AI qui défie les géants
Sorti le 11 décembre 2023
Open-source MoE matching GPT-3.5 quality with only 12.9B active params
Game-changer for open-source efficiency
Apache 2.0 license
Gemini 1.0 de Google DeepMind : Le modèle multimodal révolutionnaire qui redéfinit l'IA
Sorti le 6 décembre 2023
Google's multimodal model family (Nano/Pro/Ultra)
Natively multimodal from training
Nous Hermes 2 : Le modèle open-source qui révolutionne l'IA locale
Sorti le 13 novembre 2023
Community fine-tuned model on Mistral/Yi
Strong at instruction following
Popular for local AI
Yi 34B : Le modèle open-source bilingue qui défie les géants de l'IA
Sorti le 2 novembre 2023
Founded by Kai-Fu Lee
Strong bilingual (English/Chinese) model
Competitive with Llama 2 70B
ChatGLM3-6B : Le modèle open-source de nouvelle génération avec capacités d'agent
Sorti le 27 octobre 2023
Third gen GLM with function calling, code interpreter, and agent capabilities
Zephyr 7B : Le modèle open-source qui rivalise avec les géants de 70 milliards de paramètres
Sorti le 25 octobre 2023
Mistral 7B fine-tuned with DPO
Showed distilled alignment can match RLHF quality
Mistral 7B : Le modèle open source qui défie les géants de l'IA
Sorti le 27 septembre 2023
Outperformed Llama 2 70B on all benchmarks despite being smaller
Sliding window attention
Apache 2.0 license
Qwen 72B d'Alibaba Cloud : Le modèle ouvert qui défie les géants de l'IA
Sorti le 25 septembre 2023
Alibaba's multilingual model series
Strong on Chinese and English tasks
Open weights
WizardCoder 34B : Le modèle de codage open-source qui domine les benchmarks
Sorti le 26 août 2023
Evol-Instruct tuned Code Llama
Top open-source coding model of its era
Strong on HumanEval
Code Llama 34B : Le nouveau modèle de code open source de Meta révolutionne le développement IA
Sorti le 24 août 2023
Specialized Llama 2 for code generation
Supports Python, C++, Java, and more
100K context window
Llama 2 : Le modèle open source qui a révolutionné l'IA en 2023
Sorti le 18 juillet 2023
First truly open-weight large model for commercial use
7B/13B/70B sizes with RLHF-tuned chat variants
Founded the modern open LLM ecosystem
Claude 2 d'Anthropic : Le modèle de langage qui redéfinit l'IA conversationnelle
Sorti le 11 juillet 2023
200K context window
Constitutional AI approach
Strong coding and analysis capabilities
ChatGLM2: Le modèle open-source 6B de Zhipu AI révolutionne l'inférence rapide
Sorti le 25 juin 2023
Second generation GLM, 32K context
42% faster inference
Stronger math and coding
Falcon 180B : Le géant open-source de 180 milliards de paramètres qui domine les classements
Sorti le 25 mai 2023
Trained on 3.5T tokens of RefinedWeb
Topped the Open LLM Leaderboard
Apache 2.0 license
PaLM 2: Le modèle de langage de nouvelle génération de Google
Sorti le 10 mai 2023
Google's next-gen model powering Bard/Gemini
Improved multilingual, reasoning, and coding
MPT-7B : Le modèle open-source commercialisable qui révolutionne le paysage des LLM
Sorti le 5 mai 2023
Commercially usable open-source model
Trained on 1T tokens
Apache 2.0 license
StarCoder : Le modèle open-source de 15,5 milliards de paramètres qui révolutionne le développement assisté par IA
Sorti le 4 mai 2023
Open-source code LLM trained on The Stack (1T tokens, 80+ languages)
8K context window
StableLM : La Révolution des Modèles de Langage Open Source par Stability AI
Sorti le 19 avril 2023
Stability AI's open-source LLM family
3B and 7B sizes, trained on 1.5T tokens
CC-BY-SA license
Vicuna 13B : Le modèle open-source qui rivalise avec ChatGPT
Sorti le 30 mars 2023
Fine-tuned LLaMA on ShareGPT conversations
Achieved ~90% of ChatGPT quality
Launched the Chatbot Arena
Claude 1 d'Anthropic : Le Premier Modèle de Langage Révolutionnaire avec IA Constitutionnelle
Sorti le 14 mars 2023
Anthropic's first public model
Constitutional AI for safety
100K context window
GPT-4 d'OpenAI : Le modèle multimodal qui révolutionne l'IA
Sorti le 14 mars 2023
Multimodal (text + vision), passed the bar exam (90th percentile)
Massive leap in reasoning over GPT-3.5
~1.8T parameters (MoE estimated)
Alpaca 7B de Stanford : Comment un modèle open-source de 7 milliards de paramètres rivalise avec les géants du marché
Sorti le 13 mars 2023
Fine-tuned LLaMA on 52K instructions generated by GPT-3.5
Showed cheap instruction tuning works
LLaMA 1 de Meta AI : Le modèle ouvert qui a révolutionné l'IA générative
Sorti le 24 février 2023
Leaked weights ignited the open-source LLM revolution
Showed small models can match GPT-3
65B parameters
2022
ChatGPT : Le modèle linguistique qui a révolutionné l'ère de l'IA en 2022
Sorti le 30 novembre 2022
GPT-3.5 with RLHF in a chat interface
Reached 100M users in 2 months
Defined the AI era
Flan-T5 : Le modèle d'instruction de Google révolutionne l'apprentissage à faible échantillonnage
Sorti le 20 octobre 2022
Instruction-tuned T5
Demonstrated instruction tuning dramatically improves task generalization
BLOOM : Le modèle ouvert de 176 milliards de paramètres qui a révolutionné l'IA multilingue
Sorti le 6 juillet 2022
First 100B+ open-source multilingual model
Built by 1000+ researchers across 70+ countries
46 languages supported
OPT 175B : Le Modèle Open Source de Meta qui Défie GPT-3
Sorti le 3 mai 2022
Meta's open-source GPT-3 equivalent
Full model weights released for research
175B parameters
GPT-NeoX 20B : Le modèle open-source qui a changé la donne pour les LLM locaux
Sorti le 14 avril 2022
EleutherAI's 20B open model
First glimpse that local LLMs could scale to GPT-3 territory
Predecessor to today open-source ecosystem
PaLM 540B: Le modèle de langage révolutionnaire de Google qui change la donne en IA
Sorti le 4 avril 2022
540B parameter model
Breakthrough capabilities in reasoning, code, and multilingual tasks
Chinchilla : La révolution silencieuse de DeepMind qui redéfinit les lois de l'échelle en IA
Sorti le 29 mars 2022
Proved smaller models trained on more data outperform larger undertrained ones
Redefined scaling laws for LLMs
InstructGPT : La révolution de l'alignement humain dans les modèles de langage
Sorti le 27 janvier 2022
Introduced RLHF for alignment
Pioneered training models to follow human instructions safely
2021
Gopher de Google DeepMind : Le modèle de langage 280 milliards de paramètres qui a révolutionné l'IA en 2021
Sorti le 8 décembre 2021
280B parameter model
Extensive analysis of scaling laws across 152 tasks
Codex d'OpenAI : Le modèle de code qui a révolutionné le développement IA
Sorti le 10 août 2021
GPT-3 fine-tuned on code
Powered GitHub Copilot
Proved LLMs could write functional programs
GPT-J : Le modèle open-source de 6 milliards de paramètres qui a révolutionné l'IA accessible
Sorti le 9 juin 2021
First open model runnable on consumer hardware
6B params, GPT-2 architecture
Widely deployed in early local AI applications
Switch Transformer : Le modèle MoE de 1,6 trillion de paramètres qui révolutionne l'échelle du NLP
Sorti le 11 janvier 2021
1.6 trillion parameter MoE model
Demonstrated efficient scaling through sparse expert routing
2020
GShard : Le modèle MoE révolutionnaire de Google avec 600 milliards de paramètres
Sorti le 30 juin 2020
First Mixture of Experts model at massive scale
600B parameters for machine translation
GPT-3 d'OpenAI : Le modèle de langage qui a révolutionné l'IA en 2020
Sorti le 28 mai 2020
175B parameters — demonstrated few-shot learning without fine-tuning
Sparked the modern LLM revolution
2019
T5 : Le modèle révolutionnaire qui a changé la NLP avec l'approche Text-to-Text
Sorti le 23 octobre 2019
Text-to-Text Transfer Transformer
Unified framework treating all NLP tasks as text generation
RoBERTa de Meta AI : Le modèle linguistique qui a repensé l'entraînement des transformers
Sorti le 26 juillet 2019
Robustly Optimized BERT
Showed BERT was significantly undertrained
Achieved new SOTA with better training
XLNet: Le modèle de langage révolutionnaire qui dépasse BERT
Sorti le 19 juin 2019
Generalized autoregressive pretraining
Outperformed BERT on 20 NLP tasks
GPT-2 : Le modèle révolutionnaire qui a changé l'IA en 2019
Sorti le 14 février 2019
Initially withheld due to misuse concerns — "Too dangerous to release"
Showed emergent text generation quality at scale
2018
BERT de Google : Le modèle linguistique révolutionnaire qui a changé l'IA en 2018
Sorti le 11 octobre 2018
Bidirectional Encoder Representations from Transformers
Revolutionized NLP benchmarks
Became the foundation for search engines
GPT-1 : Le Premier Modèle de Langue Transformateur d'OpenAI
Sorti le 11 juin 2018
First GPT model — decoder-only transformer
Demonstrated generative pre-training for language understanding
ELMo : Le modèle révolutionnaire d'Allen AI qui a changé la NLP en 2018
Sorti le 15 février 2018
Embeddings from Language Models
Contextualized word representations using bidirectional LSTMs
2017
Transformer de Google : L'architecture révolutionnaire qui a tout changé
Sorti le 12 juin 2017
'Attention Is All You Need' paper introduces the Transformer architecture
The foundation of all modern LLMs