Timeline de Lanzamientos de Modelos IA
Una timeline cronológica de los principales lanzamientos de modelos IA
2026
ERNIE-5.1-Preview: El Nuevo Líder en Eficiencia de Baidu
Lanzado el 9 de mayo de 2026
Tops LMArena Search leaderboard as #4 globally and #1 among Chinese models with a score of 1,223
Math: #9 globally on LMArena category leaderboards
Legal & Government: #1 globally on LMArena category leaderboards
Business, Management & Financial Ops: #4 globally on LMArena category leaderboards
Software & IT Services: #7 globally on LMArena category leaderboards
Compresses total parameters to approximately 1/3 and active parameters to approximately 1/2 of ERNIE-5.0
Achieves leading performance using only about 6% of the pre-training cost of comparable models
Powered by decoupled fully-asynchronous reinforcement learning infrastructure built on PaddlePaddle
Uses scaled agentic post-training with Multi-Teacher On-Policy Distillation (MOPD)
Scores 99.6 on AIME26 with tool use, second only to Gemini 3.1 Pro
Surpasses DeepSeek-V4-Pro on tau-cubed-bench and SpreadsheetBench-Verified agent evaluation tasks
Four-stage post-training pipeline: SFT, Domain Expert Model Training, On-Policy Distillation, and General Online RL
Based on Once-For-All elastic training framework with elastic depth, width, and sparsity dimensions
Rolling out on 10+ creative production agent platforms including ISEKAI ZERO and Mulan AI
Creative writing capabilities approach those of Gemini 3.1 Pro
xAI Grok 4.3: Nuevo Modelo de Razonamiento Agéntico
Lanzado el 30 de abril de 2026
Reasoning model from xAI with configurable effort levels (none/low/medium/high, default low)
Accepts text and image inputs with text output
Suited for agentic workflows, instruction-following tasks, and high factual accuracy applications
1 million token context window with no output token limit
Well-suited for long-document analysis, deep research, and multi-step agentic tasks
Tiered pricing: requests exceeding 200k total tokens are billed at a higher rate
Mistral Medium 3.5: La Revolución del Open Source en 2026
Lanzado el 29 de abril de 2026
New flagship model merging instruction-following, reasoning, and coding into a single 128B dense architecture
Released as open weights under a modified MIT license
Runs self-hosted on as few as four GPUs
API pricing at $1.50/mtok input and $7.50/mtok output
Powers the new Mistral Vibe remote agents for async cloud coding sessions
Drives Work mode in Le Chat for multi-step agentic task execution with parallel tool calling
Sessions can be spawned from CLI or Le Chat, and local CLI sessions can be teleported to the cloud
NVIDIA Nemotron 3 Nano Omni: El Futuro de los Agentes Multimodales
Lanzado el 28 de abril de 2026
Multimodal model unifying video, audio, image, and text understanding in a single architecture
Hybrid Mixture-of-Experts (MoE) 30B-A3B architecture with 30B total and 3B active parameters
Up to 9x higher throughput compared to similar open omnimodal models
256K unified context window with single-pass perception
Hybrid architecture combining Mamba layers for memory efficiency and transformers for precise reasoning
Integrates vision encoders (C3D for video) and audio encoders (Paraquet), eliminating need for separate models
Supports FP8/NVFP4 quantization with optimized inference on NVIDIA Ampere, Hopper, and Blackwell GPUs
Designed for enterprise multimodal agents: document intelligence (OCR, tables), GUI navigation, audio-video reasoning
Runs locally with 25-36GB RAM in 4/8-bit quantization via Unsloth or vLLM
Available on Hugging Face, Ollama, OpenRouter, and NVIDIA NIM
Laguna-M.1: El Nuevo Estándar en Modelado de Código
Lanzado el 28 de abril de 2026
225B total parameter Mixture-of-Experts model with 23B activated parameters per token
Poolside most capable model to date, completed pre-training at end of 2025
Trained from scratch on 30T tokens using Muon optimizer
Trained on 6,144 interconnected NVIDIA Hopper GPUs entirely in-house
Achieves 72.5% on SWE-bench Verified, 67.3% on SWE-bench Multilingual, 46.9% on SWE-bench Pro, 40.7% on Terminal-Bench 2.0
128K context window with up to 8K output tokens
Agentic coding model built for long-horizon software engineering tasks
Foundation for the entire Laguna model family
Uses custom async on-policy RL system with Agent Client Protocol (ACP) server
Free to use for a limited time via poolside API and OpenRouter
Weights available on request for startups, institutions, and universities
Laguna-XS.2: El Nuevo Estándar en Modelos de Código Abierto
Lanzado el 28 de abril de 2026
33B total parameter Mixture-of-Experts model with 3B activated parameters per token
First open-weight release from poolside, licensed under Apache 2.0
Trained on 30T tokens using Muon optimizer
Supports native reasoning with interleaved thinking between tool calls
Uses Sliding Window Attention with per-head gating in 30 of 40 layers
KV cache quantized to FP8 for reduced memory per token
Compact enough to run locally on a Mac with 36 GB RAM
128K context window with up to 8K output tokens
Achieves 68.2% on SWE-bench Verified, 62.4% on SWE-bench Multilingual, 44.5% on SWE-bench Pro, 30.1% on Terminal-Bench 2.0
Supports vLLM, Transformers, TRT-LLM, and Ollama
Agentic coding model built for long-horizon software engineering tasks
Free to use for a limited time via poolside API and OpenRouter
DeepSeek-V4: El Nuevo Estándar en Modelos Abiertos de IA (2026)
Lanzado el 24 de abril de 2026
Deux modèles : DeepSeek-V4-Pro (1.6T total / 49B active params) et DeepSeek-V4-Flash (284B total / 13B active params)
Context length de 1M tokens, output max de 384K tokens
Support thinking mode (par défaut) et non-thinking mode
Pricing ultra-agressif : Flash à $0.14/M input tokens (cache miss), $0.028/M (cache hit), $0.28/M output — soit ~7x moins cher que Claude Opus 4.7
Pro à $1.74/M input tokens (cache miss), $0.145/M (cache hit), $3.48/M output
Modèles open-source, poids disponibles sur HuggingFace
Compatible format API OpenAI et Anthropic (https://api.deepseek.com et https://api.deepseek.com/anthropic)
Support JSON output, Tool Calls, Chat Prefix Completion (Beta), FIM Completion (Beta)
Performance rivalisant avec les meilleurs modèles closed-source mondiaux
GPT-5.5: La Nueva Era de la Inteligencia Artificial de OpenAI
Lanzado el 23 de abril de 2026
GPT-5.5 is OpenAI smartest and most intuitive to use model yet, described as the next step toward a new way of getting work done on a computer
Achieves 82.7% on Terminal-Bench 2.0, 73.1% on Expert-SWE (Internal), and 84.9% on GDPval — all state-of-the-art scores
Matches GPT-5.4 per-token latency while performing at a much higher level of intelligence
Significantly more token efficient — uses fewer tokens to complete the same tasks compared to GPT-5.4
Scores 78.7% on OSWorld-Verified for real computer environment operation and 81.8% on CyberGym
GPT-5.5 Pro achieves 90.1% on BrowseComp and 52.4% on FrontierMath Tier 1-3
On SWE-Bench Pro, reaches 58.6% solving more tasks end-to-end in a single pass than previous models
Proactively deployed with industry-leading cybersecurity safeguards, classified as High under OpenAI Preparedness Framework
Helped discover a new proof about Ramsey numbers in combinatorics, later verified in Lean
Scores 25.0% on GeneBench for multi-stage scientific data analysis in genetics
API pricing: $5/1M input tokens and $30/1M output tokens with 1M context window
GPT-5.5 Pro API pricing: $30/1M input tokens and $180/1M output tokens
Co-designed, trained with, and served on NVIDIA GB200 and GB300 NVL72 systems
Rolling out to Plus, Pro, Business, and Enterprise users in ChatGPT and Codex
GPT-5.5 Thinking unlocks faster help for harder problems with smarter, more concise answers
Outperforms Claude Opus 4.7 and Gemini 3.1 Pro on most coding and professional benchmarks
More than 85% of OpenAI now uses Codex every week across all company functions
Xiaomi MiMo-V2.5-Pro: El Nuevo Estándar de IA con 1 Trillón de Parámetros
Lanzado el 22 de abril de 2026
Multimodal Mixture-of-Experts (MoE) architecture with 1T+ total parameters (42B active)
Extended context window up to 1M tokens
Native multimodal perception supporting text, images, video, and audio
Advanced autonomous agent capabilities handling 1000+ tool calls
40-60% better token efficiency compared to Claude Opus and GPT-5.x
ClawEval benchmark: 64% Pass@3 score
SWE-bench Pro: 57.2% task resolution rate
Surpasses Claude 4.6 Sonnet in coding tasks, approaches Claude Opus in agentic performance
Part of the MiMo-V2.5 family alongside MiMo-V2.5 and MiMo-V2.5-TTS
Available via mimo.mi.com with affordable token plans (monthly/annual subscriptions)
Qwen3.6-27B: El Nuevo Estándar en IA Abierta y Código
Lanzado el 22 de abril de 2026
27B dense open-source model with Apache 2.0 license
Surpasses Qwen3.5-397B-A17B on all major agentic coding benchmarks
SWE-bench Verified: 77.2 vs 76.2, Terminal-Bench 2.0: 59.3 vs 52.5, SkillsBench: 48.2 vs 30.0
Supports both multimodal thinking and non-thinking modes natively
Native vision-language support for images and video understanding
GPQA Diamond: 87.8, competitive with models several times its size
Compatible with OpenClaw, Claude Code, and Qwen Code coding assistants
Available on Hugging Face, ModelScope, and Alibaba Cloud Model Studio API
Kimi K2.6 de Moonshot AI: El Nuevo Líder Open-Source en Agentes y Código
Lanzado el 20 de abril de 2026
Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python (86.7), Math Vision w/ python (93.2)
Long-horizon coding: 4,000+ tool calls, over 12 hours continuous execution
Generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization)
300 parallel sub-agents x 4,000 steps per run (up from K2.5: 100 / 1,500)
Proactive Agents: powers OpenClaw, Hermes Agent for 24/7 autonomous ops
Claw Groups research preview: bring your own agents, command friends bots & humans in the loop
API PRICING (use these EXACT values): kimi-k2.6 — Input $0.16/M tokens (cache hit), Input $0.95/M tokens (cache miss), Output $4.00/M tokens, Context Window 262,144 tokens
Sources: https://platform.moonshot.ai, https://kimi.com/blog/kimi-k2-6, https://huggingface.co/moonshotai/Kimi-K2.6
Live on kimi.com in chat and agent mode, plus Kimi Code at https://kimi.com/code for production-grade coding
Claude Opus 4.7: El Nuevo Estándar en Razonamiento y Desarrollo de Software
Lanzado el 16 de abril de 2026
Most capable generally available Anthropic model for complex reasoning and agentic coding
High-resolution image support: 2576px / 3.75MP (up from 1568px / 1.15MP) with 1:1 pixel mapping
New "xhigh" effort level for coding and agentic use cases
Task budgets (beta) — advisory token budget across full agentic loops
128K max output tokens, 1M context window at standard pricing
+12 points on CursorBench coding benchmarks vs Opus 4.6
New tokenizer (up to ~35% more tokens per text, improved performance)
Adaptive thinking only — extended thinking budgets removed
Sampling parameters (temperature, top_p, top_k) removed
Pricing: $5/$25 per MTok input/output, batch $2.50/$12.50 per MTok
GLM-5.1: El Nuevo Estándar de Reasoning Abierto Fuente
Lanzado el 7 de abril de 2026
#1 on SWE-Bench Pro (58.4%), beating GPT-5.4 and Claude Opus 4.6
Post-training upgrade to GLM-5 — same 744B MoE architecture (40B active)
Trained entirely on Huawei Ascend chips — no NVIDIA hardware
MIT license, compatible with Claude Code and OpenClaw
202K context window, strong on cybersecurity (CyberGym 68.7%)
Claude Opus 4.6 Fast: Análisis Técnico y Despliegue
Lanzado el 7 de abril de 2026
Faster variant of Claude Opus 4.6 with comparable intelligence
Claude Mythos Preview: El Nuevo Límite de la IA de Anthropic
Lanzado el 7 de abril de 2026
New Capybara tier above Opus — the most powerful Anthropic model
93.9% on SWE-bench Verified, 77.8% on SWE-bench Pro
97.6% on USAMO 2026, 94.5% on GPQA Diamond
1M context window, limited preview for ~50 partner organizations
Google DeepMind lanza Gemma 4: El Futuro del Open Source en IA
Lanzado el 2 de abril de 2026
Google's most capable open models, built from Gemini 3 research
Four sizes: E2B, E4B, 26B MoE (3.8B active), 31B Dense
First Gemma release under Apache 2.0 license
Native multimodal, 140+ languages, up to 256K context
Agent-ready with function calling and structured JSON output
GLM-5V Turbo de Zhipu AI: El Nuevo Estándar en Modelos Multimodales para Agentes
Lanzado el 1 de abril de 2026
Vision + Code model from Z.ai
Multimodal coding capabilities
API only
Qwen 3.6 Plus: El Nuevo Estándar en Razonamiento Agente y Código
Lanzado el 31 de marzo de 2026
1M token context window with always-on chain-of-thought reasoning
78.8% on SWE-bench Verified — competitive with Claude Opus 4.6
2-3x faster output speed than Claude Opus 4.6
Free preview via OpenRouter, successor to Qwen 3.5
Mistral AI presenta Voxtral TTS: El modelo de voz abierto que desafía a ElevenLabs
Lanzado el 23 de marzo de 2026
Mistral's first audio model — direct competitor to ElevenLabs
Zero-shot voice cloning with multilingual support
Real-time streaming capabilities
Open weights under CC BY-NC 4.0 (non-commercial)
Xiaomi MiMo-V2-Pro: El Nuevo Estándar en Razonamiento IA Open Source
Lanzado el 18 de marzo de 2026
Xiaomi reasoning model with strong math and code performance
309B MoE architecture
MiniMax M2.7: El Modelo de Autoevolución que Rivaliza con GPT-5
Lanzado el 18 de marzo de 2026
Self-evolving agent model — first to participate in its own development
56.22% on SWE-Pro, matching GPT-5.3-Codex
57.0% on Terminal Bench 2, GDPval-AA ELO 1495 (highest open-source)
230B MoE (10B active), 200K context, open weights on HuggingFace
Agent Teams for native multi-agent collaboration
OpenAI GPT-5.4 Mini: Eficiencia y Uso Nativo de Computadora
Lanzado el 17 de marzo de 2026
Efficient variant of GPT-5.4 with native computer use
Lower cost while maintaining strong reasoning capabilities
Leanstral Mistral: Primer Agente Open Source para Lean 4
Lanzado el 16 de marzo de 2026
First open-source code agent for Lean 4 formal proof engineering
Generates code AND machine-checkable mathematical proofs
119B MoE with 6.5B active, outperforms Claude Sonnet 4.6 on FLTEval
Apache 2.0 license, 15x cheaper than Claude Opus for formal verification
Mistral Small 4: El Nuevo Estándar Open Source de 2026
Lanzado el 16 de marzo de 2026
Unifies instruct, reasoning, coding, and multimodal in a single model
119B MoE with 6.5B active parameters, 256K context window
Replaces Magistral (reasoning), Pixtral (vision), and Devstral (coding)
Apache 2.0 license, configurable reasoning parameter
Grok 4.20: El Nuevo Líder en Agentes y Contexto Masivo
Lanzado el 12 de marzo de 2026
Beta release with parallel agents architecture
500K context window
Iterative improvement via user feedback
NVIDIA Nemotron 3 Super: El Nuevo Estándar para Agentes IA Abiertos
Lanzado el 11 de marzo de 2026
Open MoE model from NVIDIA
120B total parameters with 12B active
Strong enterprise performance
OpenAI GPT-5.4: Análisis Técnico y Lanzamiento 2026
Lanzado el 6 de marzo de 2026
Latest OpenAI flagship with 1M token context window
Available in Standard, Mini, and Nano variants
Supports reasoning effort with 4 effort levels
128K max output tokens
Prompt caching with $0.02-$0.25/M cached read
Gemini 3.1 Flash Lite Preview: El Nuevo Estándar de Eficiencia en 2026
Lanzado el 3 de marzo de 2026
Google's high-efficiency model optimized for high-volume use cases
1M token context window, 65.5K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Gemini 3.1 Pro: La Revolución del Razonamiento Multimodal
Lanzado el 19 de febrero de 2026
Google's latest flagship model
More than doubles reasoning performance over Gemini 3 Pro
Released in preview via Gemini API, AI Studio, and Vertex AI
Grok 4.2 de xAI: Análisis Técnico y Despliegue
Lanzado el 17 de febrero de 2026
Beta release with rapid learning architecture — improves weekly via user feedback
256K context window
4-agent parallel reasoning
Medical document analysis added
Claude Sonnet 4.6: La Nueva Era del Razonamiento y Código en 2026
Lanzado el 17 de febrero de 2026
Most capable Sonnet yet with full upgrade across coding, computer use, long-context reasoning
1M token context window in beta
200K token context window, 64K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Qwen 3.5: El Nuevo Estándar en IA Agente y MoE Eficiente
Lanzado el 14 de febrero de 2026
Agentic AI model with built-in tools for web search and code execution
1M token context window
Qwen3.5-Plus hosted; open weights planned
MiniMax M2.5: El Nuevo Estándar en Eficiencia y Código Abierto
Lanzado el 12 de febrero de 2026
Frontier MoE model with 80.2% on SWE-Bench Verified
Strong coding and agentic capabilities
230B total parameters, 10B activated per token
DeepSeek V3.2: El Nuevo Gigante Open Source que Rivaliza con GPT-5
Lanzado el 12 de febrero de 2026
Major update to the V3 series with 1M token context
671B MoE focused on code generation and reasoning improvements
Open weights on HuggingFace, MIT license
GLM-5 de Zhipu AI: El Nuevo Líder en Razonamiento y Agentes Abiertos
Lanzado el 11 de febrero de 2026
China's first public AI company frontier model
Targets complex systems engineering and long-horizon agentic tasks
MiniCPM-o 4.5: El Nuevo Estándar en IA Multimodal de 9B
Lanzado el 8 de febrero de 2026
On-device multimodal LLM with full-duplex real-time audio, image, video
Built on Qwen3-8B architecture
Gemini 2.5 Flash level performance at only 9B parameters
GPT-5.3-Codex: El Nuevo Estándar en Ingeniería de Software con IA
Lanzado el 5 de febrero de 2026
Most capable agentic coding model from OpenAI
Available via Codex app, CLI, IDE extensions
Optimized for software engineering workflows
Claude Opus 4.6: El Nuevo Estándar en IA de Razonamiento
Lanzado el 5 de febrero de 2026
Huge leap for agentic planning with parallel subtask execution
Tool and subagent orchestration capabilities
Terminal-Bench record holder
1M token context window, 32K max output
State-of-the-art agentic AI behaviors
Step-3.5-Flash: Razonamiento de Frontera a Bajo Costo
Lanzado el 1 de febrero de 2026
Open-source sparse MoE with 3-way Multi-Token Prediction
100-350 tok/s generation speed
Frontier reasoning at low cost
Arcee AI lanza Trinity Large: El Gigante Abierto de 400B Parámetros
Lanzado el 27 de enero de 2026
400B sparse MoE with only 13B active parameters
Built in the US with open weights
One of the largest open-source foundation models
Apache 2.0 license
Qwen3-Max-Thinking: El Nuevo Estándar en Razonamiento Lógico para 2026
Lanzado el 27 de enero de 2026
Top-tier reasoning model with adaptive tool use
Retrieves information and runs code during inference
Rivals leading frontier models
Kimi K2: El Gigante Open Source de 1T Parámetros de Moonshot AI
Lanzado el 20 de enero de 2026
Massive 1T MoE with 32B active parameters
First open-weight model to rank #1 on LMSYS Chatbot Arena
2M token context window, 200+ language support
$0.15/$2.50 per 1M tokens, Modified MIT license
Sarvam-2B: El Modelo Soberano de IA India para Desarrolladores
Lanzado el 15 de enero de 2026
India's multilingual LLM — part of sovereign AI initiative
Supports 10+ Indian languages natively
2025
SOLAR 102B: La Revolución Coreana del Open Source
Lanzado el 31 de diciembre de 2025
Korea's answer to open frontier models
102B MoE model with 12B active parameters
Gemini 3 Flash: El Nuevo Estándar de Velocidad y Eficiencia de Google
Lanzado el 17 de diciembre de 2025
Fast frontier-class model rivaling larger models at a fraction of the cost
Default model in the Gemini app
Molmo 2: El Nuevo Estándar Multimodal Abierto de Allen AI
Lanzado el 16 de diciembre de 2025
Multimodal model from AI2
Fully open weights, data, and code
Xiaomi MiMo V2 Flash: El Nuevo Estándar de Razonamiento Abierto
Lanzado el 16 de diciembre de 2025
Xiaomi large reasoning model
309B MoE architecture
Strong on math and code
OpenAI GPT-5.2: El Nuevo Estándar para Ingeniería de IA y Desarrollo
Lanzado el 11 de diciembre de 2025
Improved reasoning and multimodal capabilities over GPT-5.1
Enhanced mental health protections
128K max output tokens
Available on Plus ($20/month), Pro ($200/month), and API
Expert-level performance on 44 knowledge work tasks
Devstral Small 2: El Nuevo Estándar en Modelos de Código Open Source
Lanzado el 9 de diciembre de 2025
Successor to Devstral Small 1, derived from Mistral Small 3.1
Portable coding agent
Apache 2.0 license
Mistral AI lanza Devstral 2: El Nuevo Estándar en Código Open Source
Lanzado el 9 de diciembre de 2025
Next-gen coding model with top SWE-Bench score
Modified MIT license (free unless high revenue)
Ministral 3 14B: El Nuevo Gigante Multimodal de Mistral AI
Lanzado el 2 de diciembre de 2025
Largest Ministral 3 model with vision
Best-in-class text and vision capabilities
Apache 2.0 license
Ministral 3 8B: El Nuevo Estándar en Modelos Abiertos Multimodales
Lanzado el 2 de diciembre de 2025
Powerful and efficient model with vision
Best-in-class text and vision at this size
Apache 2.0 license
Ministral 3 3B: Potencia de Borde con Visión y Apache 2.0
Lanzado el 2 de diciembre de 2025
Tiny and efficient edge model with vision
Runs on phones, drones, and laptops
Apache 2.0 license
Amazon Nova 2: El Nuevo Estándar en AWS Bedrock
Lanzado el 2 de diciembre de 2025
Amazon next-gen foundation model
Available via AWS Bedrock
Announced at re:Invent
Mistral Large 3: El Nuevo Estándar Abierto en IA (2025)
Lanzado el 2 de diciembre de 2025
Sparse MoE with 41B active parameters
Open weights
Strong reasoning and multilingual capabilities
GLM-4.7 de Zhipu: El Nuevo Líder en Código Abierto y Razonamiento
Lanzado el 1 de diciembre de 2025
Open-weights model topping global coding and reasoning leaderboards
Includes GLM-4.7 Flash variant
Cost-effective compared to Western competitors
MiniMax M2.1: El Nuevo Estándar en Modelos de Código Abiertos
Lanzado el 1 de diciembre de 2025
Fully open-source SOTA coding model
230B params MoE architecture, 10B activated per token
SWE-bench score of 74.0%
92% cheaper than Western alternatives
Anthropic Lanza Claude Opus 4.5: Nuevo Estándar en Reasoning
Lanzado el 24 de noviembre de 2025
Exceeds Sonnet 4.5 by 4.3% using 48% fewer tokens at max effort
200K token context, 64K max output
Hybrid reasoning with instant or extended thinking
Multimodal: text, image, and audio support
20% accuracy gain, Excel and financial modeling breakthrough
Allen AI presenta OLMo 3: Nuevo Estándar Open Source 32B
Lanzado el 20 de noviembre de 2025
Fully open model with weights, data, and training code
From AI2 research lab
Deep Cogito v2.1: El Nuevo Estándar en Razonamiento Abierto
Lanzado el 19 de noviembre de 2025
Large 671B MoE reasoning model
Strong on complex reasoning tasks
Gemini 3 Deep Think: El Nuevo Estándar en Razonamiento Avanzado
Lanzado el 18 de noviembre de 2025
Reasoning variant of Gemini 3
Deep chain-of-thought for complex scientific problems
Gemini 3 Pro: El Nuevo Estándar Multimodal de Google DeepMind
Lanzado el 18 de noviembre de 2025
Over 50% improvement over Gemini 2.5 Pro
Most powerful Google model — replaces 2.5 series
1M token context window
Advanced multimodal: text, image, video, audio, code
OpenAI lanza GPT-5.1: Más rápido, conversacional y listo para todos
Lanzado el 12 de noviembre de 2025
Family of four models with adaptive reasoning
Faster, more conversational, improved coding
Rolled out to all ChatGPT users
Kimi K2.5: El Nuevo Líder en Razonamiento de Moonshot AI
Lanzado el 6 de noviembre de 2025
Upgraded Kimi model with thinking and reasoning capabilities
Amazon Nova Premier: El Nuevo Estándar en Modelos Multimodales de AWS
Lanzado el 31 de octubre de 2025
Most capable Amazon model
1M context window
Multimodal capabilities
Teacher for distillation on Bedrock
Alice AI 1.0: El Nuevo Líder Ruso en Grandes Modelos de Lenguaje
Lanzado el 28 de octubre de 2025
First major Russian-developed large language model on the global stage
From Yandex
MiniMax M2: El Nuevo Gigante Open Source de 230B
Lanzado el 23 de octubre de 2025
Upgraded MiniMax model with improved reasoning and generation
Open weights
GLM-4.6 de Zhipu AI: Soporte Nativo para Chips Chinos y Razonamiento Avanzado
Lanzado el 9 de octubre de 2025
First GLM model with native support for China domestic chips
Cambricon and Moore Threads support
FP8 and Int4 quantization
IBM Granite 4.0: La Revolución Híbrida Mamba-Transformer Abierta
Lanzado el 2 de octubre de 2025
IBM open enterprise model
Hybrid Mamba-2 Transformer architecture
Apache 2.0 license
Claude Haiku 4.5: El Nuevo Estándar en Velocidad y Eficiencia de Anthropic
Lanzado el 1 de octubre de 2025
Anthropic's fastest model with near-frontier intelligence
200K token context window, 64K max output
21K+ tokens per second for prompts under 32K tokens
Supports reasoning budget and effort control
Most cost-effective in the Claude family: $1/M input
DeepSeek V3.2: El Nuevo Estándar Abierto que Desafía a GPT-5
Lanzado el 29 de septiembre de 2025
Further iteration on V3 series
Enhanced capabilities across all benchmarks
Open weights
Claude Sonnet 4.5: El Nuevo Estándar en Desarrollo de Software
Lanzado el 29 de septiembre de 2025
Anthropic's best model for coding tasks
1M token context window (beta feature)
64K max output tokens
Strong agentic behavior and computer-use skills
Optimized for efficient coding and parallel processing
Qwen3-Next: El Nuevo Gigante Open Source de Alibaba Cloud
Lanzado el 10 de septiembre de 2025
Ultra-efficient MoE from Alibaba
80B total, only 3B active parameters
Strong reasoning with minimal compute
Apache 2.0 license
Kimi K2: El Gigante Open Source de 1T Parámetros de Moonshot AI
Lanzado el 4 de septiembre de 2025
Massive 1T MoE model with open weights
Highly competitive with frontier models
Major Chinese AI milestone
32B activated parameters
Cost-effective: ~$0.15/M input, $2.50/M output
Strong coding performance across 32+ languages
Grok 4 Fast de xAI: Eficiencia y Velocidad para el Desarrollo en 2025
Lanzado el 1 de septiembre de 2025
98% cost reduction compared to Grok 4 Standard
40% increase in token efficiency
Real-time search integration via X
$0.20/M input, $1.50/M output
Mistral AI Despliega Magistral Medium 1.2: El Nuevo Estándar en Razonamiento Multimodal
Lanzado el 1 de septiembre de 2025
Adds vision to Magistral Medium
Multimodal frontier reasoning
Closed API only
Magistral Small 1.2: El Nuevo Líder en Razonamiento Multimodal
Lanzado el 1 de septiembre de 2025
Adds vision to Magistral Small
Multimodal reasoning model
Apache 2.0 license
Hermes 4 405B: La Nueva Era del Razonamiento Abierto
Lanzado el 28 de agosto de 2025
Latest in the Hermes series
Advanced function calling and structured output
Built on Llama 3.1
DeepSeek V3.1: El Nuevo Estándar en Modelos Open Source de 671B
Lanzado el 21 de agosto de 2025
Major upgrade to V3 with improved reasoning and coding
Open weights
Mistral Medium 3.1: El Nuevo Estándar Multimodal en 2025
Lanzado el 12 de agosto de 2025
Frontier-class multimodal model
Competitive with GPT-4o and Claude 3.5
Strong vision and reasoning capabilities
GLM-4.5V: El Nuevo Gigante Multimodal de Zhipu AI
Lanzado el 11 de agosto de 2025
Vision-language model from Z.ai
106B parameters with strong multimodal understanding
OpenAI GPT-5: El Salto Histórico a la IA Razonable (2025)
Lanzado el 7 de agosto de 2025
Next-generation flagship with major intelligence leap
400K token context window
Built-in reasoning with 4 effort levels
Multimodal: text, image, and video-based reasoning
Available in Standard, Mini, and Nano variants
GPT-OSS: El Modelo Abierto de OpenAI que Cambia el Juego
Lanzado el 5 de agosto de 2025
OpenAI's first open-weight models since GPT-2
20B and 120B variants
Historic open-source move from OpenAI
Claude Opus 4.1: El Nuevo Líder en Razonamiento para Desarrolladores
Lanzado el 5 de agosto de 2025
Upgrade to Claude 4 with improved coding and instruction following
200K token context window
Extended thinking support
Vision and tool calling capabilities
Claude 4.5 Sonnet: El Nuevo Estándar en Codificación y Razonamiento
Lanzado el 29 de julio de 2025
Newest Anthropic model with improved creative writing
Enhanced nuance and multi-step reasoning
GLM-4.5 Air de Zhipu: Eficiencia y Rendimiento en 2025
Lanzado el 28 de julio de 2025
Lightweight variant of GLM-4.5
106B MoE, efficient inference on 8x H20 GPUs
GLM-4.5: El Nuevo Estándar Open-Source de Zhipu AI (2025)
Lanzado el 28 de julio de 2025
Z.ai flagship open MoE model
355B total parameters
Strong reasoning, coding, and agentic capabilities
Claimed cheaper to run than DeepSeek
xAI Grok 4: El Nuevo Líder en IA Generativa
Lanzado el 11 de julio de 2025
xAI's most powerful model at the time
Major reasoning leap
Trained on expanded Colossus cluster
Gemma 3n: La Revolución del Edge AI de Google DeepMind
Lanzado el 26 de junio de 2025
Efficient on-device model designed for mobile
Runs on phones and edge devices
GPT-o3 Pro: El Nuevo Estándar en Modelos de Razonamiento de OpenAI
Lanzado el 10 de junio de 2025
Most powerful OpenAI reasoning model
Extended thinking for frontier problems
Mistral Small 3.2: Mejoras de Razonamiento y Código
Lanzado el 10 de junio de 2025
Update to Mistral Small 3.1
Improved instruction following and reasoning
Apache 2.0 license
Dots.llm1: El Nuevo Estándar Open Source de Xiaohongshu
Lanzado el 6 de junio de 2025
Open-source MoE from RedNote (China Instagram)
142B total, 14B active
Performance on par with frontier models at time of release
Magistral Small: El Nuevo Estándar en Razonamiento de Mistral AI
Lanzado el 5 de junio de 2025
Mistral reasoning model with extended thinking
Strong STEM performance
Apache 2.0 license
Gemini 2.5 Pro (06-05): El Nuevo Estándar en Razonamiento y Código
Lanzado el 5 de junio de 2025
Latest 2.5 Pro with enhanced coding, reasoning, and agentic capabilities
MiniMax-M1: El Nuevo Gigante de Código Abierto con Atención Relámpago
Lanzado el 1 de junio de 2025
Chinese AI lab flagship with strong long-context
Lightning attention architecture
Anthropic Lanza Claude Sonnet 4: El Nuevo Líder en Código y Agentes
Lanzado el 22 de mayo de 2025
High-performance model balancing speed and intelligence
200K context window, 64K max output
Best model for complex agents and coding
Native tool calling and computer use
Available on free tier of Claude.ai
Claude Opus 4: El Nuevo Líder en Razonamiento y Agentes Autónomos
Lanzado el 22 de mayo de 2025
Most powerful Anthropic model at launch
Parallel tool use, long autonomous tasks
200K token context window
Extended thinking support
Vision capabilities for image understanding
Mistral AI lanza Devstral: El modelo de código de 24B bajo Apache 2.0
Lanzado el 21 de mayo de 2025
Mistral dedicated coding model
Optimized for software engineering and agentic coding tasks
Apache 2.0 license
Falcon H1: Revolución Abierta con Arquitectura Híbrida de TII
Lanzado el 20 de mayo de 2025
Hybrid SSM+attention architecture
Six model sizes from 0.5B to 34B
Punches above weight class on benchmarks
Apache 2.0 license
Gemini 2.5 Flash: El Nuevo Estándar de Velocidad y Razonamiento
Lanzado el 20 de mayo de 2025
Cost-efficient reasoning with controllable thinking depth
#1 Chatbot Arena for speed
Mistral Medium 3: El Nuevo Estándar Abierto en IA (2025)
Lanzado el 14 de mayo de 2025
Front-tier model, competitive with GPT-4o
Strong multilingual capabilities
Apache 2.0 license
Qwen 3: El Nuevo Modelo Open-Source de 235B Parámetros de Alibaba Cloud
Lanzado el 29 de abril de 2025
Excellent multilingual performance (Chinese, English, and more)
0.6B to 235B variants with hybrid thinking
119 languages supported
22B active parameters in MoE architecture
Strong coding performance
Apache 2.0 license
Zhipu GLM-4.1V: El Nuevo Gigante Multimodal de 32B
Lanzado el 25 de abril de 2025
Open 32B and 9B multimodal with reasoning
Competitive on vision tasks
OpenAI o4-mini: El Nuevo Estándar en Razonamiento Eficiente para Desarrolladores
Lanzado el 16 de abril de 2025
Efficient reasoning model
Best cost-performance for coding and STEM
OpenAI o3: El Nuevo Estándar de Razonamiento para Ingeniería
Lanzado el 16 de abril de 2025
Full o3 reasoning model — successor to o1
Deep chain-of-thought capabilities
OpenAI GPT-4.1 Series: El Nuevo Estándar para Ingeniería de Software
Lanzado el 14 de abril de 2025
Optimized for coding and instruction following
1M token context window
Available in Standard, Mini, and Nano variants
Nano: $0.10/M input, $0.40/M output
Llama 4 de Meta: El Nuevo Estándar Abierto para IA Multimodal
Lanzado el 5 de abril de 2025
Open-weight natively multimodal models
Scout: 109B, runs on single H100 GPU, 10M token context
Maverick: 400B, requires H100 DGX system
Early fusion for native text, image, and video understanding
Gemini 2.5 Pro: El Nuevo Estándar en IA Multimodal de Google DeepMind
Lanzado el 25 de marzo de 2025
#1 on LMArena at launch
Built-in reasoning capabilities
1M token context window
Native code execution and Google Search grounding
Best overall model at launch
NVIDIA Nemotron Ultra: El Nuevo Estándar en Razonamiento Abierto
Lanzado el 18 de marzo de 2025
Open reasoning model based on Llama
253B MoE architecture
Strong enterprise tasks
Mistral Small 3.1: Visión Multimodal y 128K Contexto en Open Source
Lanzado el 17 de marzo de 2025
Adds vision capabilities to Small 3.0
Multimodal, 128K context
Apache 2.0 license
Cohere Command A: El Nuevo Estándar Open Source para Empresas
Lanzado el 13 de marzo de 2025
Cohere's 111B flagship model
Enterprise RAG and agentic tasks
Multilingual capabilities
Runs on 2 GPUs
Google DeepMind lanza Gemma 3: El estándar multimodal abierto
Lanzado el 12 de marzo de 2025
1B/4B/12B/27B variants
Multimodal (text+vision)
Single GPU capable, 128K context
InternLM 3: El Nuevo Líder en Modelos Open Source de 8B
Lanzado el 5 de marzo de 2025
8B bilingual (English + Chinese) model with deep thinking mode
Surpasses Llama 3.1 8B and Qwen2.5 7B on reasoning/knowledge tasks
128K context, trained on 4T tokens with 75%+ cost savings
Apache 2.0 license
QwQ-32B: El Nuevo Estándar en Razonamiento de Código y Lógica
Lanzado el 5 de marzo de 2025
Dedicated reasoning model from Qwen team
Strong mathematical and logical reasoning
Apache 2.0 license
OpenAI GPT-4.5: Redefiniendo la IA con Mayor EQ y Precisión
Lanzado el 27 de febrero de 2025
Largest OpenAI model at the time
Focus on EQ, creativity, reduced hallucinations
Claude 3.7 Sonnet: El Nuevo Estándar en Ingeniería de Código
Lanzado el 24 de febrero de 2025
Hybrid reasoning — toggle instant/extended thinking
Best coding model at launch
200K context window, 64K max output
Microsoft Phi-4-Mini: Eficiencia y Potencia en 3.8B
Lanzado el 18 de febrero de 2025
3.8B dense model outperforming 2x-size models (Phi-3.5-mini, Llama 3.2 3B)
128K context, 22 languages, function calling and tool use
Trained on 5T tokens (synthetic + filtered public data + code)
MIT license — smallest Phi model with strong reasoning
xAI Grok 3: Nuevo Líder en Razonamiento AI
Lanzado el 17 de febrero de 2025
Trained on Colossus supercluster (100K GPUs)
Strong reasoning capabilities
DeepSeek R1: El Modelo de Razonamiento que Desafiaba a OpenAI
Lanzado el 20 de enero de 2025
Open-source reasoning model rivaling o1
Pure reinforcement learning approach
Caused global market shockwaves
671B MoE architecture
Mistral Small 3.0: El Nuevo Estándar Abierto para IA en 2025
Lanzado el 15 de enero de 2025
Refreshed Small with state-of-the-art performance
Apache 2.0 license
OLMo 2 de Allen AI: Transparencia Total y Rendimiento Superior
Lanzado el 6 de enero de 2025
Truly open: weights + training data + training code + evaluation all released
7B and 13B sizes — 7B competitive with Llama 3.1 8B, 13B with Gemma 2 9B
Trained on 4T–5T tokens, 9-point MMLU increase over OLMo 1
Apache 2.0 license
2024
DeepSeek V3: El Hito Open-Source de 671B Parámetros
Lanzado el 26 de diciembre de 2024
671B MoE trained for $5.5M — matches GPT-4o/Claude 3.5 Sonnet
Revolutionized cost efficiency
Open-source on GitHub and HuggingFace
Strong coding and mathematical reasoning
Falcon 3 de TII: El Nuevo Estándar Open Source para Razonamiento y Multimodalidad
Lanzado el 17 de diciembre de 2024
1B/3B/7B/10B sizes
Enhanced multilingual and multimodal
Apache 2.0 license
Microsoft Phi-4: El Modelo de 14B que Desafía a los Gigantes en Razonamiento
Lanzado el 12 de diciembre de 2024
14B excelling at STEM reasoning
Outperforms much larger models on math
Gemini 2.0 Flash: El Nuevo Estándar en IA Multimodal y Agéntica
Lanzado el 11 de diciembre de 2024
Google's model for the agentic era with native image and audio generation
Outperforms Gemini 1.5 Pro at twice the speed
Native tool use including Google Search and code execution
Foundation for Project Astra and Project Mariner
Meta Llama 3.3: Eficiencia Extrema con 70B parámetros
Lanzado el 6 de diciembre de 2024
70B matching Llama 3.1 405B performance
Massive efficiency gain
OpenAI o1-pro: El Nuevo Estándar en Modelos de Razonamiento
Lanzado el 5 de diciembre de 2024
Enhanced reasoning with more compute for complex tasks
Available in ChatGPT Pro tier
Amazon Nova: El Nuevo Estándar en Modelos de Lenguaje para AWS
Lanzado el 3 de diciembre de 2024
Foundation model family: Micro/Lite/Pro/Premier
Multimodal, optimized for AWS Bedrock
Qwen2.5-Coder: El Nuevo Estándar en Modelos de Código Abiertos
Lanzado el 22 de noviembre de 2024
Code-specialized model in 6 sizes: 0.5B, 1.5B, 3B, 7B, 14B, 32B
32B variant matches GPT-4o coding ability — state-of-the-art open code LLM
Trained on 5.5T tokens (source code + text-code grounding + synthetic)
300+ programming languages, 128K context with YaRN extension
Apache 2.0 license
Pixtral Large: El Nuevo Gigante Multimodal de Mistral AI
Lanzado el 17 de noviembre de 2024
Mistral's large multimodal model
128K context, native image understanding at scale
Open weights
Tencent Lanza Hunyuan-Large: El Nuevo Líder Open Source
Lanzado el 5 de noviembre de 2024
Largest open-source Transformer-based MoE model at release
389B total parameters with 52B active per token
256K context window
Outperforms Llama 3.1 405B on benchmarks
Claude Haiku 3.5: Velocidad y Costo para Devs
Lanzado el 22 de octubre de 2024
Fast and cost-effective model
200K token context window, 8K max output
Multilingual and vision capabilities
$0.80/M input, $4/M output
Ideal for high-volume tasks like chatbots and moderation
Yi-Lightning: El Nuevo Modelo Propietario de 01.AI Desafia a los Gigantes
Lanzado el 16 de octubre de 2024
Ranked #6 on LMSYS Chatbot Arena at launch — #1 in China
Surpassed GPT-4o-0513 and Claude 3.5 Sonnet in overall ranking
Top-3 in Chinese, Math, Coding, and Hard Prompts categories
Founded by Kai-Fu Lee, proprietary model
Meta Llama 3.2: El Nuevo Estándar Multimodal para Desarrolladores
Lanzado el 25 de septiembre de 2024
First Llama models with vision capabilities — 11B and 90B multimodal variants
Lightweight 1B and 3B edge models for on-device deployment
128K context window, competitive with Claude 3 Haiku and GPT-4o-mini
Drop-in replacements for Llama 3.1 text models
Qwen2.5: El Nuevo Líder Abierto de Alibaba para Desarrollo de IA
Lanzado el 19 de septiembre de 2024
0.5B to 72B range
SOTA open model for coding and math
18T training tokens
Apache 2.0 license
Mistral Small 2409: El Nuevo Estándar Open Source de 22B
Lanzado el 18 de septiembre de 2024
Updated Mistral Small with improved instruction following
22B parameters, Apache 2.0 license
Pixtral 12B: Revolución Multimodal con Visión Nativa
Lanzado el 17 de septiembre de 2024
Built on NeMo architecture with native vision support
128K context, Apache 2.0 license
OpenAI o1-preview: El Nuevo Estándar de Razonamiento para IA
Lanzado el 12 de septiembre de 2024
First 'reasoning' model with chain-of-thought at inference
PhD-level science and math performance
DeepSeek V2.5: El Nuevo Gigante Open Source que Combina Coder y Chat
Lanzado el 5 de septiembre de 2024
Merged DeepSeek-V2-Chat and DeepSeek-Coder-V2 into a single model
236B MoE with 21B active parameters, 128K context
Strong coding and general capabilities in one model
MIT license, available on HuggingFace
Jamba 1.5: La Revolución del Híbrido Mamba-Transformer de AI21 Labs
Lanzado el 22 de agosto de 2024
Mamba-Transformer hybrid MoE
94B active, 256K context
Fastest long-context model at release
Microsoft Phi-3.5: El Nuevo Estándar en Modelos de 4B MoE para Edge
Lanzado el 20 de agosto de 2024
4B MoE and 3.8B variants optimized for edge devices
Phone-capable AI with 128K context window
Improved multilingual support over Phi-3
Strong reasoning for its size class
Grok-2 de xAI: Análisis Técnico y Comparativa
Lanzado el 13 de agosto de 2024
Competitive with GPT-4o and Claude 3.5 Sonnet
Available on X platform
HyperCLOVA X: El Nuevo LLM de Naver Optimizado para Asia
Lanzado el 7 de agosto de 2024
Korean web giant Naver's flagship LLM optimized for Korean language and culture
Two sizes: HCX-L (largest) and HCX-S (lighter), built on LLaMA 2 architecture
100K context window with Korean-optimized tokenizer
Strong cross-lingual reasoning in Asian languages — Korean, Japanese, Chinese
FLUX.1: El Nuevo Estándar de Generación de Imágenes Abiertas
Lanzado el 1 de agosto de 2024
State-of-the-art text-to-image model from ex-Stability AI founders
12B rectified flow transformer architecture
FLUX.1 [schnell] open under Apache 2.0, [dev] non-commercial
Surpassed closed-source alternatives in image quality
Mistral Large 2: El Nuevo Gigante Abierto de Mistral AI
Lanzado el 24 de julio de 2024
128K context, competitive with GPT-4o and Llama 3.1 405B
12 languages supported
Open weights
Llama 3.1: El Modelo Abierto de 405B Parámetros que Desafía a GPT-4
Lanzado el 23 de julio de 2024
Largest open model — 405B parameters
Matches GPT-4 on many benchmarks
128K context window
Mistral NeMo 12B: Análisis Técnico y Guía de Implementación
Lanzado el 18 de julio de 2024
Co-built with NVIDIA, runs on a single GPU
12B parameters with 128K context window
Drop-in replacement for Mistral 7B with SOTA performance in its class
Apache 2.0 license, strong multilingual support
InternLM 2.5: El Nuevo Estándar en Razonamiento Open-Source
Lanzado el 3 de julio de 2024
Strong reasoning from China's national lab
Competitive on math and coding
Gemma 2 de Google DeepMind: El Nuevo Estándar de IA Abierta
Lanzado el 27 de junio de 2024
9B and 27B sizes
Outperforms models 2x its size
Knowledge distillation from Gemini
Claude 3.5 Sonnet: El Nuevo Estándar en IA para Desarrolladores
Lanzado el 20 de junio de 2024
Surpassed GPT-4o and Gemini 1.5 Pro at launch
2x faster than Claude 3 Opus at lower cost
DeepSeek Coder V2: El Nuevo Estándar Abierto en Ingeniería de Código
Lanzado el 17 de junio de 2024
First open MoE code model matching GPT-4 Turbo on coding
338 programming languages supported
NVIDIA Nemotron-4 340B: El Nuevo Estándar de IA Abierta para Empresas
Lanzado el 14 de junio de 2024
NVIDIA's open model for synthetic data generation
Permissive enterprise license
Qwen2: El Nuevo Gigante Open Source de 72B de Alibaba Cloud
Lanzado el 7 de junio de 2024
Major upgrade, 0.5B to 72B range
Competitive with Llama 3 70B
Apache 2.0 license
GLM-4: El modelo open-source de 9B que desafía a Llama 3
Lanzado el 5 de junio de 2024
128K context, 26 languages
Competitive with Llama 3 8B
Open-source GLM-4 series
Codestral: El Nuevo Modelo de Código de Mistral AI (22B)
Lanzado el 29 de mayo de 2024
Specialized code model, 80+ languages
32K context, fill-in-the-middle support
Doubao de ByteDance: El Nuevo Líder Open Source en IA
Lanzado el 15 de mayo de 2024
ByteDance's flagship LLM, most popular AI product in China
Available via Doubao app and Volcano Engine API
Supports 50+ application scenarios including voice, vision, and coding
Open-source Seed 1.5 variants released under permissive license
GPT-4o: El Futuro del Procesamiento Multimodal en IA
Lanzado el 13 de mayo de 2024
'Omni' model with native audio/vision/text
2x faster, 50% cheaper than GPT-4 Turbo
Real-time voice conversation capabilities
DeepSeek V2: El Nuevo Estándar en Modelos Open Source de Alta Eficiencia
Lanzado el 7 de mayo de 2024
236B MoE with only 21B active parameters
Multi-head Latent Attention for efficiency
Open weights
Snowflake Arctic: El Modelo Open-Source Empresarial Definitivo
Lanzado el 24 de abril de 2024
480B MoE with 17B active parameters
Enterprise-focused, strong on SQL and coding
Apache 2.0 license
Phi-3 de Microsoft: El Modelo Open Source que Rompe los Límites del Móvil
Lanzado el 23 de abril de 2024
Mini/Small/Medium variants
Phi-3 Mini (3.8B) rivals Mixtral 8x7B
Phone-capable AI
Llama 3 de Meta: El Nuevo Estándar en IA Abierta
Lanzado el 18 de abril de 2024
Trained on 15T tokens, 8B and 70B sizes
New open-source SOTA with massive community adoption
Mixtral 8x22B: El modelo MoE de 176B que revoluciona el rendimiento multilingüe y código
Lanzado el 17 de abril de 2024
Large MoE with strong multilingual and code performance
Open weights
Command R+: El modelo de lenguaje de 104B parámetros de Cohere optimizado para RAG empresarial
Lanzado el 4 de abril de 2024
Optimized for RAG and enterprise
128K context, 10 languages
Grounded generation capabilities
Jamba 52B: El Revolucionario Modelo Híbrido Mamba-Transformer de Código Abierto de AI21 Labs
Lanzado el 28 de marzo de 2024
First production Mamba-Transformer hybrid
256K context, novel SSM architecture
DBRX de Databricks: El modelo open source de 132B que supera a Llama 2 y Mixtral
Lanzado el 27 de marzo de 2024
Open MoE with 36B active parameters
Outperformed Llama 2 70B and Mixtral
Apache 2.0 license
Grok-1: El Primer Modelo de Código Abierto de xAI con 314B MoE
Lanzado el 17 de marzo de 2024
xAI's first open-source model
314B MoE under Apache 2.0
Largest open MoE at time of release
Claude 3 de Anthropic: El Lanzamiento Histórico que Desafía a GPT-4
Lanzado el 4 de marzo de 2024
Haiku/Sonnet/Opus family
Opus matched GPT-4 on most benchmarks
200K context window, vision capabilities
Claude Opus 3: El modelo de razonamiento revolucionario de Anthropic
Lanzado el 4 de marzo de 2024
First Claude Opus model with advanced reasoning
200K context window
Pioneered extended thinking capabilities
Vision and tool use support
Mistral Large: El modelo comercial insignia de Mistral AI con razonamiento de élite
Lanzado el 26 de febrero de 2024
Mistral's first flagship commercial model
32K context, top-tier reasoning
Google DeepMind Lanza Gemma: El Modelo de Código Abierto que Revoluciona la IA Local
Lanzado el 21 de febrero de 2024
Google's open-source model from Gemini research
2B and 7B sizes, strong for its class
Gemini 1.5 Pro: El revolucionario modelo multimodal con ventana de contexto de 1 millón de tokens
Lanzado el 15 de febrero de 2024
1 million token context window — 10x previous record
MoE architecture, processes entire codebases
Gemini 1.0 Ultra: El modelo multimodal más potente de Google supera a GPT-4 en la mayoría de benchmarks
Lanzado el 8 de febrero de 2024
Most capable Gemini 1.0 model
Beat GPT-4 on 30/32 benchmarks
Powers Gemini Advanced
StableLM 2: El modelo de lenguaje abierto de Stability AI que desafía a los gigantes con 1.6B y 12B de parámetros
Lanzado el 6 de febrero de 2024
Open language model in two sizes: 1.6B and 12B
Trained on 2T tokens (Falcon RefinedWeb, RedPajama, The Pile, CulturaX)
Competitive with Mistral-7B despite smaller footprint
Stability AI Community License
StarCoder 2: La Revolución de Código Abierto con Tres Tamaños y 600+ Lenguajes
Lanzado el 6 de febrero de 2024
Open code LLM in 3 sizes: 3B, 7B, 15B — trained on 4T+ tokens from The Stack v2
600+ programming languages, fill-in-the-middle capability
16K context with sliding window attention
Trained on permissively licensed code only
2023
SOLAR 10.7B: El modelo de código abierto que revoluciona el rendimiento de IA en Corea
Lanzado el 13 de diciembre de 2023
Korean startup Upstage's open model using depth up-scaling
Topped HuggingFace Open LLM Leaderboard at release
Apache 2.0 license
Mixtral 8x7B de Mistral AI: El Modelo Abierto que Revoluciona la Eficiencia de IA
Lanzado el 11 de diciembre de 2023
Open-source MoE matching GPT-3.5 quality with only 12.9B active params
Game-changer for open-source efficiency
Apache 2.0 license
Gemini 1.0 de Google DeepMind: El revolucionario modelo multimodal que redefine la IA
Lanzado el 6 de diciembre de 2023
Google's multimodal model family (Nano/Pro/Ultra)
Natively multimodal from training
Nous Hermes 2: El modelo de código abierto que revoluciona la IA local
Lanzado el 13 de noviembre de 2023
Community fine-tuned model on Mistral/Yi
Strong at instruction following
Popular for local AI
Yi 34B de 01.AI: El Modelo Bilingüe Abierto que Desafía a Llama 2 70B
Lanzado el 2 de noviembre de 2023
Founded by Kai-Fu Lee
Strong bilingual (English/Chinese) model
Competitive with Llama 2 70B
ChatGLM3-6B: El modelo de código abierto que revoluciona la IA conversacional
Lanzado el 27 de octubre de 2023
Third gen GLM with function calling, code interpreter, and agent capabilities
Zephyr 7B: El modelo de código abierto que supera a modelos más grandes con DPO
Lanzado el 25 de octubre de 2023
Mistral 7B fine-tuned with DPO
Showed distilled alignment can match RLHF quality
Mistral 7B: El Modelo de Código Abierto que Revolucionó la IA en 2023
Lanzado el 27 de septiembre de 2023
Outperformed Llama 2 70B on all benchmarks despite being smaller
Sliding window attention
Apache 2.0 license
Qwen 72B: El modelo de código abierto de Alibaba con 72 mil millones de parámetros que desafía a los líderes del mercado
Lanzado el 25 de septiembre de 2023
Alibaba's multilingual model series
Strong on Chinese and English tasks
Open weights
WizardCoder 34B: El modelo de código de código abierto que supera a ChatGPT en benchmarks
Lanzado el 26 de agosto de 2023
Evol-Instruct tuned Code Llama
Top open-source coding model of its era
Strong on HumanEval
Code Llama 34B: El modelo de código abierto de Meta que revoluciona la programación asistida por IA
Lanzado el 24 de agosto de 2023
Specialized Llama 2 for code generation
Supports Python, C++, Java, and more
100K context window
Llama 2: El modelo de código abierto que revolucionó la IA comercial
Lanzado el 18 de julio de 2023
First truly open-weight large model for commercial use
7B/13B/70B sizes with RLHF-tuned chat variants
Founded the modern open LLM ecosystem
Claude 2 de Anthropic: El modelo de lenguaje que revoluciona el contexto y la seguridad
Lanzado el 11 de julio de 2023
200K context window
Constitutional AI approach
Strong coding and analysis capabilities
ChatGLM2: El modelo de código abierto de 6B parámetros que revoluciona el procesamiento de lenguaje natural
Lanzado el 25 de junio de 2023
Second generation GLM, 32K context
42% faster inference
Stronger math and coding
Falcon 180B: El modelo de código abierto de 180 mil millones de parámetros que revoluciona el ranking de LLMs
Lanzado el 25 de mayo de 2023
Trained on 3.5T tokens of RefinedWeb
Topped the Open LLM Leaderboard
Apache 2.0 license
PaLM 2: El modelo de lenguaje de próxima generación de Google que impulsa Bard y Gemini
Lanzado el 10 de mayo de 2023
Google's next-gen model powering Bard/Gemini
Improved multilingual, reasoning, and coding
MPT-7B: El modelo de código abierto comercialmente viable que revoluciona la IA
Lanzado el 5 de mayo de 2023
Commercially usable open-source model
Trained on 1T tokens
Apache 2.0 license
StarCoder: El modelo de código abierto de 15.5B que revoluciona la generación de código
Lanzado el 4 de mayo de 2023
Open-source code LLM trained on The Stack (1T tokens, 80+ languages)
8K context window
StableLM: La Revolución de los Modelos de Lenguaje Abiertos de Stability AI
Lanzado el 19 de abril de 2023
Stability AI's open-source LLM family
3B and 7B sizes, trained on 1.5T tokens
CC-BY-SA license
Vicuna de LMSYS: El modelo de código abierto que logra el 90% del rendimiento de ChatGPT
Lanzado el 30 de marzo de 2023
Fine-tuned LLaMA on ShareGPT conversations
Achieved ~90% of ChatGPT quality
Launched the Chatbot Arena
Claude 1 de Anthropic: El Lanzamiento que Revolucionó la IA Segura
Lanzado el 14 de marzo de 2023
Anthropic's first public model
Constitutional AI for safety
100K context window
GPT-4 de OpenAI: El revolucionario modelo multimodal que cambió la IA
Lanzado el 14 de marzo de 2023
Multimodal (text + vision), passed the bar exam (90th percentile)
Massive leap in reasoning over GPT-3.5
~1.8T parameters (MoE estimated)
Alpaca 7B de Stanford: El Modelo de Código Abierto que Revolucionó el Fine-Tuning de Instrucciones
Lanzado el 13 de marzo de 2023
Fine-tuned LLaMA on 52K instructions generated by GPT-3.5
Showed cheap instruction tuning works
LLaMA 1 de Meta AI: El Revolucionario Modelo Abierto que Cambió Todo
Lanzado el 24 de febrero de 2023
Leaked weights ignited the open-source LLM revolution
Showed small models can match GPT-3
65B parameters
2022
ChatGPT de OpenAI: El modelo que definió la era de la IA conversacional
Lanzado el 30 de noviembre de 2022
GPT-3.5 with RLHF in a chat interface
Reached 100M users in 2 months
Defined the AI era
Flan-T5: El modelo de lenguaje instruccional de Google que revoluciona la transferencia cero
Lanzado el 20 de octubre de 2022
Instruction-tuned T5
Demonstrated instruction tuning dramatically improves task generalization
BLOOM: El modelo de lenguaje multilingüe de 176 mil millones de parámetros que revolucionó el mundo del AI abierto
Lanzado el 6 de julio de 2022
First 100B+ open-source multilingual model
Built by 1000+ researchers across 70+ countries
46 languages supported
OPT 175B: El Modelo de Código Abierto de Meta que Retó a GPT-3
Lanzado el 3 de mayo de 2022
Meta's open-source GPT-3 equivalent
Full model weights released for research
175B parameters
GPT-NeoX 20B: El modelo de código abierto que revolucionó la IA generativa en 2022
Lanzado el 14 de abril de 2022
EleutherAI's 20B open model
First glimpse that local LLMs could scale to GPT-3 territory
Predecessor to today open-source ecosystem
PaLM 540B: El modelo de lenguaje de Google que revolucionó el razonamiento y la codificación
Lanzado el 4 de abril de 2022
540B parameter model
Breakthrough capabilities in reasoning, code, and multilingual tasks
Chinchilla de Google DeepMind: El modelo que revolucionó las leyes de escalado de LLM
Lanzado el 29 de marzo de 2022
Proved smaller models trained on more data outperform larger undertrained ones
Redefined scaling laws for LLMs
InstructGPT: El modelo que revolucionó la alineación de IA con instrucciones humanas
Lanzado el 27 de enero de 2022
Introduced RLHF for alignment
Pioneered training models to follow human instructions safely
2021
Gopher de Google DeepMind: El modelo de lenguaje de 280 mil millones de parámetros que revolucionó la IA
Lanzado el 8 de diciembre de 2021
280B parameter model
Extensive analysis of scaling laws across 152 tasks
OpenAI Codex: El modelo de código que revolucionó la programación asistida por IA
Lanzado el 10 de agosto de 2021
GPT-3 fine-tuned on code
Powered GitHub Copilot
Proved LLMs could write functional programs
GPT-J: El modelo de código abierto que revolucionó la IA accesible en hardware doméstico
Lanzado el 9 de junio de 2021
First open model runnable on consumer hardware
6B params, GPT-2 architecture
Widely deployed in early local AI applications
Switch Transformer de Google: El modelo MoE de 1.6 trillones de parámetros que revolucionó el escalado eficiente
Lanzado el 11 de enero de 2021
1.6 trillion parameter MoE model
Demonstrated efficient scaling through sparse expert routing
2020
GShard: El modelo de lenguaje revolucionario de Google con 600 mil millones de parámetros
Lanzado el 30 de junio de 2020
First Mixture of Experts model at massive scale
600B parameters for machine translation
GPT-3 de OpenAI: El Modelo que Revolucionó la IA Generativa
Lanzado el 28 de mayo de 2020
175B parameters — demonstrated few-shot learning without fine-tuning
Sparked the modern LLM revolution
2019
T5: El revolucionario modelo de Google que transformó la NLP con su enfoque Text-to-Text
Lanzado el 23 de octubre de 2019
Text-to-Text Transfer Transformer
Unified framework treating all NLP tasks as text generation
RoBERTa: El modelo de lenguaje revolucionario que demostró que BERT estaba subentrenado
Lanzado el 26 de julio de 2019
Robustly Optimized BERT
Showed BERT was significantly undertrained
Achieved new SOTA with better training
XLNet: El modelo de lenguaje revolucionario que superó a BERT en 20 tareas
Lanzado el 19 de junio de 2019
Generalized autoregressive pretraining
Outperformed BERT on 20 NLP tasks
GPT-2: El modelo que revolucionó la IA y fue considerado 'demasiado peligroso' para su lanzamiento
Lanzado el 14 de febrero de 2019
Initially withheld due to misuse concerns — "Too dangerous to release"
Showed emergent text generation quality at scale
2018
BERT de Google: El modelo que revolucionó el procesamiento del lenguaje natural en 2018
Lanzado el 11 de octubre de 2018
Bidirectional Encoder Representations from Transformers
Revolutionized NLP benchmarks
Became the foundation for search engines
GPT-1: El Pionero que Revolucionó el Procesamiento del Lenguaje Natural
Lanzado el 11 de junio de 2018
First GPT model — decoder-only transformer
Demonstrated generative pre-training for language understanding
ELMo: El modelo revolucionario de embeddings contextualizados de Allen AI
Lanzado el 15 de febrero de 2018
Embeddings from Language Models
Contextualized word representations using bidirectional LSTMs
2017
Transformer de Google: El modelo que revolucionó la IA y sentó las bases de todos los LLM modernos
Lanzado el 12 de junio de 2017
'Attention Is All You Need' paper introduces the Transformer architecture
The foundation of all modern LLMs