Skip to content

Timeline de Lanzamientos de Modelos IA

Una timeline cronológica de los principales lanzamientos de modelos IA

2017201820192020202120222023202420252026
Baidu
xAI
Mistral AI
NVIDIA
poolside
DeepSeek
OpenAI
Xiaomi
Qwen
Moonshot AI
Anthropic
Zhipu AI
Google DeepMind
Alibaba Cloud
MiniMax

2026

Baidulanguage modelMoE (compressed to ~1/3 total params, ~1/2 active params of ERNIE-5.0)Cerrado

ERNIE-5.1-Preview: El Nuevo Líder en Eficiencia de Baidu

Lanzado el 9 de mayo de 2026

Tops LMArena Search leaderboard as #4 globally and #1 among Chinese models with a score of 1,223

Math: #9 globally on LMArena category leaderboards

Legal & Government: #1 globally on LMArena category leaderboards

Business, Management & Financial Ops: #4 globally on LMArena category leaderboards

Software & IT Services: #7 globally on LMArena category leaderboards

Compresses total parameters to approximately 1/3 and active parameters to approximately 1/2 of ERNIE-5.0

Achieves leading performance using only about 6% of the pre-training cost of comparable models

Powered by decoupled fully-asynchronous reinforcement learning infrastructure built on PaddlePaddle

Uses scaled agentic post-training with Multi-Teacher On-Policy Distillation (MOPD)

Scores 99.6 on AIME26 with tool use, second only to Gemini 3.1 Pro

Surpasses DeepSeek-V4-Pro on tau-cubed-bench and SpreadsheetBench-Verified agent evaluation tasks

Four-stage post-training pipeline: SFT, Domain Expert Model Training, On-Policy Distillation, and General Online RL

Based on Once-For-All elastic training framework with elastic depth, width, and sparsity dimensions

Rolling out on 10+ creative production agent platforms including ISEKAI ZERO and Mulan AI

Creative writing capabilities approach those of Gemini 3.1 Pro

xAIreasoningCerrado

xAI Grok 4.3: Nuevo Modelo de Razonamiento Agéntico

Lanzado el 30 de abril de 2026

Reasoning model from xAI with configurable effort levels (none/low/medium/high, default low)

Accepts text and image inputs with text output

Suited for agentic workflows, instruction-following tasks, and high factual accuracy applications

1 million token context window with no output token limit

Well-suited for long-document analysis, deep research, and multi-step agentic tasks

Tiered pricing: requests exceeding 200k total tokens are billed at a higher rate

Mistral AIopen source128B denseHito

Mistral Medium 3.5: La Revolución del Open Source en 2026

Lanzado el 29 de abril de 2026

New flagship model merging instruction-following, reasoning, and coding into a single 128B dense architecture

Released as open weights under a modified MIT license

Runs self-hosted on as few as four GPUs

API pricing at $1.50/mtok input and $7.50/mtok output

Powers the new Mistral Vibe remote agents for async cloud coding sessions

Drives Work mode in Le Chat for multi-step agentic task execution with parallel tool calling

Sessions can be spawned from CLI or Le Chat, and local CLI sessions can be teleported to the cloud

NVIDIAmultimodal30B-A3B (MoE)Código Abierto

NVIDIA Nemotron 3 Nano Omni: El Futuro de los Agentes Multimodales

Lanzado el 28 de abril de 2026

Multimodal model unifying video, audio, image, and text understanding in a single architecture

Hybrid Mixture-of-Experts (MoE) 30B-A3B architecture with 30B total and 3B active parameters

Up to 9x higher throughput compared to similar open omnimodal models

256K unified context window with single-pass perception

Hybrid architecture combining Mamba layers for memory efficiency and transformers for precise reasoning

Integrates vision encoders (C3D for video) and audio encoders (Paraquet), eliminating need for separate models

Supports FP8/NVFP4 quantization with optimized inference on NVIDIA Ampere, Hopper, and Blackwell GPUs

Designed for enterprise multimodal agents: document intelligence (OCR, tables), GUI navigation, audio-video reasoning

Runs locally with 25-36GB RAM in 4/8-bit quantization via Unsloth or vLLM

Available on Hugging Face, Ollama, OpenRouter, and NVIDIA NIM

poolsidecoding model225B total (MoE), 23B activated per tokenCerradoHito

Laguna-M.1: El Nuevo Estándar en Modelado de Código

Lanzado el 28 de abril de 2026

225B total parameter Mixture-of-Experts model with 23B activated parameters per token

Poolside most capable model to date, completed pre-training at end of 2025

Trained from scratch on 30T tokens using Muon optimizer

Trained on 6,144 interconnected NVIDIA Hopper GPUs entirely in-house

Achieves 72.5% on SWE-bench Verified, 67.3% on SWE-bench Multilingual, 46.9% on SWE-bench Pro, 40.7% on Terminal-Bench 2.0

128K context window with up to 8K output tokens

Agentic coding model built for long-horizon software engineering tasks

Foundation for the entire Laguna model family

Uses custom async on-policy RL system with Agent Client Protocol (ACP) server

Free to use for a limited time via poolside API and OpenRouter

Weights available on request for startups, institutions, and universities

poolsidecoding model33B total (MoE), 3B activated per tokenCódigo AbiertoHito

Laguna-XS.2: El Nuevo Estándar en Modelos de Código Abierto

Lanzado el 28 de abril de 2026

33B total parameter Mixture-of-Experts model with 3B activated parameters per token

First open-weight release from poolside, licensed under Apache 2.0

Trained on 30T tokens using Muon optimizer

Supports native reasoning with interleaved thinking between tool calls

Uses Sliding Window Attention with per-head gating in 30 of 40 layers

KV cache quantized to FP8 for reduced memory per token

Compact enough to run locally on a Mac with 36 GB RAM

128K context window with up to 8K output tokens

Achieves 68.2% on SWE-bench Verified, 62.4% on SWE-bench Multilingual, 44.5% on SWE-bench Pro, 30.1% on Terminal-Bench 2.0

Supports vLLM, Transformers, TRT-LLM, and Ollama

Agentic coding model built for long-horizon software engineering tasks

Free to use for a limited time via poolside API and OpenRouter

DeepSeekopen sourceV4-Pro: 1.6T total / 49B active (MoE) | V4-Flash: 284B total / 13B active (MoE)Hito

DeepSeek-V4: El Nuevo Estándar en Modelos Abiertos de IA (2026)

Lanzado el 24 de abril de 2026

Deux modèles : DeepSeek-V4-Pro (1.6T total / 49B active params) et DeepSeek-V4-Flash (284B total / 13B active params)

Context length de 1M tokens, output max de 384K tokens

Support thinking mode (par défaut) et non-thinking mode

Pricing ultra-agressif : Flash à $0.14/M input tokens (cache miss), $0.028/M (cache hit), $0.28/M output — soit ~7x moins cher que Claude Opus 4.7

Pro à $1.74/M input tokens (cache miss), $0.145/M (cache hit), $3.48/M output

Modèles open-source, poids disponibles sur HuggingFace

Compatible format API OpenAI et Anthropic (https://api.deepseek.com et https://api.deepseek.com/anthropic)

Support JSON output, Tool Calls, Chat Prefix Completion (Beta), FIM Completion (Beta)

Performance rivalisant avec les meilleurs modèles closed-source mondiaux

OpenAIlanguage modelUndisclosed (frontier model)CerradoHito

GPT-5.5: La Nueva Era de la Inteligencia Artificial de OpenAI

Lanzado el 23 de abril de 2026

GPT-5.5 is OpenAI smartest and most intuitive to use model yet, described as the next step toward a new way of getting work done on a computer

Achieves 82.7% on Terminal-Bench 2.0, 73.1% on Expert-SWE (Internal), and 84.9% on GDPval — all state-of-the-art scores

Matches GPT-5.4 per-token latency while performing at a much higher level of intelligence

Significantly more token efficient — uses fewer tokens to complete the same tasks compared to GPT-5.4

Scores 78.7% on OSWorld-Verified for real computer environment operation and 81.8% on CyberGym

GPT-5.5 Pro achieves 90.1% on BrowseComp and 52.4% on FrontierMath Tier 1-3

On SWE-Bench Pro, reaches 58.6% solving more tasks end-to-end in a single pass than previous models

Proactively deployed with industry-leading cybersecurity safeguards, classified as High under OpenAI Preparedness Framework

Helped discover a new proof about Ramsey numbers in combinatorics, later verified in Lean

Scores 25.0% on GeneBench for multi-stage scientific data analysis in genetics

API pricing: $5/1M input tokens and $30/1M output tokens with 1M context window

GPT-5.5 Pro API pricing: $30/1M input tokens and $180/1M output tokens

Co-designed, trained with, and served on NVIDIA GB200 and GB300 NVL72 systems

Rolling out to Plus, Pro, Business, and Enterprise users in ChatGPT and Codex

GPT-5.5 Thinking unlocks faster help for harder problems with smarter, more concise answers

Outperforms Claude Opus 4.7 and Gemini 3.1 Pro on most coding and professional benchmarks

More than 85% of OpenAI now uses Codex every week across all company functions

Xiaomilanguage model1T+ total (42B active, MoE)CerradoHito

Xiaomi MiMo-V2.5-Pro: El Nuevo Estándar de IA con 1 Trillón de Parámetros

Lanzado el 22 de abril de 2026

Multimodal Mixture-of-Experts (MoE) architecture with 1T+ total parameters (42B active)

Extended context window up to 1M tokens

Native multimodal perception supporting text, images, video, and audio

Advanced autonomous agent capabilities handling 1000+ tool calls

40-60% better token efficiency compared to Claude Opus and GPT-5.x

ClawEval benchmark: 64% Pass@3 score

SWE-bench Pro: 57.2% task resolution rate

Surpasses Claude 4.6 Sonnet in coding tasks, approaches Claude Opus in agentic performance

Part of the MiMo-V2.5 family alongside MiMo-V2.5 and MiMo-V2.5-TTS

Available via mimo.mi.com with affordable token plans (monthly/annual subscriptions)

Qwenlanguage model27BCódigo AbiertoHito

Qwen3.6-27B: El Nuevo Estándar en IA Abierta y Código

Lanzado el 22 de abril de 2026

27B dense open-source model with Apache 2.0 license

Surpasses Qwen3.5-397B-A17B on all major agentic coding benchmarks

SWE-bench Verified: 77.2 vs 76.2, Terminal-Bench 2.0: 59.3 vs 52.5, SkillsBench: 48.2 vs 30.0

Supports both multimodal thinking and non-thinking modes natively

Native vision-language support for images and video understanding

GPQA Diamond: 87.8, competitive with models several times its size

Compatible with OpenClaw, Claude Code, and Qwen Code coding assistants

Available on Hugging Face, ModelScope, and Alibaba Cloud Model Studio API

Moonshot AIopen sourceopen-weightsHito

Kimi K2.6 de Moonshot AI: El Nuevo Líder Open-Source en Agentes y Código

Lanzado el 20 de abril de 2026

Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python (86.7), Math Vision w/ python (93.2)

Long-horizon coding: 4,000+ tool calls, over 12 hours continuous execution

Generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization)

300 parallel sub-agents x 4,000 steps per run (up from K2.5: 100 / 1,500)

Proactive Agents: powers OpenClaw, Hermes Agent for 24/7 autonomous ops

Claw Groups research preview: bring your own agents, command friends bots & humans in the loop

API PRICING (use these EXACT values): kimi-k2.6 — Input $0.16/M tokens (cache hit), Input $0.95/M tokens (cache miss), Output $4.00/M tokens, Context Window 262,144 tokens

Sources: https://platform.moonshot.ai, https://kimi.com/blog/kimi-k2-6, https://huggingface.co/moonshotai/Kimi-K2.6

Live on kimi.com in chat and agent mode, plus Kimi Code at https://kimi.com/code for production-grade coding

AnthropicreasoningCerradoHito

Claude Opus 4.7: El Nuevo Estándar en Razonamiento y Desarrollo de Software

Lanzado el 16 de abril de 2026

Most capable generally available Anthropic model for complex reasoning and agentic coding

High-resolution image support: 2576px / 3.75MP (up from 1568px / 1.15MP) with 1:1 pixel mapping

New "xhigh" effort level for coding and agentic use cases

Task budgets (beta) — advisory token budget across full agentic loops

128K max output tokens, 1M context window at standard pricing

+12 points on CursorBench coding benchmarks vs Opus 4.6

New tokenizer (up to ~35% more tokens per text, improved performance)

Adaptive thinking only — extended thinking budgets removed

Sampling parameters (temperature, top_p, top_k) removed

Pricing: $5/$25 per MTok input/output, batch $2.50/$12.50 per MTok

Zhipu AIreasoning744B MoE (40B active)Código AbiertoHito

GLM-5.1: El Nuevo Estándar de Reasoning Abierto Fuente

Lanzado el 7 de abril de 2026

#1 on SWE-Bench Pro (58.4%), beating GPT-5.4 and Claude Opus 4.6

Post-training upgrade to GLM-5 — same 744B MoE architecture (40B active)

Trained entirely on Huawei Ascend chips — no NVIDIA hardware

MIT license, compatible with Claude Code and OpenClaw

202K context window, strong on cybersecurity (CyberGym 68.7%)

Anthropiclanguage modelCerrado

Claude Opus 4.6 Fast: Análisis Técnico y Despliegue

Lanzado el 7 de abril de 2026

Faster variant of Claude Opus 4.6 with comparable intelligence

AnthropicreasoningCerradoHito

Claude Mythos Preview: El Nuevo Límite de la IA de Anthropic

Lanzado el 7 de abril de 2026

New Capybara tier above Opus — the most powerful Anthropic model

93.9% on SWE-bench Verified, 77.8% on SWE-bench Pro

97.6% on USAMO 2026, 94.5% on GPQA Diamond

1M context window, limited preview for ~50 partner organizations

Google DeepMindopen source31BHito

Google DeepMind lanza Gemma 4: El Futuro del Open Source en IA

Lanzado el 2 de abril de 2026

Google's most capable open models, built from Gemini 3 research

Four sizes: E2B, E4B, 26B MoE (3.8B active), 31B Dense

First Gemma release under Apache 2.0 license

Native multimodal, 140+ languages, up to 256K context

Agent-ready with function calling and structured JSON output

Zhipu AImultimodalCerrado

GLM-5V Turbo de Zhipu AI: El Nuevo Estándar en Modelos Multimodales para Agentes

Lanzado el 1 de abril de 2026

Vision + Code model from Z.ai

Multimodal coding capabilities

API only

Alibaba Cloudlanguage modelCerrado

Qwen 3.6 Plus: El Nuevo Estándar en Razonamiento Agente y Código

Lanzado el 31 de marzo de 2026

1M token context window with always-on chain-of-thought reasoning

78.8% on SWE-bench Verified — competitive with Claude Opus 4.6

2-3x faster output speed than Claude Opus 4.6

Free preview via OpenRouter, successor to Qwen 3.5

Mistral AImultimodalCódigo Abierto

Mistral AI presenta Voxtral TTS: El modelo de voz abierto que desafía a ElevenLabs

Lanzado el 23 de marzo de 2026

Mistral's first audio model — direct competitor to ElevenLabs

Zero-shot voice cloning with multilingual support

Real-time streaming capabilities

Open weights under CC BY-NC 4.0 (non-commercial)

Xiaomireasoning309B MoECódigo Abierto

Xiaomi MiMo-V2-Pro: El Nuevo Estándar en Razonamiento IA Open Source

Lanzado el 18 de marzo de 2026

Xiaomi reasoning model with strong math and code performance

309B MoE architecture

MiniMaxcoding model230B MoE (10B active)Código Abierto

MiniMax M2.7: El Modelo de Autoevolución que Rivaliza con GPT-5

Lanzado el 18 de marzo de 2026

Self-evolving agent model — first to participate in its own development

56.22% on SWE-Pro, matching GPT-5.3-Codex

57.0% on Terminal Bench 2, GDPval-AA ELO 1495 (highest open-source)

230B MoE (10B active), 200K context, open weights on HuggingFace

Agent Teams for native multi-agent collaboration

OpenAIlanguage modelCerrado

OpenAI GPT-5.4 Mini: Eficiencia y Uso Nativo de Computadora

Lanzado el 17 de marzo de 2026

Efficient variant of GPT-5.4 with native computer use

Lower cost while maintaining strong reasoning capabilities

Mistral AIcoding model119B MoE (6.5B active)Código Abierto

Leanstral Mistral: Primer Agente Open Source para Lean 4

Lanzado el 16 de marzo de 2026

First open-source code agent for Lean 4 formal proof engineering

Generates code AND machine-checkable mathematical proofs

119B MoE with 6.5B active, outperforms Claude Sonnet 4.6 on FLTEval

Apache 2.0 license, 15x cheaper than Claude Opus for formal verification

Mistral AIopen source119B MoE (6.5B active)

Mistral Small 4: El Nuevo Estándar Open Source de 2026

Lanzado el 16 de marzo de 2026

Unifies instruct, reasoning, coding, and multimodal in a single model

119B MoE with 6.5B active parameters, 256K context window

Replaces Magistral (reasoning), Pixtral (vision), and Devstral (coding)

Apache 2.0 license, configurable reasoning parameter

xAIlanguage modelCerrado

Grok 4.20: El Nuevo Líder en Agentes y Contexto Masivo

Lanzado el 12 de marzo de 2026

Beta release with parallel agents architecture

500K context window

Iterative improvement via user feedback

NVIDIAopen source120B MoE (12B active)

NVIDIA Nemotron 3 Super: El Nuevo Estándar para Agentes IA Abiertos

Lanzado el 11 de marzo de 2026

Open MoE model from NVIDIA

120B total parameters with 12B active

Strong enterprise performance

OpenAIlanguage modelCerrado

OpenAI GPT-5.4: Análisis Técnico y Lanzamiento 2026

Lanzado el 6 de marzo de 2026

Latest OpenAI flagship with 1M token context window

Available in Standard, Mini, and Nano variants

Supports reasoning effort with 4 effort levels

128K max output tokens

Prompt caching with $0.02-$0.25/M cached read

Google DeepMindlanguage modelCerrado

Gemini 3.1 Flash Lite Preview: El Nuevo Estándar de Eficiencia en 2026

Lanzado el 3 de marzo de 2026

Google's high-efficiency model optimized for high-volume use cases

1M token context window, 65.5K max output

Supports prompt caching, reasoning effort, and reasoning budget

Native tool calling and vision capabilities

Google DeepMindmultimodalCerrado

Gemini 3.1 Pro: La Revolución del Razonamiento Multimodal

Lanzado el 19 de febrero de 2026

Google's latest flagship model

More than doubles reasoning performance over Gemini 3 Pro

Released in preview via Gemini API, AI Studio, and Vertex AI

xAIlanguage modelCerrado

Grok 4.2 de xAI: Análisis Técnico y Despliegue

Lanzado el 17 de febrero de 2026

Beta release with rapid learning architecture — improves weekly via user feedback

256K context window

4-agent parallel reasoning

Medical document analysis added

Anthropiclanguage modelCerrado

Claude Sonnet 4.6: La Nueva Era del Razonamiento y Código en 2026

Lanzado el 17 de febrero de 2026

Most capable Sonnet yet with full upgrade across coding, computer use, long-context reasoning

1M token context window in beta

200K token context window, 64K max output

Supports prompt caching, reasoning effort, and reasoning budget

Native tool calling and vision capabilities

Alibaba Cloudlanguage model397B MoE (17B active)Cerrado

Qwen 3.5: El Nuevo Estándar en IA Agente y MoE Eficiente

Lanzado el 14 de febrero de 2026

Agentic AI model with built-in tools for web search and code execution

1M token context window

Qwen3.5-Plus hosted; open weights planned

MiniMaxcoding model230B MoE (10B active)Código Abierto

MiniMax M2.5: El Nuevo Estándar en Eficiencia y Código Abierto

Lanzado el 12 de febrero de 2026

Frontier MoE model with 80.2% on SWE-Bench Verified

Strong coding and agentic capabilities

230B total parameters, 10B activated per token

DeepSeek AIopen source671B MoE

DeepSeek V3.2: El Nuevo Gigante Open Source que Rivaliza con GPT-5

Lanzado el 12 de febrero de 2026

Major update to the V3 series with 1M token context

671B MoE focused on code generation and reasoning improvements

Open weights on HuggingFace, MIT license

Zhipu AIreasoningCódigo Abierto

GLM-5 de Zhipu AI: El Nuevo Líder en Razonamiento y Agentes Abiertos

Lanzado el 11 de febrero de 2026

China's first public AI company frontier model

Targets complex systems engineering and long-horizon agentic tasks

OpenBMBmultimodal9BCódigo Abierto

MiniCPM-o 4.5: El Nuevo Estándar en IA Multimodal de 9B

Lanzado el 8 de febrero de 2026

On-device multimodal LLM with full-duplex real-time audio, image, video

Built on Qwen3-8B architecture

Gemini 2.5 Flash level performance at only 9B parameters

OpenAIcoding modelCerrado

GPT-5.3-Codex: El Nuevo Estándar en Ingeniería de Software con IA

Lanzado el 5 de febrero de 2026

Most capable agentic coding model from OpenAI

Available via Codex app, CLI, IDE extensions

Optimized for software engineering workflows

AnthropicreasoningCerradoHito

Claude Opus 4.6: El Nuevo Estándar en IA de Razonamiento

Lanzado el 5 de febrero de 2026

Huge leap for agentic planning with parallel subtask execution

Tool and subagent orchestration capabilities

Terminal-Bench record holder

1M token context window, 32K max output

State-of-the-art agentic AI behaviors

StepFunreasoning196B MoE (11B active)Código Abierto

Step-3.5-Flash: Razonamiento de Frontera a Bajo Costo

Lanzado el 1 de febrero de 2026

Open-source sparse MoE with 3-way Multi-Token Prediction

100-350 tok/s generation speed

Frontier reasoning at low cost

Arcee AIopen source400B MoE (13B active)

Arcee AI lanza Trinity Large: El Gigante Abierto de 400B Parámetros

Lanzado el 27 de enero de 2026

400B sparse MoE with only 13B active parameters

Built in the US with open weights

One of the largest open-source foundation models

Apache 2.0 license

Alibaba CloudreasoningCerrado

Qwen3-Max-Thinking: El Nuevo Estándar en Razonamiento Lógico para 2026

Lanzado el 27 de enero de 2026

Top-tier reasoning model with adaptive tool use

Retrieves information and runs code during inference

Rivals leading frontier models

Moonshot AIopen source1T MoE (32B active)

Kimi K2: El Gigante Open Source de 1T Parámetros de Moonshot AI

Lanzado el 20 de enero de 2026

Massive 1T MoE with 32B active parameters

First open-weight model to rank #1 on LMSYS Chatbot Arena

2M token context window, 200+ language support

$0.15/$2.50 per 1M tokens, Modified MIT license

Sarvam AIlanguage model2BCódigo Abierto

Sarvam-2B: El Modelo Soberano de IA India para Desarrolladores

Lanzado el 15 de enero de 2026

India's multilingual LLM — part of sovereign AI initiative

Supports 10+ Indian languages natively

2025

Upstageopen source102B MoE (12B active)

SOLAR 102B: La Revolución Coreana del Open Source

Lanzado el 31 de diciembre de 2025

Korea's answer to open frontier models

102B MoE model with 12B active parameters

Google DeepMindlanguage modelCerrado

Gemini 3 Flash: El Nuevo Estándar de Velocidad y Eficiencia de Google

Lanzado el 17 de diciembre de 2025

Fast frontier-class model rivaling larger models at a fraction of the cost

Default model in the Gemini app

Allen AImultimodal8BCódigo Abierto

Molmo 2: El Nuevo Estándar Multimodal Abierto de Allen AI

Lanzado el 16 de diciembre de 2025

Multimodal model from AI2

Fully open weights, data, and code

Xiaomireasoning309B MoECódigo Abierto

Xiaomi MiMo V2 Flash: El Nuevo Estándar de Razonamiento Abierto

Lanzado el 16 de diciembre de 2025

Xiaomi large reasoning model

309B MoE architecture

Strong on math and code

OpenAIlanguage modelCerradoHito

OpenAI GPT-5.2: El Nuevo Estándar para Ingeniería de IA y Desarrollo

Lanzado el 11 de diciembre de 2025

Improved reasoning and multimodal capabilities over GPT-5.1

Enhanced mental health protections

128K max output tokens

Available on Plus ($20/month), Pro ($200/month), and API

Expert-level performance on 44 knowledge work tasks

Mistral AIcoding model24BCódigo Abierto

Devstral Small 2: El Nuevo Estándar en Modelos de Código Open Source

Lanzado el 9 de diciembre de 2025

Successor to Devstral Small 1, derived from Mistral Small 3.1

Portable coding agent

Apache 2.0 license

Mistral AIcoding model123BCódigo Abierto

Mistral AI lanza Devstral 2: El Nuevo Estándar en Código Open Source

Lanzado el 9 de diciembre de 2025

Next-gen coding model with top SWE-Bench score

Modified MIT license (free unless high revenue)

Mistral AImultimodal14BCódigo Abierto

Ministral 3 14B: El Nuevo Gigante Multimodal de Mistral AI

Lanzado el 2 de diciembre de 2025

Largest Ministral 3 model with vision

Best-in-class text and vision capabilities

Apache 2.0 license

Mistral AIlanguage model8BCódigo Abierto

Ministral 3 8B: El Nuevo Estándar en Modelos Abiertos Multimodales

Lanzado el 2 de diciembre de 2025

Powerful and efficient model with vision

Best-in-class text and vision at this size

Apache 2.0 license

Mistral AIlanguage model3BCódigo Abierto

Ministral 3 3B: Potencia de Borde con Visión y Apache 2.0

Lanzado el 2 de diciembre de 2025

Tiny and efficient edge model with vision

Runs on phones, drones, and laptops

Apache 2.0 license

Amazonlanguage modelCerrado

Amazon Nova 2: El Nuevo Estándar en AWS Bedrock

Lanzado el 2 de diciembre de 2025

Amazon next-gen foundation model

Available via AWS Bedrock

Announced at re:Invent

Mistral AIlanguage model41B active (MoE)Código Abierto

Mistral Large 3: El Nuevo Estándar Abierto en IA (2025)

Lanzado el 2 de diciembre de 2025

Sparse MoE with 41B active parameters

Open weights

Strong reasoning and multilingual capabilities

Zhipu AIcoding modelCódigo Abierto

GLM-4.7 de Zhipu: El Nuevo Líder en Código Abierto y Razonamiento

Lanzado el 1 de diciembre de 2025

Open-weights model topping global coding and reasoning leaderboards

Includes GLM-4.7 Flash variant

Cost-effective compared to Western competitors

MiniMaxcoding model230B MoE (10B active)Código Abierto

MiniMax M2.1: El Nuevo Estándar en Modelos de Código Abiertos

Lanzado el 1 de diciembre de 2025

Fully open-source SOTA coding model

230B params MoE architecture, 10B activated per token

SWE-bench score of 74.0%

92% cheaper than Western alternatives

AnthropicreasoningCerradoHito

Anthropic Lanza Claude Opus 4.5: Nuevo Estándar en Reasoning

Lanzado el 24 de noviembre de 2025

Exceeds Sonnet 4.5 by 4.3% using 48% fewer tokens at max effort

200K token context, 64K max output

Hybrid reasoning with instant or extended thinking

Multimodal: text, image, and audio support

20% accuracy gain, Excel and financial modeling breakthrough

Allen AIopen source32B

Allen AI presenta OLMo 3: Nuevo Estándar Open Source 32B

Lanzado el 20 de noviembre de 2025

Fully open model with weights, data, and training code

From AI2 research lab

Deep Cogitoreasoning671B MoECódigo Abierto

Deep Cogito v2.1: El Nuevo Estándar en Razonamiento Abierto

Lanzado el 19 de noviembre de 2025

Large 671B MoE reasoning model

Strong on complex reasoning tasks

Google DeepMindreasoningCerrado

Gemini 3 Deep Think: El Nuevo Estándar en Razonamiento Avanzado

Lanzado el 18 de noviembre de 2025

Reasoning variant of Gemini 3

Deep chain-of-thought for complex scientific problems

Google DeepMindmultimodalCerradoHito

Gemini 3 Pro: El Nuevo Estándar Multimodal de Google DeepMind

Lanzado el 18 de noviembre de 2025

Over 50% improvement over Gemini 2.5 Pro

Most powerful Google model — replaces 2.5 series

1M token context window

Advanced multimodal: text, image, video, audio, code

OpenAIlanguage modelCerrado

OpenAI lanza GPT-5.1: Más rápido, conversacional y listo para todos

Lanzado el 12 de noviembre de 2025

Family of four models with adaptive reasoning

Faster, more conversational, improved coding

Rolled out to all ChatGPT users

Moonshot AIreasoningCerrado

Kimi K2.5: El Nuevo Líder en Razonamiento de Moonshot AI

Lanzado el 6 de noviembre de 2025

Upgraded Kimi model with thinking and reasoning capabilities

Amazonlanguage modelCerrado

Amazon Nova Premier: El Nuevo Estándar en Modelos Multimodales de AWS

Lanzado el 31 de octubre de 2025

Most capable Amazon model

1M context window

Multimodal capabilities

Teacher for distillation on Bedrock

Yandexlanguage modelCerrado

Alice AI 1.0: El Nuevo Líder Ruso en Grandes Modelos de Lenguaje

Lanzado el 28 de octubre de 2025

First major Russian-developed large language model on the global stage

From Yandex

MiniMaxopen source230B MoE

MiniMax M2: El Nuevo Gigante Open Source de 230B

Lanzado el 23 de octubre de 2025

Upgraded MiniMax model with improved reasoning and generation

Open weights

Zhipu AIlanguage modelCódigo Abierto

GLM-4.6 de Zhipu AI: Soporte Nativo para Chips Chinos y Razonamiento Avanzado

Lanzado el 9 de octubre de 2025

First GLM model with native support for China domestic chips

Cambricon and Moore Threads support

FP8 and Int4 quantization

IBMopen source

IBM Granite 4.0: La Revolución Híbrida Mamba-Transformer Abierta

Lanzado el 2 de octubre de 2025

IBM open enterprise model

Hybrid Mamba-2 Transformer architecture

Apache 2.0 license

Anthropiclanguage modelCerrado

Claude Haiku 4.5: El Nuevo Estándar en Velocidad y Eficiencia de Anthropic

Lanzado el 1 de octubre de 2025

Anthropic's fastest model with near-frontier intelligence

200K token context window, 64K max output

21K+ tokens per second for prompts under 32K tokens

Supports reasoning budget and effort control

Most cost-effective in the Claude family: $1/M input

DeepSeek AIopen source671B MoE

DeepSeek V3.2: El Nuevo Estándar Abierto que Desafía a GPT-5

Lanzado el 29 de septiembre de 2025

Further iteration on V3 series

Enhanced capabilities across all benchmarks

Open weights

Anthropiccoding modelCerrado

Claude Sonnet 4.5: El Nuevo Estándar en Desarrollo de Software

Lanzado el 29 de septiembre de 2025

Anthropic's best model for coding tasks

1M token context window (beta feature)

64K max output tokens

Strong agentic behavior and computer-use skills

Optimized for efficient coding and parallel processing

Alibaba Cloudopen source80B MoE (3B active)

Qwen3-Next: El Nuevo Gigante Open Source de Alibaba Cloud

Lanzado el 10 de septiembre de 2025

Ultra-efficient MoE from Alibaba

80B total, only 3B active parameters

Strong reasoning with minimal compute

Apache 2.0 license

Moonshot AIopen source1T MoE (32B active)Hito

Kimi K2: El Gigante Open Source de 1T Parámetros de Moonshot AI

Lanzado el 4 de septiembre de 2025

Massive 1T MoE model with open weights

Highly competitive with frontier models

Major Chinese AI milestone

32B activated parameters

Cost-effective: ~$0.15/M input, $2.50/M output

Strong coding performance across 32+ languages

xAIlanguage modelCerrado

Grok 4 Fast de xAI: Eficiencia y Velocidad para el Desarrollo en 2025

Lanzado el 1 de septiembre de 2025

98% cost reduction compared to Grok 4 Standard

40% increase in token efficiency

Real-time search integration via X

$0.20/M input, $1.50/M output

Mistral AIreasoning~45BCerrado

Mistral AI Despliega Magistral Medium 1.2: El Nuevo Estándar en Razonamiento Multimodal

Lanzado el 1 de septiembre de 2025

Adds vision to Magistral Medium

Multimodal frontier reasoning

Closed API only

Mistral AIreasoning24BCódigo Abierto

Magistral Small 1.2: El Nuevo Líder en Razonamiento Multimodal

Lanzado el 1 de septiembre de 2025

Adds vision to Magistral Small

Multimodal reasoning model

Apache 2.0 license

NousResearchopen source405B

Hermes 4 405B: La Nueva Era del Razonamiento Abierto

Lanzado el 28 de agosto de 2025

Latest in the Hermes series

Advanced function calling and structured output

Built on Llama 3.1

DeepSeek AIopen source671B MoE

DeepSeek V3.1: El Nuevo Estándar en Modelos Open Source de 671B

Lanzado el 21 de agosto de 2025

Major upgrade to V3 with improved reasoning and coding

Open weights

Mistral AImultimodalCerradoHito

Mistral Medium 3.1: El Nuevo Estándar Multimodal en 2025

Lanzado el 12 de agosto de 2025

Frontier-class multimodal model

Competitive with GPT-4o and Claude 3.5

Strong vision and reasoning capabilities

Zhipu AImultimodal106BCódigo Abierto

GLM-4.5V: El Nuevo Gigante Multimodal de Zhipu AI

Lanzado el 11 de agosto de 2025

Vision-language model from Z.ai

106B parameters with strong multimodal understanding

OpenAIlanguage modelCerradoHito

OpenAI GPT-5: El Salto Histórico a la IA Razonable (2025)

Lanzado el 7 de agosto de 2025

Next-generation flagship with major intelligence leap

400K token context window

Built-in reasoning with 4 effort levels

Multimodal: text, image, and video-based reasoning

Available in Standard, Mini, and Nano variants

OpenAIopen source120BHito

GPT-OSS: El Modelo Abierto de OpenAI que Cambia el Juego

Lanzado el 5 de agosto de 2025

OpenAI's first open-weight models since GPT-2

20B and 120B variants

Historic open-source move from OpenAI

AnthropicreasoningCerrado

Claude Opus 4.1: El Nuevo Líder en Razonamiento para Desarrolladores

Lanzado el 5 de agosto de 2025

Upgrade to Claude 4 with improved coding and instruction following

200K token context window

Extended thinking support

Vision and tool calling capabilities

Anthropiclanguage modelCerrado

Claude 4.5 Sonnet: El Nuevo Estándar en Codificación y Razonamiento

Lanzado el 29 de julio de 2025

Newest Anthropic model with improved creative writing

Enhanced nuance and multi-step reasoning

Zhipu AIlanguage model106B MoECódigo Abierto

GLM-4.5 Air de Zhipu: Eficiencia y Rendimiento en 2025

Lanzado el 28 de julio de 2025

Lightweight variant of GLM-4.5

106B MoE, efficient inference on 8x H20 GPUs

Zhipu AIopen source355B MoE

GLM-4.5: El Nuevo Estándar Open-Source de Zhipu AI (2025)

Lanzado el 28 de julio de 2025

Z.ai flagship open MoE model

355B total parameters

Strong reasoning, coding, and agentic capabilities

Claimed cheaper to run than DeepSeek

xAIlanguage modelCerradoHito

xAI Grok 4: El Nuevo Líder en IA Generativa

Lanzado el 11 de julio de 2025

xAI's most powerful model at the time

Major reasoning leap

Trained on expanded Colossus cluster

Google DeepMindopen source4B

Gemma 3n: La Revolución del Edge AI de Google DeepMind

Lanzado el 26 de junio de 2025

Efficient on-device model designed for mobile

Runs on phones and edge devices

OpenAIreasoningCerrado

GPT-o3 Pro: El Nuevo Estándar en Modelos de Razonamiento de OpenAI

Lanzado el 10 de junio de 2025

Most powerful OpenAI reasoning model

Extended thinking for frontier problems

Mistral AIlanguage model24BCódigo Abierto

Mistral Small 3.2: Mejoras de Razonamiento y Código

Lanzado el 10 de junio de 2025

Update to Mistral Small 3.1

Improved instruction following and reasoning

Apache 2.0 license

Xiaohongshu (RedNote)open source142B MoE (14B active)

Dots.llm1: El Nuevo Estándar Open Source de Xiaohongshu

Lanzado el 6 de junio de 2025

Open-source MoE from RedNote (China Instagram)

142B total, 14B active

Performance on par with frontier models at time of release

Mistral AIreasoning24BCódigo Abierto

Magistral Small: El Nuevo Estándar en Razonamiento de Mistral AI

Lanzado el 5 de junio de 2025

Mistral reasoning model with extended thinking

Strong STEM performance

Apache 2.0 license

Google DeepMindmultimodalCerrado

Gemini 2.5 Pro (06-05): El Nuevo Estándar en Razonamiento y Código

Lanzado el 5 de junio de 2025

Latest 2.5 Pro with enhanced coding, reasoning, and agentic capabilities

MiniMaxlanguage modelCódigo Abierto

MiniMax-M1: El Nuevo Gigante de Código Abierto con Atención Relámpago

Lanzado el 1 de junio de 2025

Chinese AI lab flagship with strong long-context

Lightning attention architecture

Anthropiclanguage modelCerrado

Anthropic Lanza Claude Sonnet 4: El Nuevo Líder en Código y Agentes

Lanzado el 22 de mayo de 2025

High-performance model balancing speed and intelligence

200K context window, 64K max output

Best model for complex agents and coding

Native tool calling and computer use

Available on free tier of Claude.ai

AnthropicreasoningCerradoHito

Claude Opus 4: El Nuevo Líder en Razonamiento y Agentes Autónomos

Lanzado el 22 de mayo de 2025

Most powerful Anthropic model at launch

Parallel tool use, long autonomous tasks

200K token context window

Extended thinking support

Vision capabilities for image understanding

Mistral AIcoding model24BCódigo Abierto

Mistral AI lanza Devstral: El modelo de código de 24B bajo Apache 2.0

Lanzado el 21 de mayo de 2025

Mistral dedicated coding model

Optimized for software engineering and agentic coding tasks

Apache 2.0 license

TIIopen source0.5B–34B

Falcon H1: Revolución Abierta con Arquitectura Híbrida de TII

Lanzado el 20 de mayo de 2025

Hybrid SSM+attention architecture

Six model sizes from 0.5B to 34B

Punches above weight class on benchmarks

Apache 2.0 license

Google DeepMindlanguage modelCerrado

Gemini 2.5 Flash: El Nuevo Estándar de Velocidad y Razonamiento

Lanzado el 20 de mayo de 2025

Cost-efficient reasoning with controllable thinking depth

#1 Chatbot Arena for speed

Mistral AIlanguage modelCódigo Abierto

Mistral Medium 3: El Nuevo Estándar Abierto en IA (2025)

Lanzado el 14 de mayo de 2025

Front-tier model, competitive with GPT-4o

Strong multilingual capabilities

Apache 2.0 license

Alibaba Cloudopen source235B MoE (22B active)

Qwen 3: El Nuevo Modelo Open-Source de 235B Parámetros de Alibaba Cloud

Lanzado el 29 de abril de 2025

Excellent multilingual performance (Chinese, English, and more)

0.6B to 235B variants with hybrid thinking

119 languages supported

22B active parameters in MoE architecture

Strong coding performance

Apache 2.0 license

Zhipu AImultimodal32BCódigo Abierto

Zhipu GLM-4.1V: El Nuevo Gigante Multimodal de 32B

Lanzado el 25 de abril de 2025

Open 32B and 9B multimodal with reasoning

Competitive on vision tasks

OpenAIreasoningCerrado

OpenAI o4-mini: El Nuevo Estándar en Razonamiento Eficiente para Desarrolladores

Lanzado el 16 de abril de 2025

Efficient reasoning model

Best cost-performance for coding and STEM

OpenAIreasoningCerrado

OpenAI o3: El Nuevo Estándar de Razonamiento para Ingeniería

Lanzado el 16 de abril de 2025

Full o3 reasoning model — successor to o1

Deep chain-of-thought capabilities

OpenAIlanguage modelCerrado

OpenAI GPT-4.1 Series: El Nuevo Estándar para Ingeniería de Software

Lanzado el 14 de abril de 2025

Optimized for coding and instruction following

1M token context window

Available in Standard, Mini, and Nano variants

Nano: $0.10/M input, $0.40/M output

Meta AIopen source400B+ MoEHito

Llama 4 de Meta: El Nuevo Estándar Abierto para IA Multimodal

Lanzado el 5 de abril de 2025

Open-weight natively multimodal models

Scout: 109B, runs on single H100 GPU, 10M token context

Maverick: 400B, requires H100 DGX system

Early fusion for native text, image, and video understanding

Google DeepMindmultimodalCerradoHito

Gemini 2.5 Pro: El Nuevo Estándar en IA Multimodal de Google DeepMind

Lanzado el 25 de marzo de 2025

#1 on LMArena at launch

Built-in reasoning capabilities

1M token context window

Native code execution and Google Search grounding

Best overall model at launch

NVIDIAreasoning253B MoECódigo Abierto

NVIDIA Nemotron Ultra: El Nuevo Estándar en Razonamiento Abierto

Lanzado el 18 de marzo de 2025

Open reasoning model based on Llama

253B MoE architecture

Strong enterprise tasks

Mistral AIopen source24B

Mistral Small 3.1: Visión Multimodal y 128K Contexto en Open Source

Lanzado el 17 de marzo de 2025

Adds vision capabilities to Small 3.0

Multimodal, 128K context

Apache 2.0 license

Coherelanguage model111BCódigo Abierto

Cohere Command A: El Nuevo Estándar Open Source para Empresas

Lanzado el 13 de marzo de 2025

Cohere's 111B flagship model

Enterprise RAG and agentic tasks

Multilingual capabilities

Runs on 2 GPUs

Google DeepMindmultimodal27BCódigo Abierto

Google DeepMind lanza Gemma 3: El estándar multimodal abierto

Lanzado el 12 de marzo de 2025

1B/4B/12B/27B variants

Multimodal (text+vision)

Single GPU capable, 128K context

Shanghai AI Labopen source8B

InternLM 3: El Nuevo Líder en Modelos Open Source de 8B

Lanzado el 5 de marzo de 2025

8B bilingual (English + Chinese) model with deep thinking mode

Surpasses Llama 3.1 8B and Qwen2.5 7B on reasoning/knowledge tasks

128K context, trained on 4T tokens with 75%+ cost savings

Apache 2.0 license

Alibaba Cloudreasoning32BCódigo Abierto

QwQ-32B: El Nuevo Estándar en Razonamiento de Código y Lógica

Lanzado el 5 de marzo de 2025

Dedicated reasoning model from Qwen team

Strong mathematical and logical reasoning

Apache 2.0 license

OpenAIlanguage modelCerrado

OpenAI GPT-4.5: Redefiniendo la IA con Mayor EQ y Precisión

Lanzado el 27 de febrero de 2025

Largest OpenAI model at the time

Focus on EQ, creativity, reduced hallucinations

Anthropiccoding modelCerrado

Claude 3.7 Sonnet: El Nuevo Estándar en Ingeniería de Código

Lanzado el 24 de febrero de 2025

Hybrid reasoning — toggle instant/extended thinking

Best coding model at launch

200K context window, 64K max output

Microsoftopen source3.8B

Microsoft Phi-4-Mini: Eficiencia y Potencia en 3.8B

Lanzado el 18 de febrero de 2025

3.8B dense model outperforming 2x-size models (Phi-3.5-mini, Llama 3.2 3B)

128K context, 22 languages, function calling and tool use

Trained on 5T tokens (synthetic + filtered public data + code)

MIT license — smallest Phi model with strong reasoning

xAIlanguage modelCerrado

xAI Grok 3: Nuevo Líder en Razonamiento AI

Lanzado el 17 de febrero de 2025

Trained on Colossus supercluster (100K GPUs)

Strong reasoning capabilities

DeepSeek AIreasoning671B MoECódigo AbiertoHito

DeepSeek R1: El Modelo de Razonamiento que Desafiaba a OpenAI

Lanzado el 20 de enero de 2025

Open-source reasoning model rivaling o1

Pure reinforcement learning approach

Caused global market shockwaves

671B MoE architecture

Mistral AIlanguage model24BCódigo Abierto

Mistral Small 3.0: El Nuevo Estándar Abierto para IA en 2025

Lanzado el 15 de enero de 2025

Refreshed Small with state-of-the-art performance

Apache 2.0 license

Allen AIopen source7B / 13B

OLMo 2 de Allen AI: Transparencia Total y Rendimiento Superior

Lanzado el 6 de enero de 2025

Truly open: weights + training data + training code + evaluation all released

7B and 13B sizes — 7B competitive with Llama 3.1 8B, 13B with Gemma 2 9B

Trained on 4T–5T tokens, 9-point MMLU increase over OLMo 1

Apache 2.0 license

2024

DeepSeek AIopen source671B MoEHito

DeepSeek V3: El Hito Open-Source de 671B Parámetros

Lanzado el 26 de diciembre de 2024

671B MoE trained for $5.5M — matches GPT-4o/Claude 3.5 Sonnet

Revolutionized cost efficiency

Open-source on GitHub and HuggingFace

Strong coding and mathematical reasoning

TIIopen source10B

Falcon 3 de TII: El Nuevo Estándar Open Source para Razonamiento y Multimodalidad

Lanzado el 17 de diciembre de 2024

1B/3B/7B/10B sizes

Enhanced multilingual and multimodal

Apache 2.0 license

Microsoftopen source14B

Microsoft Phi-4: El Modelo de 14B que Desafía a los Gigantes en Razonamiento

Lanzado el 12 de diciembre de 2024

14B excelling at STEM reasoning

Outperforms much larger models on math

Google DeepMindmultimodalCerrado

Gemini 2.0 Flash: El Nuevo Estándar en IA Multimodal y Agéntica

Lanzado el 11 de diciembre de 2024

Google's model for the agentic era with native image and audio generation

Outperforms Gemini 1.5 Pro at twice the speed

Native tool use including Google Search and code execution

Foundation for Project Astra and Project Mariner

Meta AIopen source70B

Meta Llama 3.3: Eficiencia Extrema con 70B parámetros

Lanzado el 6 de diciembre de 2024

70B matching Llama 3.1 405B performance

Massive efficiency gain

OpenAIreasoningCerrado

OpenAI o1-pro: El Nuevo Estándar en Modelos de Razonamiento

Lanzado el 5 de diciembre de 2024

Enhanced reasoning with more compute for complex tasks

Available in ChatGPT Pro tier

Amazonlanguage modelCerrado

Amazon Nova: El Nuevo Estándar en Modelos de Lenguaje para AWS

Lanzado el 3 de diciembre de 2024

Foundation model family: Micro/Lite/Pro/Premier

Multimodal, optimized for AWS Bedrock

Alibaba Cloudcoding model0.5B–32BCódigo Abierto

Qwen2.5-Coder: El Nuevo Estándar en Modelos de Código Abiertos

Lanzado el 22 de noviembre de 2024

Code-specialized model in 6 sizes: 0.5B, 1.5B, 3B, 7B, 14B, 32B

32B variant matches GPT-4o coding ability — state-of-the-art open code LLM

Trained on 5.5T tokens (source code + text-code grounding + synthetic)

300+ programming languages, 128K context with YaRN extension

Apache 2.0 license

Mistral AImultimodal124BCódigo Abierto

Pixtral Large: El Nuevo Gigante Multimodal de Mistral AI

Lanzado el 17 de noviembre de 2024

Mistral's large multimodal model

128K context, native image understanding at scale

Open weights

Tencentopen source389B MoE (52B active)

Tencent Lanza Hunyuan-Large: El Nuevo Líder Open Source

Lanzado el 5 de noviembre de 2024

Largest open-source Transformer-based MoE model at release

389B total parameters with 52B active per token

256K context window

Outperforms Llama 3.1 405B on benchmarks

Anthropiclanguage modelCerrado

Claude Haiku 3.5: Velocidad y Costo para Devs

Lanzado el 22 de octubre de 2024

Fast and cost-effective model

200K token context window, 8K max output

Multilingual and vision capabilities

$0.80/M input, $4/M output

Ideal for high-volume tasks like chatbots and moderation

01.AIlanguage modelCerrado

Yi-Lightning: El Nuevo Modelo Propietario de 01.AI Desafia a los Gigantes

Lanzado el 16 de octubre de 2024

Ranked #6 on LMSYS Chatbot Arena at launch — #1 in China

Surpassed GPT-4o-0513 and Claude 3.5 Sonnet in overall ranking

Top-3 in Chinese, Math, Coding, and Hard Prompts categories

Founded by Kai-Fu Lee, proprietary model

Meta AImultimodal90BCódigo Abierto

Meta Llama 3.2: El Nuevo Estándar Multimodal para Desarrolladores

Lanzado el 25 de septiembre de 2024

First Llama models with vision capabilities — 11B and 90B multimodal variants

Lightweight 1B and 3B edge models for on-device deployment

128K context window, competitive with Claude 3 Haiku and GPT-4o-mini

Drop-in replacements for Llama 3.1 text models

Alibaba Cloudopen source72B

Qwen2.5: El Nuevo Líder Abierto de Alibaba para Desarrollo de IA

Lanzado el 19 de septiembre de 2024

0.5B to 72B range

SOTA open model for coding and math

18T training tokens

Apache 2.0 license

Mistral AIopen source22B

Mistral Small 2409: El Nuevo Estándar Open Source de 22B

Lanzado el 18 de septiembre de 2024

Updated Mistral Small with improved instruction following

22B parameters, Apache 2.0 license

Mistral AImultimodal12BCódigo Abierto

Pixtral 12B: Revolución Multimodal con Visión Nativa

Lanzado el 17 de septiembre de 2024

Built on NeMo architecture with native vision support

128K context, Apache 2.0 license

OpenAIreasoningCerradoHito

OpenAI o1-preview: El Nuevo Estándar de Razonamiento para IA

Lanzado el 12 de septiembre de 2024

First 'reasoning' model with chain-of-thought at inference

PhD-level science and math performance

DeepSeek AIopen source236B MoE (21B active)

DeepSeek V2.5: El Nuevo Gigante Open Source que Combina Coder y Chat

Lanzado el 5 de septiembre de 2024

Merged DeepSeek-V2-Chat and DeepSeek-Coder-V2 into a single model

236B MoE with 21B active parameters, 128K context

Strong coding and general capabilities in one model

MIT license, available on HuggingFace

AI21 Labsopen source398B MoE (94B active)

Jamba 1.5: La Revolución del Híbrido Mamba-Transformer de AI21 Labs

Lanzado el 22 de agosto de 2024

Mamba-Transformer hybrid MoE

94B active, 256K context

Fastest long-context model at release

Microsoftopen source4B MoE

Microsoft Phi-3.5: El Nuevo Estándar en Modelos de 4B MoE para Edge

Lanzado el 20 de agosto de 2024

4B MoE and 3.8B variants optimized for edge devices

Phone-capable AI with 128K context window

Improved multilingual support over Phi-3

Strong reasoning for its size class

xAIlanguage modelCerrado

Grok-2 de xAI: Análisis Técnico y Comparativa

Lanzado el 13 de agosto de 2024

Competitive with GPT-4o and Claude 3.5 Sonnet

Available on X platform

Naverlanguage model104BCerrado

HyperCLOVA X: El Nuevo LLM de Naver Optimizado para Asia

Lanzado el 7 de agosto de 2024

Korean web giant Naver's flagship LLM optimized for Korean language and culture

Two sizes: HCX-L (largest) and HCX-S (lighter), built on LLaMA 2 architecture

100K context window with Korean-optimized tokenizer

Strong cross-lingual reasoning in Asian languages — Korean, Japanese, Chinese

Black Forest Labsimage generation12BCódigo Abierto

FLUX.1: El Nuevo Estándar de Generación de Imágenes Abiertas

Lanzado el 1 de agosto de 2024

State-of-the-art text-to-image model from ex-Stability AI founders

12B rectified flow transformer architecture

FLUX.1 [schnell] open under Apache 2.0, [dev] non-commercial

Surpassed closed-source alternatives in image quality

Mistral AIlanguage model123BCódigo Abierto

Mistral Large 2: El Nuevo Gigante Abierto de Mistral AI

Lanzado el 24 de julio de 2024

128K context, competitive with GPT-4o and Llama 3.1 405B

12 languages supported

Open weights

Meta AIopen source405BHito

Llama 3.1: El Modelo Abierto de 405B Parámetros que Desafía a GPT-4

Lanzado el 23 de julio de 2024

Largest open model — 405B parameters

Matches GPT-4 on many benchmarks

128K context window

Mistral AI & NVIDIAopen source12B

Mistral NeMo 12B: Análisis Técnico y Guía de Implementación

Lanzado el 18 de julio de 2024

Co-built with NVIDIA, runs on a single GPU

12B parameters with 128K context window

Drop-in replacement for Mistral 7B with SOTA performance in its class

Apache 2.0 license, strong multilingual support

Shanghai AI Labopen source20B

InternLM 2.5: El Nuevo Estándar en Razonamiento Open-Source

Lanzado el 3 de julio de 2024

Strong reasoning from China's national lab

Competitive on math and coding

Google DeepMindopen source27B

Gemma 2 de Google DeepMind: El Nuevo Estándar de IA Abierta

Lanzado el 27 de junio de 2024

9B and 27B sizes

Outperforms models 2x its size

Knowledge distillation from Gemini

Anthropiclanguage modelCerradoHito

Claude 3.5 Sonnet: El Nuevo Estándar en IA para Desarrolladores

Lanzado el 20 de junio de 2024

Surpassed GPT-4o and Gemini 1.5 Pro at launch

2x faster than Claude 3 Opus at lower cost

DeepSeek AIcoding model236B MoECódigo Abierto

DeepSeek Coder V2: El Nuevo Estándar Abierto en Ingeniería de Código

Lanzado el 17 de junio de 2024

First open MoE code model matching GPT-4 Turbo on coding

338 programming languages supported

NVIDIAopen source340B

NVIDIA Nemotron-4 340B: El Nuevo Estándar de IA Abierta para Empresas

Lanzado el 14 de junio de 2024

NVIDIA's open model for synthetic data generation

Permissive enterprise license

Alibaba Cloudopen source72B

Qwen2: El Nuevo Gigante Open Source de 72B de Alibaba Cloud

Lanzado el 7 de junio de 2024

Major upgrade, 0.5B to 72B range

Competitive with Llama 3 70B

Apache 2.0 license

Zhipu AIopen source9B

GLM-4: El modelo open-source de 9B que desafía a Llama 3

Lanzado el 5 de junio de 2024

128K context, 26 languages

Competitive with Llama 3 8B

Open-source GLM-4 series

Mistral AIcoding model22BCódigo Abierto

Codestral: El Nuevo Modelo de Código de Mistral AI (22B)

Lanzado el 29 de mayo de 2024

Specialized code model, 80+ languages

32K context, fill-in-the-middle support

ByteDancelanguage modelCódigo Abierto

Doubao de ByteDance: El Nuevo Líder Open Source en IA

Lanzado el 15 de mayo de 2024

ByteDance's flagship LLM, most popular AI product in China

Available via Doubao app and Volcano Engine API

Supports 50+ application scenarios including voice, vision, and coding

Open-source Seed 1.5 variants released under permissive license

OpenAImultimodalCerradoHito

GPT-4o: El Futuro del Procesamiento Multimodal en IA

Lanzado el 13 de mayo de 2024

'Omni' model with native audio/vision/text

2x faster, 50% cheaper than GPT-4 Turbo

Real-time voice conversation capabilities

DeepSeek AIopen source236B MoE (21B active)

DeepSeek V2: El Nuevo Estándar en Modelos Open Source de Alta Eficiencia

Lanzado el 7 de mayo de 2024

236B MoE with only 21B active parameters

Multi-head Latent Attention for efficiency

Open weights

Snowflakeopen source480B MoE (17B active)

Snowflake Arctic: El Modelo Open-Source Empresarial Definitivo

Lanzado el 24 de abril de 2024

480B MoE with 17B active parameters

Enterprise-focused, strong on SQL and coding

Apache 2.0 license

Microsoftopen source14B

Phi-3 de Microsoft: El Modelo Open Source que Rompe los Límites del Móvil

Lanzado el 23 de abril de 2024

Mini/Small/Medium variants

Phi-3 Mini (3.8B) rivals Mixtral 8x7B

Phone-capable AI

Meta AIopen source70BHito

Llama 3 de Meta: El Nuevo Estándar en IA Abierta

Lanzado el 18 de abril de 2024

Trained on 15T tokens, 8B and 70B sizes

New open-source SOTA with massive community adoption

Mistral AIopen source176B MoE

Mixtral 8x22B: El modelo MoE de 176B que revoluciona el rendimiento multilingüe y código

Lanzado el 17 de abril de 2024

Large MoE with strong multilingual and code performance

Open weights

Coherelanguage model104BCódigo Abierto

Command R+: El modelo de lenguaje de 104B parámetros de Cohere optimizado para RAG empresarial

Lanzado el 4 de abril de 2024

Optimized for RAG and enterprise

128K context, 10 languages

Grounded generation capabilities

AI21 Labsopen source52B

Jamba 52B: El Revolucionario Modelo Híbrido Mamba-Transformer de Código Abierto de AI21 Labs

Lanzado el 28 de marzo de 2024

First production Mamba-Transformer hybrid

256K context, novel SSM architecture

Databricksopen source132B MoE (36B active)

DBRX de Databricks: El modelo open source de 132B que supera a Llama 2 y Mixtral

Lanzado el 27 de marzo de 2024

Open MoE with 36B active parameters

Outperformed Llama 2 70B and Mixtral

Apache 2.0 license

xAIopen source314B MoE

Grok-1: El Primer Modelo de Código Abierto de xAI con 314B MoE

Lanzado el 17 de marzo de 2024

xAI's first open-source model

314B MoE under Apache 2.0

Largest open MoE at time of release

Anthropiclanguage modelCerradoHito

Claude 3 de Anthropic: El Lanzamiento Histórico que Desafía a GPT-4

Lanzado el 4 de marzo de 2024

Haiku/Sonnet/Opus family

Opus matched GPT-4 on most benchmarks

200K context window, vision capabilities

AnthropicreasoningCerradoHito

Claude Opus 3: El modelo de razonamiento revolucionario de Anthropic

Lanzado el 4 de marzo de 2024

First Claude Opus model with advanced reasoning

200K context window

Pioneered extended thinking capabilities

Vision and tool use support

Mistral AIlanguage modelCerrado

Mistral Large: El modelo comercial insignia de Mistral AI con razonamiento de élite

Lanzado el 26 de febrero de 2024

Mistral's first flagship commercial model

32K context, top-tier reasoning

Google DeepMindopen source7B

Google DeepMind Lanza Gemma: El Modelo de Código Abierto que Revoluciona la IA Local

Lanzado el 21 de febrero de 2024

Google's open-source model from Gemini research

2B and 7B sizes, strong for its class

Google DeepMindmultimodalCerradoHito

Gemini 1.5 Pro: El revolucionario modelo multimodal con ventana de contexto de 1 millón de tokens

Lanzado el 15 de febrero de 2024

1 million token context window — 10x previous record

MoE architecture, processes entire codebases

Google DeepMindmultimodalCerrado

Gemini 1.0 Ultra: El modelo multimodal más potente de Google supera a GPT-4 en la mayoría de benchmarks

Lanzado el 8 de febrero de 2024

Most capable Gemini 1.0 model

Beat GPT-4 on 30/32 benchmarks

Powers Gemini Advanced

Stability AIopen source1.6B / 12B

StableLM 2: El modelo de lenguaje abierto de Stability AI que desafía a los gigantes con 1.6B y 12B de parámetros

Lanzado el 6 de febrero de 2024

Open language model in two sizes: 1.6B and 12B

Trained on 2T tokens (Falcon RefinedWeb, RedPajama, The Pile, CulturaX)

Competitive with Mistral-7B despite smaller footprint

Stability AI Community License

BigCode / ServiceNowcoding model3B / 7B / 15BCódigo Abierto

StarCoder 2: La Revolución de Código Abierto con Tres Tamaños y 600+ Lenguajes

Lanzado el 6 de febrero de 2024

Open code LLM in 3 sizes: 3B, 7B, 15B — trained on 4T+ tokens from The Stack v2

600+ programming languages, fill-in-the-middle capability

16K context with sliding window attention

Trained on permissively licensed code only

2023

Upstageopen source10.7B

SOLAR 10.7B: El modelo de código abierto que revoluciona el rendimiento de IA en Corea

Lanzado el 13 de diciembre de 2023

Korean startup Upstage's open model using depth up-scaling

Topped HuggingFace Open LLM Leaderboard at release

Apache 2.0 license

Mistral AIopen source46.7B MoE (12.9B active)Hito

Mixtral 8x7B de Mistral AI: El Modelo Abierto que Revoluciona la Eficiencia de IA

Lanzado el 11 de diciembre de 2023

Open-source MoE matching GPT-3.5 quality with only 12.9B active params

Game-changer for open-source efficiency

Apache 2.0 license

Google DeepMindmultimodalCerradoHito

Gemini 1.0 de Google DeepMind: El revolucionario modelo multimodal que redefine la IA

Lanzado el 6 de diciembre de 2023

Google's multimodal model family (Nano/Pro/Ultra)

Natively multimodal from training

NousResearchopen source34B

Nous Hermes 2: El modelo de código abierto que revoluciona la IA local

Lanzado el 13 de noviembre de 2023

Community fine-tuned model on Mistral/Yi

Strong at instruction following

Popular for local AI

01.AIopen source34B

Yi 34B de 01.AI: El Modelo Bilingüe Abierto que Desafía a Llama 2 70B

Lanzado el 2 de noviembre de 2023

Founded by Kai-Fu Lee

Strong bilingual (English/Chinese) model

Competitive with Llama 2 70B

Zhipu AIopen source6B

ChatGLM3-6B: El modelo de código abierto que revoluciona la IA conversacional

Lanzado el 27 de octubre de 2023

Third gen GLM with function calling, code interpreter, and agent capabilities

HuggingFaceopen source7B

Zephyr 7B: El modelo de código abierto que supera a modelos más grandes con DPO

Lanzado el 25 de octubre de 2023

Mistral 7B fine-tuned with DPO

Showed distilled alignment can match RLHF quality

Mistral AIopen source7BHito

Mistral 7B: El Modelo de Código Abierto que Revolucionó la IA en 2023

Lanzado el 27 de septiembre de 2023

Outperformed Llama 2 70B on all benchmarks despite being smaller

Sliding window attention

Apache 2.0 license

Alibaba Cloudopen source72B

Qwen 72B: El modelo de código abierto de Alibaba con 72 mil millones de parámetros que desafía a los líderes del mercado

Lanzado el 25 de septiembre de 2023

Alibaba's multilingual model series

Strong on Chinese and English tasks

Open weights

WizardLM Teamcoding model34BCódigo Abierto

WizardCoder 34B: El modelo de código de código abierto que supera a ChatGPT en benchmarks

Lanzado el 26 de agosto de 2023

Evol-Instruct tuned Code Llama

Top open-source coding model of its era

Strong on HumanEval

Meta AIcoding model34BCódigo Abierto

Code Llama 34B: El modelo de código abierto de Meta que revoluciona la programación asistida por IA

Lanzado el 24 de agosto de 2023

Specialized Llama 2 for code generation

Supports Python, C++, Java, and more

100K context window

Meta AIopen source70BHito

Llama 2: El modelo de código abierto que revolucionó la IA comercial

Lanzado el 18 de julio de 2023

First truly open-weight large model for commercial use

7B/13B/70B sizes with RLHF-tuned chat variants

Founded the modern open LLM ecosystem

Anthropiclanguage modelCerrado

Claude 2 de Anthropic: El modelo de lenguaje que revoluciona el contexto y la seguridad

Lanzado el 11 de julio de 2023

200K context window

Constitutional AI approach

Strong coding and analysis capabilities

Zhipu AIopen source6B

ChatGLM2: El modelo de código abierto de 6B parámetros que revoluciona el procesamiento de lenguaje natural

Lanzado el 25 de junio de 2023

Second generation GLM, 32K context

42% faster inference

Stronger math and coding

TIIopen source180B

Falcon 180B: El modelo de código abierto de 180 mil millones de parámetros que revoluciona el ranking de LLMs

Lanzado el 25 de mayo de 2023

Trained on 3.5T tokens of RefinedWeb

Topped the Open LLM Leaderboard

Apache 2.0 license

Googlelanguage model340BCerrado

PaLM 2: El modelo de lenguaje de próxima generación de Google que impulsa Bard y Gemini

Lanzado el 10 de mayo de 2023

Google's next-gen model powering Bard/Gemini

Improved multilingual, reasoning, and coding

MosaicMLopen source7B

MPT-7B: El modelo de código abierto comercialmente viable que revoluciona la IA

Lanzado el 5 de mayo de 2023

Commercially usable open-source model

Trained on 1T tokens

Apache 2.0 license

BigCode / HuggingFacecoding model15.5BCódigo Abierto

StarCoder: El modelo de código abierto de 15.5B que revoluciona la generación de código

Lanzado el 4 de mayo de 2023

Open-source code LLM trained on The Stack (1T tokens, 80+ languages)

8K context window

Stability AIopen source7B

StableLM: La Revolución de los Modelos de Lenguaje Abiertos de Stability AI

Lanzado el 19 de abril de 2023

Stability AI's open-source LLM family

3B and 7B sizes, trained on 1.5T tokens

CC-BY-SA license

LMSYSopen source13B

Vicuna de LMSYS: El modelo de código abierto que logra el 90% del rendimiento de ChatGPT

Lanzado el 30 de marzo de 2023

Fine-tuned LLaMA on ShareGPT conversations

Achieved ~90% of ChatGPT quality

Launched the Chatbot Arena

Anthropiclanguage modelCerrado

Claude 1 de Anthropic: El Lanzamiento que Revolucionó la IA Segura

Lanzado el 14 de marzo de 2023

Anthropic's first public model

Constitutional AI for safety

100K context window

OpenAImultimodal~1.8T (MoE)CerradoHito

GPT-4 de OpenAI: El revolucionario modelo multimodal que cambió la IA

Lanzado el 14 de marzo de 2023

Multimodal (text + vision), passed the bar exam (90th percentile)

Massive leap in reasoning over GPT-3.5

~1.8T parameters (MoE estimated)

Stanfordopen source7B

Alpaca 7B de Stanford: El Modelo de Código Abierto que Revolucionó el Fine-Tuning de Instrucciones

Lanzado el 13 de marzo de 2023

Fine-tuned LLaMA on 52K instructions generated by GPT-3.5

Showed cheap instruction tuning works

Meta AIopen source65BHito

LLaMA 1 de Meta AI: El Revolucionario Modelo Abierto que Cambió Todo

Lanzado el 24 de febrero de 2023

Leaked weights ignited the open-source LLM revolution

Showed small models can match GPT-3

65B parameters

2022

OpenAIlanguage model175BCerradoHito

ChatGPT de OpenAI: El modelo que definió la era de la IA conversacional

Lanzado el 30 de noviembre de 2022

GPT-3.5 with RLHF in a chat interface

Reached 100M users in 2 months

Defined the AI era

Googlelanguage model11BCódigo Abierto

Flan-T5: El modelo de lenguaje instruccional de Google que revoluciona la transferencia cero

Lanzado el 20 de octubre de 2022

Instruction-tuned T5

Demonstrated instruction tuning dramatically improves task generalization

BigScienceopen source176BHito

BLOOM: El modelo de lenguaje multilingüe de 176 mil millones de parámetros que revolucionó el mundo del AI abierto

Lanzado el 6 de julio de 2022

First 100B+ open-source multilingual model

Built by 1000+ researchers across 70+ countries

46 languages supported

Meta AIopen source175B

OPT 175B: El Modelo de Código Abierto de Meta que Retó a GPT-3

Lanzado el 3 de mayo de 2022

Meta's open-source GPT-3 equivalent

Full model weights released for research

175B parameters

EleutherAIopen source20B

GPT-NeoX 20B: El modelo de código abierto que revolucionó la IA generativa en 2022

Lanzado el 14 de abril de 2022

EleutherAI's 20B open model

First glimpse that local LLMs could scale to GPT-3 territory

Predecessor to today open-source ecosystem

Googlelanguage model540BCerrado

PaLM 540B: El modelo de lenguaje de Google que revolucionó el razonamiento y la codificación

Lanzado el 4 de abril de 2022

540B parameter model

Breakthrough capabilities in reasoning, code, and multilingual tasks

Google DeepMindlanguage model70BCerradoHito

Chinchilla de Google DeepMind: El modelo que revolucionó las leyes de escalado de LLM

Lanzado el 29 de marzo de 2022

Proved smaller models trained on more data outperform larger undertrained ones

Redefined scaling laws for LLMs

OpenAIlanguage model175BCerradoHito

InstructGPT: El modelo que revolucionó la alineación de IA con instrucciones humanas

Lanzado el 27 de enero de 2022

Introduced RLHF for alignment

Pioneered training models to follow human instructions safely

2021

Google DeepMindlanguage model280BCerrado

Gopher de Google DeepMind: El modelo de lenguaje de 280 mil millones de parámetros que revolucionó la IA

Lanzado el 8 de diciembre de 2021

280B parameter model

Extensive analysis of scaling laws across 152 tasks

OpenAIcoding model12BCerradoHito

OpenAI Codex: El modelo de código que revolucionó la programación asistida por IA

Lanzado el 10 de agosto de 2021

GPT-3 fine-tuned on code

Powered GitHub Copilot

Proved LLMs could write functional programs

EleutherAIopen source6B

GPT-J: El modelo de código abierto que revolucionó la IA accesible en hardware doméstico

Lanzado el 9 de junio de 2021

First open model runnable on consumer hardware

6B params, GPT-2 architecture

Widely deployed in early local AI applications

Googlelanguage model1571BCódigo Abierto

Switch Transformer de Google: El modelo MoE de 1.6 trillones de parámetros que revolucionó el escalado eficiente

Lanzado el 11 de enero de 2021

1.6 trillion parameter MoE model

Demonstrated efficient scaling through sparse expert routing

2020

Googlelanguage model600B MoECerrado

GShard: El modelo de lenguaje revolucionario de Google con 600 mil millones de parámetros

Lanzado el 30 de junio de 2020

First Mixture of Experts model at massive scale

600B parameters for machine translation

OpenAIlanguage model175BCerradoHito

GPT-3 de OpenAI: El Modelo que Revolucionó la IA Generativa

Lanzado el 28 de mayo de 2020

175B parameters — demonstrated few-shot learning without fine-tuning

Sparked the modern LLM revolution

2019

Googlelanguage model11BCódigo AbiertoHito

T5: El revolucionario modelo de Google que transformó la NLP con su enfoque Text-to-Text

Lanzado el 23 de octubre de 2019

Text-to-Text Transfer Transformer

Unified framework treating all NLP tasks as text generation

Meta AIlanguage model355BCódigo Abierto

RoBERTa: El modelo de lenguaje revolucionario que demostró que BERT estaba subentrenado

Lanzado el 26 de julio de 2019

Robustly Optimized BERT

Showed BERT was significantly undertrained

Achieved new SOTA with better training

Google / CMUlanguage model340BCódigo Abierto

XLNet: El modelo de lenguaje revolucionario que superó a BERT en 20 tareas

Lanzado el 19 de junio de 2019

Generalized autoregressive pretraining

Outperformed BERT on 20 NLP tasks

OpenAIlanguage model1.5BCódigo AbiertoHito

GPT-2: El modelo que revolucionó la IA y fue considerado 'demasiado peligroso' para su lanzamiento

Lanzado el 14 de febrero de 2019

Initially withheld due to misuse concerns — "Too dangerous to release"

Showed emergent text generation quality at scale

2018

Googlelanguage model340BCódigo AbiertoHito

BERT de Google: El modelo que revolucionó el procesamiento del lenguaje natural en 2018

Lanzado el 11 de octubre de 2018

Bidirectional Encoder Representations from Transformers

Revolutionized NLP benchmarks

Became the foundation for search engines

OpenAIlanguage model117BCódigo Abierto

GPT-1: El Pionero que Revolucionó el Procesamiento del Lenguaje Natural

Lanzado el 11 de junio de 2018

First GPT model — decoder-only transformer

Demonstrated generative pre-training for language understanding

Allen AIlanguage model94MCódigo Abierto

ELMo: El modelo revolucionario de embeddings contextualizados de Allen AI

Lanzado el 15 de febrero de 2018

Embeddings from Language Models

Contextualized word representations using bidirectional LSTMs

2017

Googlelanguage modelCódigo AbiertoHito

Transformer de Google: El modelo que revolucionó la IA y sentó las bases de todos los LLM modernos

Lanzado el 12 de junio de 2017

'Attention Is All You Need' paper introduces the Transformer architecture

The foundation of all modern LLMs