Хронология Выпуска ИИ Моделей
Хронологическая timeline основных выпусков ИИ моделей
2026
Эра автономных агентов: Глубокий разбор Qwen3.7-Max от Alibaba
Выпущен 20 мая 2026 г.
Agentic flagship model designed for autonomous agents capable of coding, orchestrating workflows via MCP, and sustaining long action chains on multi-step tasks
35-hour autonomous kernel optimization test with over 1,000 tool calls without breaking the reasoning chain
Good cross-framework generalization including Claude Code, OpenClaw, and Qwen Code
Currently offers a pure text-only interface for public experimentation
Deep thinking capabilities for complex reasoning tasks
Deployed via Aliyun Bailian API at $2.5 input / $7.5 output per million tokens
Gemini 3.5 Flash: Эра сверхбыстрых агентских моделей официально началась
Выпущен 19 мая 2026 г.
Google high-efficiency multimodal model delivering near-Pro level coding and reasoning at Flash-tier cost and speed
Supports text, image, video, audio, and PDF inputs natively
Defaults to medium thinking effort with full support for thinking levels: minimal, low, medium, high for fine-grained cost/performance tuning
Surpasses Gemini 3.1 Pro on coding and agentic benchmarks: Terminal-Bench 2.1 (76.2%), GDPval-AA (1656 Elo), MCP Atlas (83.6%)
Leads multimodal understanding with 84.2% on CharXiv Reasoning benchmark
4x faster output tokens per second compared to other frontier models
Ranked in the upper-right quadrant of the Artificial Analysis Intelligence Index for top intelligence at exceptional speed
Ideal for long-horizon agentic tasks at less than half the cost of competing frontier models
Integrates with Antigravity for collaborative sub-agent deployment at enterprise scale
1M token context window
Baidu ERNIE-5.1: Моделю эффективности и лидерства
Выпущен 9 мая 2026 г.
Tops LMArena Search leaderboard as #4 globally and #1 among Chinese models with a score of 1,223
Math: #9 globally on LMArena category leaderboards
Legal & Government: #1 globally on LMArena category leaderboards
Business, Management & Financial Ops: #4 globally on LMArena category leaderboards
Software & IT Services: #7 globally on LMArena category leaderboards
Compresses total parameters to approximately 1/3 and active parameters to approximately 1/2 of ERNIE-5.0
Achieves leading performance using only about 6% of the pre-training cost of comparable models
Powered by decoupled fully-asynchronous reinforcement learning infrastructure built on PaddlePaddle
Uses scaled agentic post-training with Multi-Teacher On-Policy Distillation (MOPD)
Scores 99.6 on AIME26 with tool use, second only to Gemini 3.1 Pro
Surpasses DeepSeek-V4-Pro on tau-cubed-bench and SpreadsheetBench-Verified agent evaluation tasks
Four-stage post-training pipeline: SFT, Domain Expert Model Training, On-Policy Distillation, and General Online RL
Based on Once-For-All elastic training framework with elastic depth, width, and sparsity dimensions
Rolling out on 10+ creative production agent platforms including ISEKAI ZERO and Mulan AI
Creative writing capabilities approach those of Gemini 3.1 Pro
xAI Grok 4.3: Новый стандарт аналитического интеллекта для разработчиков
Выпущен 30 апреля 2026 г.
Reasoning model from xAI with configurable effort levels (none/low/medium/high, default low)
Accepts text and image inputs with text output
Suited for agentic workflows, instruction-following tasks, and high factual accuracy applications
1 million token context window with no output token limit
Well-suited for long-document analysis, deep research, and multi-step agentic tasks
Tiered pricing: requests exceeding 200k total tokens are billed at a higher rate
Mistral Medium 3.5: 128B Open-Source Giant Arrives
Выпущен 29 апреля 2026 г.
New flagship model merging instruction-following, reasoning, and coding into a single 128B dense architecture
Released as open weights under a modified MIT license
Runs self-hosted on as few as four GPUs
API pricing at $1.50/mtok input and $7.50/mtok output
Powers the new Mistral Vibe remote agents for async cloud coding sessions
Drives Work mode in Le Chat for multi-step agentic task execution with parallel tool calling
Sessions can be spawned from CLI or Le Chat, and local CLI sessions can be teleported to the cloud
NVIDIA Nemotron 3 Nano Omni: Мультимодельный Прорыв 2026
Выпущен 28 апреля 2026 г.
Multimodal model unifying video, audio, image, and text understanding in a single architecture
Hybrid Mixture-of-Experts (MoE) 30B-A3B architecture with 30B total and 3B active parameters
Up to 9x higher throughput compared to similar open omnimodal models
256K unified context window with single-pass perception
Hybrid architecture combining Mamba layers for memory efficiency and transformers for precise reasoning
Integrates vision encoders (C3D for video) and audio encoders (Paraquet), eliminating need for separate models
Supports FP8/NVFP4 quantization with optimized inference on NVIDIA Ampere, Hopper, and Blackwell GPUs
Designed for enterprise multimodal agents: document intelligence (OCR, tables), GUI navigation, audio-video reasoning
Runs locally with 25-36GB RAM in 4/8-bit quantization via Unsloth or vLLM
Available on Hugging Face, Ollama, OpenRouter, and NVIDIA NIM
Laguna-M.1: Флагманский код-модель от Poolside
Выпущен 28 апреля 2026 г.
225B total parameter Mixture-of-Experts model with 23B activated parameters per token
Poolside most capable model to date, completed pre-training at end of 2025
Trained from scratch on 30T tokens using Muon optimizer
Trained on 6,144 interconnected NVIDIA Hopper GPUs entirely in-house
Achieves 72.5% on SWE-bench Verified, 67.3% on SWE-bench Multilingual, 46.9% on SWE-bench Pro, 40.7% on Terminal-Bench 2.0
128K context window with up to 8K output tokens
Agentic coding model built for long-horizon software engineering tasks
Foundation for the entire Laguna model family
Uses custom async on-policy RL system with Agent Client Protocol (ACP) server
Free to use for a limited time via poolside API and OpenRouter
Weights available on request for startups, institutions, and universities
Laguna-XS.2: Революция в кодировании от poolside
Выпущен 28 апреля 2026 г.
33B total parameter Mixture-of-Experts model with 3B activated parameters per token
First open-weight release from poolside, licensed under Apache 2.0
Trained on 30T tokens using Muon optimizer
Supports native reasoning with interleaved thinking between tool calls
Uses Sliding Window Attention with per-head gating in 30 of 40 layers
KV cache quantized to FP8 for reduced memory per token
Compact enough to run locally on a Mac with 36 GB RAM
128K context window with up to 8K output tokens
Achieves 68.2% on SWE-bench Verified, 62.4% on SWE-bench Multilingual, 44.5% on SWE-bench Pro, 30.1% on Terminal-Bench 2.0
Supports vLLM, Transformers, TRT-LLM, and Ollama
Agentic coding model built for long-horizon software engineering tasks
Free to use for a limited time via poolside API and OpenRouter
DeepSeek-V4: Новый Стандарт Open-Source AI
Выпущен 24 апреля 2026 г.
Deux modèles : DeepSeek-V4-Pro (1.6T total / 49B active params) et DeepSeek-V4-Flash (284B total / 13B active params)
Context length de 1M tokens, output max de 384K tokens
Support thinking mode (par défaut) et non-thinking mode
Pricing ultra-agressif : Flash à $0.14/M input tokens (cache miss), $0.028/M (cache hit), $0.28/M output — soit ~7x moins cher que Claude Opus 4.7
Pro à $1.74/M input tokens (cache miss), $0.145/M (cache hit), $3.48/M output
Modèles open-source, poids disponibles sur HuggingFace
Compatible format API OpenAI et Anthropic (https://api.deepseek.com et https://api.deepseek.com/anthropic)
Support JSON output, Tool Calls, Chat Prefix Completion (Beta), FIM Completion (Beta)
Performance rivalisant avec les meilleurs modèles closed-source mondiaux
OpenAI GPT-5.5: Новый Стандарт ИИ 2026
Выпущен 23 апреля 2026 г.
GPT-5.5 is OpenAI smartest and most intuitive to use model yet, described as the next step toward a new way of getting work done on a computer
Achieves 82.7% on Terminal-Bench 2.0, 73.1% on Expert-SWE (Internal), and 84.9% on GDPval — all state-of-the-art scores
Matches GPT-5.4 per-token latency while performing at a much higher level of intelligence
Significantly more token efficient — uses fewer tokens to complete the same tasks compared to GPT-5.4
Scores 78.7% on OSWorld-Verified for real computer environment operation and 81.8% on CyberGym
GPT-5.5 Pro achieves 90.1% on BrowseComp and 52.4% on FrontierMath Tier 1-3
On SWE-Bench Pro, reaches 58.6% solving more tasks end-to-end in a single pass than previous models
Proactively deployed with industry-leading cybersecurity safeguards, classified as High under OpenAI Preparedness Framework
Helped discover a new proof about Ramsey numbers in combinatorics, later verified in Lean
Scores 25.0% on GeneBench for multi-stage scientific data analysis in genetics
API pricing: $5/1M input tokens and $30/1M output tokens with 1M context window
GPT-5.5 Pro API pricing: $30/1M input tokens and $180/1M output tokens
Co-designed, trained with, and served on NVIDIA GB200 and GB300 NVL72 systems
Rolling out to Plus, Pro, Business, and Enterprise users in ChatGPT and Codex
GPT-5.5 Thinking unlocks faster help for harder problems with smarter, more concise answers
Outperforms Claude Opus 4.7 and Gemini 3.1 Pro on most coding and professional benchmarks
More than 85% of OpenAI now uses Codex every week across all company functions
Xiaomi MiMo-V2.5-Pro: 1T+ Параметры и Эпоха Автономных Агентов
Выпущен 22 апреля 2026 г.
Multimodal Mixture-of-Experts (MoE) architecture with 1T+ total parameters (42B active)
Extended context window up to 1M tokens
Native multimodal perception supporting text, images, video, and audio
Advanced autonomous agent capabilities handling 1000+ tool calls
40-60% better token efficiency compared to Claude Opus and GPT-5.x
ClawEval benchmark: 64% Pass@3 score
SWE-bench Pro: 57.2% task resolution rate
Surpasses Claude 4.6 Sonnet in coding tasks, approaches Claude Opus in agentic performance
Part of the MiMo-V2.5 family alongside MiMo-V2.5 and MiMo-V2.5-TTS
Available via mimo.mi.com with affordable token plans (monthly/annual subscriptions)
Qwen3.6-27B: Как плотная модель обошла гигантов в коде
Выпущен 22 апреля 2026 г.
27B dense open-source model with Apache 2.0 license
Surpasses Qwen3.5-397B-A17B on all major agentic coding benchmarks
SWE-bench Verified: 77.2 vs 76.2, Terminal-Bench 2.0: 59.3 vs 52.5, SkillsBench: 48.2 vs 30.0
Supports both multimodal thinking and non-thinking modes natively
Native vision-language support for images and video understanding
GPQA Diamond: 87.8, competitive with models several times its size
Compatible with OpenClaw, Claude Code, and Qwen Code coding assistants
Available on Hugging Face, ModelScope, and Alibaba Cloud Model Studio API
Moonshot AI представила Kimi K2.6: революция в open-source коде
Выпущен 20 апреля 2026 г.
Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python (86.7), Math Vision w/ python (93.2)
Long-horizon coding: 4,000+ tool calls, over 12 hours continuous execution
Generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization)
300 parallel sub-agents x 4,000 steps per run (up from K2.5: 100 / 1,500)
Proactive Agents: powers OpenClaw, Hermes Agent for 24/7 autonomous ops
Claw Groups research preview: bring your own agents, command friends bots & humans in the loop
API PRICING (use these EXACT values): kimi-k2.6 — Input $0.16/M tokens (cache hit), Input $0.95/M tokens (cache miss), Output $4.00/M tokens, Context Window 262,144 tokens
Sources: https://platform.moonshot.ai, https://kimi.com/blog/kimi-k2-6, https://huggingface.co/moonshotai/Kimi-K2.6
Live on kimi.com in chat and agent mode, plus Kimi Code at https://kimi.com/code for production-grade coding
Anthropic Claude Opus 4.7: Новый Эталон Рационального Интеллекта
Выпущен 16 апреля 2026 г.
Most capable generally available Anthropic model for complex reasoning and agentic coding
High-resolution image support: 2576px / 3.75MP (up from 1568px / 1.15MP) with 1:1 pixel mapping
New "xhigh" effort level for coding and agentic use cases
Task budgets (beta) — advisory token budget across full agentic loops
128K max output tokens, 1M context window at standard pricing
+12 points on CursorBench coding benchmarks vs Opus 4.6
New tokenizer (up to ~35% more tokens per text, improved performance)
Adaptive thinking only — extended thinking budgets removed
Sampling parameters (temperature, top_p, top_k) removed
Pricing: $5/$25 per MTok input/output, batch $2.50/$12.50 per MTok
GLM-5.1: Революция в Open Source Reasoning Моделях
Выпущен 7 апреля 2026 г.
#1 on SWE-Bench Pro (58.4%), beating GPT-5.4 and Claude Opus 4.6
Post-training upgrade to GLM-5 — same 744B MoE architecture (40B active)
Trained entirely on Huawei Ascend chips — no NVIDIA hardware
MIT license, compatible with Claude Code and OpenClaw
202K context window, strong on cybersecurity (CyberGym 68.7%)
Claude Opus 4.6 Fast: Революция скорости и интеллекта от Anthropic
Выпущен 7 апреля 2026 г.
Faster variant of Claude Opus 4.6 with comparable intelligence
Claude Mythos Preview: Эра Capybara и Искусственного Разума
Выпущен 7 апреля 2026 г.
New Capybara tier above Opus — the most powerful Anthropic model
93.9% on SWE-bench Verified, 77.8% on SWE-bench Pro
97.6% on USAMO 2026, 94.5% on GPQA Diamond
1M context window, limited preview for ~50 partner organizations
Google DeepMind выпускает Gemma 4: Эра открытого Apache 2.0
Выпущен 2 апреля 2026 г.
Google's most capable open models, built from Gemini 3 research
Four sizes: E2B, E4B, 26B MoE (3.8B active), 31B Dense
First Gemma release under Apache 2.0 license
Native multimodal, 140+ languages, up to 256K context
Agent-ready with function calling and structured JSON output
GLM-5V Turbo от Zhipu AI: Революция в мультимодальном кодировании
Выпущен 1 апреля 2026 г.
Vision + Code model from Z.ai
Multimodal coding capabilities
API only
Qwen 3.6 Plus: Новый стандарт для агентов и кодинга от Alibaba
Выпущен 31 марта 2026 г.
1M token context window with always-on chain-of-thought reasoning
78.8% on SWE-bench Verified — competitive with Claude Opus 4.6
2-3x faster output speed than Claude Opus 4.6
Free preview via OpenRouter, successor to Qwen 3.5
Mistral Voxtral TTS: Новый стандарт открытого синтеза речи
Выпущен 23 марта 2026 г.
Mistral's first audio model — direct competitor to ElevenLabs
Zero-shot voice cloning with multilingual support
Real-time streaming capabilities
Open weights under CC BY-NC 4.0 (non-commercial)
Xiaomi MiMo-V2-Pro: Революция в Reasoning Моделях
Выпущен 18 марта 2026 г.
Xiaomi reasoning model with strong math and code performance
309B MoE architecture
MiniMax M2.7: Революция в самоэволюционирующих кодовых агентах
Выпущен 18 марта 2026 г.
Self-evolving agent model — first to participate in its own development
56.22% on SWE-Pro, matching GPT-5.3-Codex
57.0% on Terminal Bench 2, GDPval-AA ELO 1495 (highest open-source)
230B MoE (10B active), 200K context, open weights on HuggingFace
Agent Teams for native multi-agent collaboration
GPT-5.4 Mini: Новый стандарт эффективности OpenAI
Выпущен 17 марта 2026 г.
Efficient variant of GPT-5.4 with native computer use
Lower cost while maintaining strong reasoning capabilities
Leanstral от Mistral AI: Первое Open-Source Агентство для Lean 4
Выпущен 16 марта 2026 г.
First open-source code agent for Lean 4 formal proof engineering
Generates code AND machine-checkable mathematical proofs
119B MoE with 6.5B active, outperforms Claude Sonnet 4.6 on FLTEval
Apache 2.0 license, 15x cheaper than Claude Opus for formal verification
Mistral Small 4: Единая модель для кода, зрения и логики
Выпущен 16 марта 2026 г.
Unifies instruct, reasoning, coding, and multimodal in a single model
119B MoE with 6.5B active parameters, 256K context window
Replaces Magistral (reasoning), Pixtral (vision), and Devstral (coding)
Apache 2.0 license, configurable reasoning parameter
Grok 4.20: Революция в агентских системах xAI
Выпущен 12 марта 2026 г.
Beta release with parallel agents architecture
500K context window
Iterative improvement via user feedback
NVIDIA Nemotron 3 Super: Новый стандарт для агентных систем от NVIDIA
Выпущен 11 марта 2026 г.
Open MoE model from NVIDIA
120B total parameters with 12B active
Strong enterprise performance
OpenAI GPT-5.4: Новый стандарт для профессиональных рабочих процессов
Выпущен 6 марта 2026 г.
Latest OpenAI flagship with 1M token context window
Available in Standard, Mini, and Nano variants
Supports reasoning effort with 4 effort levels
128K max output tokens
Prompt caching with $0.02-$0.25/M cached read
Google DeepMind выпускает Gemini 3.1 Flash Lite Preview: Обзор для разработчиков
Выпущен 3 марта 2026 г.
Google's high-efficiency model optimized for high-volume use cases
1M token context window, 65.5K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Google DeepMind представил Gemini 3.1 Pro: новая эра логического мышления
Выпущен 19 февраля 2026 г.
Google's latest flagship model
More than doubles reasoning performance over Gemini 3 Pro
Released in preview via Gemini API, AI Studio, and Vertex AI
xAI Grok 4.2: Новый стандарт в мире больших языковых моделей
Выпущен 17 февраля 2026 г.
Beta release with rapid learning architecture — improves weekly via user feedback
256K context window
4-agent parallel reasoning
Medical document analysis added
Claude Sonnet 4.6: Новый стандарт для разработчиков
Выпущен 17 февраля 2026 г.
Most capable Sonnet yet with full upgrade across coding, computer use, long-context reasoning
1M token context window in beta
200K token context window, 64K max output
Supports prompt caching, reasoning effort, and reasoning budget
Native tool calling and vision capabilities
Qwen 3.5: Архитектура, Бенчмарки и API от Alibaba Cloud
Выпущен 14 февраля 2026 г.
Agentic AI model with built-in tools for web search and code execution
1M token context window
Qwen3.5-Plus hosted; open weights planned
MiniMax M2.5: Новая Эра Эффективных Моделей Кодирования
Выпущен 12 февраля 2026 г.
Frontier MoE model with 80.2% on SWE-Bench Verified
Strong coding and agentic capabilities
230B total parameters, 10B activated per token
DeepSeek V3.2: Открытая альтернатива GPT-5 с 671B параметрами
Выпущен 12 февраля 2026 г.
Major update to the V3 series with 1M token context
671B MoE focused on code generation and reasoning improvements
Open weights on HuggingFace, MIT license
GLM-5 от Zhipu AI: Новый стандарт для агентов и инженерии
Выпущен 11 февраля 2026 г.
China's first public AI company frontier model
Targets complex systems engineering and long-horizon agentic tasks
MiniCPM-o 4.5: Революция в Edge AI и Мультимодальность
Выпущен 8 февраля 2026 г.
On-device multimodal LLM with full-duplex real-time audio, image, video
Built on Qwen3-8B architecture
Gemini 2.5 Flash level performance at only 9B parameters
OpenAI GPT-5.3-Codex: Новый стандарт для агентов разработки
Выпущен 5 февраля 2026 г.
Most capable agentic coding model from OpenAI
Available via Codex app, CLI, IDE extensions
Optimized for software engineering workflows
Claude Opus 4.6: Революция в агентском планировании и Reasoning
Выпущен 5 февраля 2026 г.
Huge leap for agentic planning with parallel subtask execution
Tool and subagent orchestration capabilities
Terminal-Bench record holder
1M token context window, 32K max output
State-of-the-art agentic AI behaviors
Step-3.5-Flash: Революция в области открытого логического вывода
Выпущен 1 февраля 2026 г.
Open-source sparse MoE with 3-way Multi-Token Prediction
100-350 tok/s generation speed
Frontier reasoning at low cost
Arcee AI Trinity Large: Открытый Монолит 400B Параметров
Выпущен 27 января 2026 г.
400B sparse MoE with only 13B active parameters
Built in the US with open weights
One of the largest open-source foundation models
Apache 2.0 license
Qwen3-Max-Thinking: Новый стандарт логического ИИ от Alibaba Cloud
Выпущен 27 января 2026 г.
Top-tier reasoning model with adaptive tool use
Retrieves information and runs code during inference
Rivals leading frontier models
Moonshot Kimi K2: 1T MoE и первое место в LMSYS
Выпущен 20 января 2026 г.
Massive 1T MoE with 32B active parameters
First open-weight model to rank #1 on LMSYS Chatbot Arena
2M token context window, 200+ language support
$0.15/$2.50 per 1M tokens, Modified MIT license
Sarvam-2B: Новый легкий индийский LLM для суверенного ИИ
Выпущен 15 января 2026 г.
India's multilingual LLM — part of sovereign AI initiative
Supports 10+ Indian languages natively
2025
SOLAR 102B: Новый стандарт открытой архитектуры от Upstage
Выпущен 31 декабря 2025 г.
Korea's answer to open frontier models
102B MoE model with 12B active parameters
Google DeepMind: Gemini 3 Flash — новый стандарт скорости для разработчиков
Выпущен 17 декабря 2025 г.
Fast frontier-class model rivaling larger models at a fraction of the cost
Default model in the Gemini app
Molmo 2: Открытый Мультимодальный 8B Модели от Allen AI
Выпущен 16 декабря 2025 г.
Multimodal model from AI2
Fully open weights, data, and code
Xiaomi MiMo V2 Flash: Открытый Источник Разумного ИИ
Выпущен 16 декабря 2025 г.
Xiaomi large reasoning model
309B MoE architecture
Strong on math and code
GPT-5.2: Новый стандарт для разработчиков и инженеров
Выпущен 11 декабря 2025 г.
Improved reasoning and multimodal capabilities over GPT-5.1
Enhanced mental health protections
128K max output tokens
Available on Plus ($20/month), Pro ($200/month), and API
Expert-level performance on 44 knowledge work tasks
Mistral AI Devstral Small 2: Новый стандарт для Open-Source Кодирования
Выпущен 9 декабря 2025 г.
Successor to Devstral Small 1, derived from Mistral Small 3.1
Portable coding agent
Apache 2.0 license
Mistral AI Devstral 2: Новое поколение кодинговых моделей
Выпущен 9 декабря 2025 г.
Next-gen coding model with top SWE-Bench score
Modified MIT license (free unless high revenue)
Ministral 3 14B: Открытая мультимодальная мощь от Mistral AI
Выпущен 2 декабря 2025 г.
Largest Ministral 3 model with vision
Best-in-class text and vision capabilities
Apache 2.0 license
Ministral 3 8B: Новый стандарт эффективности от Mistral AI
Выпущен 2 декабря 2025 г.
Powerful and efficient model with vision
Best-in-class text and vision at this size
Apache 2.0 license
Ministral 3 3B: Революция в Edge AI от Mistral AI
Выпущен 2 декабря 2025 г.
Tiny and efficient edge model with vision
Runs on phones, drones, and laptops
Apache 2.0 license
Amazon Nova 2: Новый стандарт в облачном ИИ
Выпущен 2 декабря 2025 г.
Amazon next-gen foundation model
Available via AWS Bedrock
Announced at re:Invent
Mistral Large 3: Открытый Frontier-модель с 41B параметров
Выпущен 2 декабря 2025 г.
Sparse MoE with 41B active parameters
Open weights
Strong reasoning and multilingual capabilities
GLM-4.7 от Zhipu AI: Новый стандарт для разработчиков
Выпущен 1 декабря 2025 г.
Open-weights model topping global coding and reasoning leaderboards
Includes GLM-4.7 Flash variant
Cost-effective compared to Western competitors
MiniMax M2.1: Открытая SOTA-модель для кодинга
Выпущен 1 декабря 2025 г.
Fully open-source SOTA coding model
230B params MoE architecture, 10B activated per token
SWE-bench score of 74.0%
92% cheaper than Western alternatives
Claude Opus 4.5: Революция в логическом мышлении ИИ
Выпущен 24 ноября 2025 г.
Exceeds Sonnet 4.5 by 4.3% using 48% fewer tokens at max effort
200K token context, 64K max output
Hybrid reasoning with instant or extended thinking
Multimodal: text, image, and audio support
20% accuracy gain, Excel and financial modeling breakthrough
OLMo 3: Революция открытого ИИ от Allen AI
Выпущен 20 ноября 2025 г.
Fully open model with weights, data, and training code
From AI2 research lab
Deep Cogito выпускает Cogito v2.1: 671B MoE для сложного рассуждения
Выпущен 19 ноября 2025 г.
Large 671B MoE reasoning model
Strong on complex reasoning tasks
Google DeepMind выпустила Gemini 3 Deep Think: Революция в логическом мышлении
Выпущен 18 ноября 2025 г.
Reasoning variant of Gemini 3
Deep chain-of-thought for complex scientific problems
Google DeepMind: Презентация Gemini 3 Pro — Революция в мультимодальных моделях
Выпущен 18 ноября 2025 г.
Over 50% improvement over Gemini 2.5 Pro
Most powerful Google model — replaces 2.5 series
1M token context window
Advanced multimodal: text, image, video, audio, code
OpenAI GPT-5.1: Адаптивное мышление и революция в кодинге
Выпущен 12 ноября 2025 г.
Family of four models with adaptive reasoning
Faster, more conversational, improved coding
Rolled out to all ChatGPT users
Moonshot AI Kimi K2.5: Новый стандарт для сложных задач
Выпущен 6 ноября 2025 г.
Upgraded Kimi model with thinking and reasoning capabilities
Amazon Nova Premier: Обзор новой флагманской модели Amazon
Выпущен 31 октября 2025 г.
Most capable Amazon model
1M context window
Multimodal capabilities
Teacher for distillation on Bedrock
Alice AI 1.0: Yandex LLM Обзор
Выпущен 28 октября 2025 г.
First major Russian-developed large language model on the global stage
From Yandex
MiniMax M2: Открытая модель с 230B параметрами и MoE-архитектурой
Выпущен 23 октября 2025 г.
Upgraded MiniMax model with improved reasoning and generation
Open weights
GLM-4.6: Новый флагман Zhipu AI для разработчиков
Выпущен 9 октября 2025 г.
First GLM model with native support for China domestic chips
Cambricon and Moore Threads support
FP8 and Int4 quantization
IBM Granite 4.0: Гибрид Mamba и Transformer для Enterprise
Выпущен 2 октября 2025 г.
IBM open enterprise model
Hybrid Mamba-2 Transformer architecture
Apache 2.0 license
Anthropic запускает Claude Haiku 4.5: Самая быстрая модель с интеллектом на грани
Выпущен 1 октября 2025 г.
Anthropic's fastest model with near-frontier intelligence
200K token context window, 64K max output
21K+ tokens per second for prompts under 32K tokens
Supports reasoning budget and effort control
Most cost-effective in the Claude family: $1/M input
DeepSeek V3.2: Открытая модель, превосходящая GPT-5
Выпущен 29 сентября 2025 г.
Further iteration on V3 series
Enhanced capabilities across all benchmarks
Open weights
Anthropic Claude Sonnet 4.5: Революция в AI-кодинге
Выпущен 29 сентября 2025 г.
Anthropic's best model for coding tasks
1M token context window (beta feature)
64K max output tokens
Strong agentic behavior and computer-use skills
Optimized for efficient coding and parallel processing
Qwen3-Next: Революция эффективности в открытых LLM от Alibaba Cloud
Выпущен 10 сентября 2025 г.
Ultra-efficient MoE from Alibaba
80B total, only 3B active parameters
Strong reasoning with minimal compute
Apache 2.0 license
Moonshot AI: Kimi K2 — Открытая модель 1T с открытыми весами
Выпущен 4 сентября 2025 г.
Massive 1T MoE model with open weights
Highly competitive with frontier models
Major Chinese AI milestone
32B activated parameters
Cost-effective: ~$0.15/M input, $2.50/M output
Strong coding performance across 32+ languages
Grok 4 Fast: Эффективный AI от xAI для разработчиков
Выпущен 1 сентября 2025 г.
98% cost reduction compared to Grok 4 Standard
40% increase in token efficiency
Real-time search integration via X
$0.20/M input, $1.50/M output
Mistral Magistral Medium 1.2: Новый стандарт мультимодального рассуждения
Выпущен 1 сентября 2025 г.
Adds vision to Magistral Medium
Multimodal frontier reasoning
Closed API only
Mistral AI Magistral Small 1.2: Мультимодальное рассуждение с открытым кодом
Выпущен 1 сентября 2025 г.
Adds vision to Magistral Small
Multimodal reasoning model
Apache 2.0 license
NousResearch Hermes 4 405B: Новый стандарт открытых моделей с контекстом 131K
Выпущен 28 августа 2025 г.
Latest in the Hermes series
Advanced function calling and structured output
Built on Llama 3.1
DeepSeek V3.1: Открытый Монолит 671B и Новый Стандарт
Выпущен 21 августа 2025 г.
Major upgrade to V3 with improved reasoning and coding
Open weights
Mistral Medium 3.1: Мультимодальный ИИ от Mistral AI
Выпущен 12 августа 2025 г.
Frontier-class multimodal model
Competitive with GPT-4o and Claude 3.5
Strong vision and reasoning capabilities
GLM-4.5V от Zhipu AI: Новый стандарт мультимодального интеллекта
Выпущен 11 августа 2025 г.
Vision-language model from Z.ai
106B parameters with strong multimodal understanding
GPT-5: Революция в Искусственном Интеллекте от OpenAI
Выпущен 7 августа 2025 г.
Next-generation flagship with major intelligence leap
400K token context window
Built-in reasoning with 4 effort levels
Multimodal: text, image, and video-based reasoning
Available in Standard, Mini, and Nano variants
OpenAI GPT-OSS: Исторический шаг в открытый исходный код
Выпущен 5 августа 2025 г.
OpenAI's first open-weight models since GPT-2
20B and 120B variants
Historic open-source move from OpenAI
Claude Opus 4.1: Новый стандарт в области логического мышления AI
Выпущен 5 августа 2025 г.
Upgrade to Claude 4 with improved coding and instruction following
200K token context window
Extended thinking support
Vision and tool calling capabilities
Claude 4.5 Sonnet: Новый стандарт для разработчиков
Выпущен 29 июля 2025 г.
Newest Anthropic model with improved creative writing
Enhanced nuance and multi-step reasoning
GLM-4.5 Air: Легковесный гигант от Zhipu AI для разработчиков
Выпущен 28 июля 2025 г.
Lightweight variant of GLM-4.5
106B MoE, efficient inference on 8x H20 GPUs
GLM-4.5 от Zhipu AI: Новый стандарт для разработчиков и инженеров
Выпущен 28 июля 2025 г.
Z.ai flagship open MoE model
355B total parameters
Strong reasoning, coding, and agentic capabilities
Claimed cheaper to run than DeepSeek
Grok 4: Новый стандарт для разработчиков от xAI
Выпущен 11 июля 2025 г.
xAI's most powerful model at the time
Major reasoning leap
Trained on expanded Colossus cluster
Google DeepMind: Gemma 3n — революция для мобильных устройств
Выпущен 26 июня 2025 г.
Efficient on-device model designed for mobile
Runs on phones and edge devices
OpenAI представила GPT-o3 Pro: Новый стандарт в области логического мышления
Выпущен 10 июня 2025 г.
Most powerful OpenAI reasoning model
Extended thinking for frontier problems
Mistral Small 3.2: Новый стандарт эффективности для разработчиков
Выпущен 10 июня 2025 г.
Update to Mistral Small 3.1
Improved instruction following and reasoning
Apache 2.0 license
Dots.LLM1: Открытый MoE-модель от Xiaohongshu, которая бросает вызов лидерам
Выпущен 6 июня 2025 г.
Open-source MoE from RedNote (China Instagram)
142B total, 14B active
Performance on par with frontier models at time of release
Magistral Small: Новый стандарт открытого reasoning модели от Mistral AI
Выпущен 5 июня 2025 г.
Mistral reasoning model with extended thinking
Strong STEM performance
Apache 2.0 license
Google DeepMind: Gemini 2.5 Pro (06-05) — Мощный прорыв в агентном ИИ
Выпущен 5 июня 2025 г.
Latest 2.5 Pro with enhanced coding, reasoning, and agentic capabilities
MiniMax-M1: Open Source LLM с контекстом 1M токенов и архитектурой Lightning Attention
Выпущен 1 июня 2025 г.
Chinese AI lab flagship with strong long-context
Lightning attention architecture
Claude Sonnet 4: Новый стандарт для разработчиков
Выпущен 22 мая 2025 г.
High-performance model balancing speed and intelligence
200K context window, 64K max output
Best model for complex agents and coding
Native tool calling and computer use
Available on free tier of Claude.ai
Claude Opus 4: Новая Эра Разумных Моделей от Anthropic
Выпущен 22 мая 2025 г.
Most powerful Anthropic model at launch
Parallel tool use, long autonomous tasks
200K token context window
Extended thinking support
Vision capabilities for image understanding
Mistral Devstral 24B: Обзор новой модели для кодинга
Выпущен 21 мая 2025 г.
Mistral dedicated coding model
Optimized for software engineering and agentic coding tasks
Apache 2.0 license
Falcon H1: Новая эра эффективных моделей от TII
Выпущен 20 мая 2025 г.
Hybrid SSM+attention architecture
Six model sizes from 0.5B to 34B
Punches above weight class on benchmarks
Apache 2.0 license
Google DeepMind представила Gemini 2.5 Flash: Обзор для разработчиков
Выпущен 20 мая 2025 г.
Cost-efficient reasoning with controllable thinking depth
#1 Chatbot Arena for speed
Mistral Medium 3: Новый фронт-тир открытый LLM от Mistral AI
Выпущен 14 мая 2025 г.
Front-tier model, competitive with GPT-4o
Strong multilingual capabilities
Apache 2.0 license
Qwen 3 от Alibaba: Новый стандарт открытых моделей с 235B параметрами
Выпущен 29 апреля 2025 г.
Excellent multilingual performance (Chinese, English, and more)
0.6B to 235B variants with hybrid thinking
119 languages supported
22B active parameters in MoE architecture
Strong coding performance
Apache 2.0 license
Zhipu GLM-4.1V: Новый стандарт в мультимодальных моделях с открытым кодом
Выпущен 25 апреля 2025 г.
Open 32B and 9B multimodal with reasoning
Competitive on vision tasks
OpenAI o4-mini: Эффективное решение для сложного кодирования и STEM
Выпущен 16 апреля 2025 г.
Efficient reasoning model
Best cost-performance for coding and STEM
OpenAI o3: Новый стандарт логического мышления в 2025 году
Выпущен 16 апреля 2025 г.
Full o3 reasoning model — successor to o1
Deep chain-of-thought capabilities
OpenAI GPT-4.1: Новый стандарт для разработчиков (2025)
Выпущен 14 апреля 2025 г.
Optimized for coding and instruction following
1M token context window
Available in Standard, Mini, and Nano variants
Nano: $0.10/M input, $0.40/M output
Llama 4: Революция Open Source AI от Meta
Выпущен 5 апреля 2025 г.
Open-weight natively multimodal models
Scout: 109B, runs on single H100 GPU, 10M token context
Maverick: 400B, requires H100 DGX system
Early fusion for native text, image, and video understanding
Google DeepMind представила Gemini 2.5 Pro: Итоговая модель 2025 года
Выпущен 25 марта 2025 г.
#1 on LMArena at launch
Built-in reasoning capabilities
1M token context window
Native code execution and Google Search grounding
Best overall model at launch
NVIDIA Nemotron Ultra: Открытый MoE-модель для сложных задач
Выпущен 18 марта 2025 г.
Open reasoning model based on Llama
253B MoE architecture
Strong enterprise tasks
Mistral Small 3.1: Новая эра открытых мультимодальных моделей
Выпущен 17 марта 2025 г.
Adds vision capabilities to Small 3.0
Multimodal, 128K context
Apache 2.0 license
Cohere Command A: 111B Открытый Модель для Предприятия
Выпущен 13 марта 2025 г.
Cohere's 111B flagship model
Enterprise RAG and agentic tasks
Multilingual capabilities
Runs on 2 GPUs
Google DeepMind Gemma 3: Мультимодальная модель 2025 года
Выпущен 12 марта 2025 г.
1B/4B/12B/27B variants
Multimodal (text+vision)
Single GPU capable, 128K context
InternLM 3: Революция в эффективных моделях от Shanghai AI Lab
Выпущен 5 марта 2025 г.
8B bilingual (English + Chinese) model with deep thinking mode
Surpasses Llama 3.1 8B and Qwen2.5 7B on reasoning/knowledge tasks
128K context, trained on 4T tokens with 75%+ cost savings
Apache 2.0 license
QwQ-32B: Новый стандарт логического мышления от Alibaba Cloud
Выпущен 5 марта 2025 г.
Dedicated reasoning model from Qwen team
Strong mathematical and logical reasoning
Apache 2.0 license
GPT-4.5: Новый стандарт для разработчиков и инженеров
Выпущен 27 февраля 2025 г.
Largest OpenAI model at the time
Focus on EQ, creativity, reduced hallucinations
Claude 3.7 Sonnet: Новый стандарт для разработчиков
Выпущен 24 февраля 2025 г.
Hybrid reasoning — toggle instant/extended thinking
Best coding model at launch
200K context window, 64K max output
Microsoft Phi-4-Mini: Открытая модель 2025 года
Выпущен 18 февраля 2025 г.
3.8B dense model outperforming 2x-size models (Phi-3.5-mini, Llama 3.2 3B)
128K context, 22 languages, function calling and tool use
Trained on 5T tokens (synthetic + filtered public data + code)
MIT license — smallest Phi model with strong reasoning
xAI Grok 3: Новый стандарт для разработчиков и инженеров
Выпущен 17 февраля 2025 г.
Trained on Colossus supercluster (100K GPUs)
Strong reasoning capabilities
DeepSeek R1: Открытая революция в логическом мышлении ИИ
Выпущен 20 января 2025 г.
Open-source reasoning model rivaling o1
Pure reinforcement learning approach
Caused global market shockwaves
671B MoE architecture
Mistral Small 3.0: Новый стандарт эффективности для разработчиков
Выпущен 15 января 2025 г.
Refreshed Small with state-of-the-art performance
Apache 2.0 license
OLMo 2 от Allen AI: Новый стандарт открытого ИИ
Выпущен 6 января 2025 г.
Truly open: weights + training data + training code + evaluation all released
7B and 13B sizes — 7B competitive with Llama 3.1 8B, 13B with Gemma 2 9B
Trained on 4T–5T tokens, 9-point MMLU increase over OLMo 1
Apache 2.0 license
2024
DeepSeek V3: Гигантский MoE за $5.5M — Новый Эпоха Открытых Моделей
Выпущен 26 декабря 2024 г.
671B MoE trained for $5.5M — matches GPT-4o/Claude 3.5 Sonnet
Revolutionized cost efficiency
Open-source on GitHub and HuggingFace
Strong coding and mathematical reasoning
Falcon 3: Новый стандарт эффективности от TII
Выпущен 17 декабря 2024 г.
1B/3B/7B/10B sizes
Enhanced multilingual and multimodal
Apache 2.0 license
Microsoft Phi-4: 14B Модель, Перевернувшая Иерархию
Выпущен 12 декабря 2024 г.
14B excelling at STEM reasoning
Outperforms much larger models on math
Gemini 2.0 Flash: Эра Агентского ИИ и Нативная Мультимодальность
Выпущен 11 декабря 2024 г.
Google's model for the agentic era with native image and audio generation
Outperforms Gemini 1.5 Pro at twice the speed
Native tool use including Google Search and code execution
Foundation for Project Astra and Project Mariner
Meta Llama 3.3: Новая Эра Эффективности в 70B
Выпущен 6 декабря 2024 г.
70B matching Llama 3.1 405B performance
Massive efficiency gain
OpenAI o1-pro: Новый стандарт логического мышления для разработчиков
Выпущен 5 декабря 2024 г.
Enhanced reasoning with more compute for complex tasks
Available in ChatGPT Pro tier
Amazon Nova: Новое поколение LLM для AWS Bedrock
Выпущен 3 декабря 2024 г.
Foundation model family: Micro/Lite/Pro/Premier
Multimodal, optimized for AWS Bedrock
Qwen2.5-Coder: Новый стандарт кодовых моделей от Alibaba Cloud
Выпущен 22 ноября 2024 г.
Code-specialized model in 6 sizes: 0.5B, 1.5B, 3B, 7B, 14B, 32B
32B variant matches GPT-4o coding ability — state-of-the-art open code LLM
Trained on 5.5T tokens (source code + text-code grounding + synthetic)
300+ programming languages, 128K context with YaRN extension
Apache 2.0 license
Pixtral Large от Mistral AI: Обзор мультимодальной модели 124B параметров
Выпущен 17 ноября 2024 г.
Mistral's large multimodal model
128K context, native image understanding at scale
Open weights
Tencent запускает Hunyuan-Large: 389B параметров и 256K контекст
Выпущен 5 ноября 2024 г.
Largest open-source Transformer-based MoE model at release
389B total parameters with 52B active per token
256K context window
Outperforms Llama 3.1 405B on benchmarks
Claude Haiku 3.5: Обзор новой модели от Anthropic
Выпущен 22 октября 2024 г.
Fast and cost-effective model
200K token context window, 8K max output
Multilingual and vision capabilities
$0.80/M input, $4/M output
Ideal for high-volume tasks like chatbots and moderation
Yi-Lightning 01.AI: Новый стандарт эффективности в 2024 году
Выпущен 16 октября 2024 г.
Ranked #6 on LMSYS Chatbot Arena at launch — #1 in China
Surpassed GPT-4o-0513 and Claude 3.5 Sonnet in overall ranking
Top-3 in Chinese, Math, Coding, and Hard Prompts categories
Founded by Kai-Fu Lee, proprietary model
Meta Llama 3.2: Обзор мультимодальной модели
Выпущен 25 сентября 2024 г.
First Llama models with vision capabilities — 11B and 90B multimodal variants
Lightweight 1B and 3B edge models for on-device deployment
128K context window, competitive with Claude 3 Haiku and GPT-4o-mini
Drop-in replacements for Llama 3.1 text models
Qwen2.5: Новый Стандарт Open-Source AI от Alibaba Cloud
Выпущен 19 сентября 2024 г.
0.5B to 72B range
SOTA open model for coding and math
18T training tokens
Apache 2.0 license
Mistral Small 2409: Обзор новой модели от Mistral AI
Выпущен 18 сентября 2024 г.
Updated Mistral Small with improved instruction following
22B parameters, Apache 2.0 license
Pixtral 12B: Обзор новой мультимодальной модели Mistral AI
Выпущен 17 сентября 2024 г.
Built on NeMo architecture with native vision support
128K context, Apache 2.0 license
OpenAI o1-preview: Революция в логическом мышлении ИИ
Выпущен 12 сентября 2024 г.
First 'reasoning' model with chain-of-thought at inference
PhD-level science and math performance
DeepSeek V2.5: Гибридная модель нового поколения
Выпущен 5 сентября 2024 г.
Merged DeepSeek-V2-Chat and DeepSeek-Coder-V2 into a single model
236B MoE with 21B active parameters, 128K context
Strong coding and general capabilities in one model
MIT license, available on HuggingFace
Jamba 1.5 от AI21 Labs: Гибрид Mamba и Transformer для длинного контекста
Выпущен 22 августа 2024 г.
Mamba-Transformer hybrid MoE
94B active, 256K context
Fastest long-context model at release
Microsoft Phi-3.5: Новый стандарт для Edge AI и мобильных устройств
Выпущен 20 августа 2024 г.
4B MoE and 3.8B variants optimized for edge devices
Phone-capable AI with 128K context window
Improved multilingual support over Phi-3
Strong reasoning for its size class
Grok-2: Революция от xAI и новый стандарт для разработчиков
Выпущен 13 августа 2024 г.
Competitive with GPT-4o and Claude 3.5 Sonnet
Available on X platform
HyperCLOVA X: Флагманская LLM от Naver с контекстом 100K
Выпущен 7 августа 2024 г.
Korean web giant Naver's flagship LLM optimized for Korean language and culture
Two sizes: HCX-L (largest) and HCX-S (lighter), built on LLaMA 2 architecture
100K context window with Korean-optimized tokenizer
Strong cross-lingual reasoning in Asian languages — Korean, Japanese, Chinese
FLUX.1: Новая эра генерации изображений от Black Forest Labs
Выпущен 1 августа 2024 г.
State-of-the-art text-to-image model from ex-Stability AI founders
12B rectified flow transformer architecture
FLUX.1 [schnell] open under Apache 2.0, [dev] non-commercial
Surpassed closed-source alternatives in image quality
Mistral Large 2: Новый стандарт открытого ИИ с 123B параметрами
Выпущен 24 июля 2024 г.
128K context, competitive with GPT-4o and Llama 3.1 405B
12 languages supported
Open weights
Meta Llama 3.1: The 405B Open-Source Benchmark
Выпущен 23 июля 2024 г.
Largest open model — 405B parameters
Matches GPT-4 on many benchmarks
128K context window
Mistral NeMo: Новый Open-Source Модель от Mistral AI и NVIDIA
Выпущен 18 июля 2024 г.
Co-built with NVIDIA, runs on a single GPU
12B parameters with 128K context window
Drop-in replacement for Mistral 7B with SOTA performance in its class
Apache 2.0 license, strong multilingual support
InternLM 2.5: Новый эталон логики от Шанхайского AI Лаборатории
Выпущен 3 июля 2024 г.
Strong reasoning from China's national lab
Competitive on math and coding
Google выпускает Gemma 2: Новый стандарт для локального ИИ
Выпущен 27 июня 2024 г.
9B and 27B sizes
Outperforms models 2x its size
Knowledge distillation from Gemini
Claude 3.5 Sonnet: Новая эра для разработчиков и инженеров ИИ
Выпущен 20 июня 2024 г.
Surpassed GPT-4o and Gemini 1.5 Pro at launch
2x faster than Claude 3 Opus at lower cost
DeepSeek Coder V2: Открытая MoE модель уровня GPT-4 Turbo
Выпущен 17 июня 2024 г.
First open MoE code model matching GPT-4 Turbo on coding
338 programming languages supported
NVIDIA Nemotron-4 340B: Новая Эра Открытых Моделей
Выпущен 14 июня 2024 г.
NVIDIA's open model for synthetic data generation
Permissive enterprise license
Qwen2: Мощная открытая модель 72B от Alibaba Cloud
Выпущен 7 июня 2024 г.
Major upgrade, 0.5B to 72B range
Competitive with Llama 3 70B
Apache 2.0 license
GLM-4 от Zhipu AI: Новый стандарт открытых моделей 9B
Выпущен 5 июня 2024 г.
128K context, 26 languages
Competitive with Llama 3 8B
Open-source GLM-4 series
Mistral AI Codestral: Новая эра для разработчиков с 22B параметрами
Выпущен 29 мая 2024 г.
Specialized code model, 80+ languages
32K context, fill-in-the-middle support
ByteDance Doubao: Открытый источник ИИ для разработчиков
Выпущен 15 мая 2024 г.
ByteDance's flagship LLM, most popular AI product in China
Available via Doubao app and Volcano Engine API
Supports 50+ application scenarios including voice, vision, and coding
Open-source Seed 1.5 variants released under permissive license
GPT-4o: Революция мультимодального ИИ от OpenAI
Выпущен 13 мая 2024 г.
'Omni' model with native audio/vision/text
2x faster, 50% cheaper than GPT-4 Turbo
Real-time voice conversation capabilities
DeepSeek V2: Новый стандарт открытых моделей с MoE архитектурой
Выпущен 7 мая 2024 г.
236B MoE with only 21B active parameters
Multi-head Latent Attention for efficiency
Open weights
Snowflake Arctic: Открытая модель MoE для корпоративных задач и SQL
Выпущен 24 апреля 2024 г.
480B MoE with 17B active parameters
Enterprise-focused, strong on SQL and coding
Apache 2.0 license
Microsoft Phi-3: Open-Source AI Revolution для Разработчиков
Выпущен 23 апреля 2024 г.
Mini/Small/Medium variants
Phi-3 Mini (3.8B) rivals Mixtral 8x7B
Phone-capable AI
Llama 3 от Meta: Революция в Open Source AI
Выпущен 18 апреля 2024 г.
Trained on 15T tokens, 8B and 70B sizes
New open-source SOTA with massive community adoption
Mixtral 8x22B: Новейшая модель с открытыми весами от Mistral AI с 176B параметрами
Выпущен 17 апреля 2024 г.
Large MoE with strong multilingual and code performance
Open weights
Command R+: 104B-параметровый языковой модель от Cohere для корпоративных решений
Выпущен 4 апреля 2024 г.
Optimized for RAG and enterprise
128K context, 10 languages
Grounded generation capabilities
Jamba 52B: Революция в архитектуре ИИ от AI21 Labs с гибридной моделью Mamba-Transformer
Выпущен 28 марта 2024 г.
First production Mamba-Transformer hybrid
256K context, novel SSM architecture
DBRX от Databricks: Открытая модель с 132B параметрами превосходит конкурентов
Выпущен 27 марта 2024 г.
Open MoE with 36B active parameters
Outperformed Llama 2 70B and Mixtral
Apache 2.0 license
Grok-1: xAI's Revolutionary 314B Parameter Open-Source Model Under Apache 2.0 License
Выпущен 17 марта 2024 г.
xAI's first open-source model
314B MoE under Apache 2.0
Largest open MoE at time of release
Claude 3 от Anthropic: революционная языковая модель нового поколения
Выпущен 4 марта 2024 г.
Haiku/Sonnet/Opus family
Opus matched GPT-4 on most benchmarks
200K context window, vision capabilities
Claude Opus 3: Первый модель Claude с расширенным мышлением от Anthropic
Выпущен 4 марта 2024 г.
First Claude Opus model with advanced reasoning
200K context window
Pioneered extended thinking capabilities
Vision and tool use support
Mistral Large: Первый флагманский коммерческий ИИ от Mistral AI
Выпущен 26 февраля 2024 г.
Mistral's first flagship commercial model
32K context, top-tier reasoning
Google DeepMind Запускает Gemma: Открытая Альтернатива для Локальных ИИ Приложений
Выпущен 21 февраля 2024 г.
Google's open-source model from Gemini research
2B and 7B sizes, strong for its class
Gemini 1.5 Pro: Историческое достижение в мультимодальных ИИ от Google DeepMind
Выпущен 15 февраля 2024 г.
1 million token context window — 10x previous record
MoE architecture, processes entire codebases
Gemini 1.0 Ultra: Google DeepMind's Revolutionary Multimodal AI Model Dominates Benchmarks
Выпущен 8 февраля 2024 г.
Most capable Gemini 1.0 model
Beat GPT-4 on 30/32 benchmarks
Powers Gemini Advanced
StableLM 2: Новый прорыв в открытых языковых моделях от Stability AI
Выпущен 6 февраля 2024 г.
Open language model in two sizes: 1.6B and 12B
Trained on 2T tokens (Falcon RefinedWeb, RedPajama, The Pile, CulturaX)
Competitive with Mistral-7B despite smaller footprint
Stability AI Community License
StarCoder 2: Открытая кодовая модель нового поколения от BigCode и ServiceNow
Выпущен 6 февраля 2024 г.
Open code LLM in 3 sizes: 3B, 7B, 15B — trained on 4T+ tokens from The Stack v2
600+ programming languages, fill-in-the-middle capability
16K context with sliding window attention
Trained on permissively licensed code only
2023
SOLAR 10.7B: Открытая модель от Upstage с рекордными результатами
Выпущен 13 декабря 2023 г.
Korean startup Upstage's open model using depth up-scaling
Topped HuggingFace Open LLM Leaderboard at release
Apache 2.0 license
Mixtral 8x7B: Революционная модель с открытым исходным кодом от Mistral AI
Выпущен 11 декабря 2023 г.
Open-source MoE matching GPT-3.5 quality with only 12.9B active params
Game-changer for open-source efficiency
Apache 2.0 license
Gemini 1.0 от Google DeepMind: прорыв в мультимодальных ИИ-моделях
Выпущен 6 декабря 2023 г.
Google's multimodal model family (Nano/Pro/Ultra)
Natively multimodal from training
Nous Hermes 2: Открытая революция в локальных ИИ моделях
Выпущен 13 ноября 2023 г.
Community fine-tuned model on Mistral/Yi
Strong at instruction following
Popular for local AI
Yi 34B: Открытая билингвальная модель от 01.AI, конкурирующая с Llama 2 70B
Выпущен 2 ноября 2023 г.
Founded by Kai-Fu Lee
Strong bilingual (English/Chinese) model
Competitive with Llama 2 70B
ChatGLM3-6B: Открытая модель от Zhipu AI с функциональными вызовами и агентскими возможностями
Выпущен 27 октября 2023 г.
Third gen GLM with function calling, code interpreter, and agent capabilities
Zephyr 7B: Открытая альтернатива закрытым моделям от HuggingFace
Выпущен 25 октября 2023 г.
Mistral 7B fine-tuned with DPO
Showed distilled alignment can match RLHF quality
Mistral 7B: Революционная модель ИИ с открытым исходным кодом, превзошедшая Llama 2 70B
Выпущен 27 сентября 2023 г.
Outperformed Llama 2 70B on all benchmarks despite being smaller
Sliding window attention
Apache 2.0 license
Qwen 72B: Alibaba Cloud's Revolutionary Open-Source Multilingual AI Model
Выпущен 25 сентября 2023 г.
Alibaba's multilingual model series
Strong on Chinese and English tasks
Open weights
WizardCoder 34B: Открытая кодинговая модель, превосходящая GPT-3.5
Выпущен 26 августа 2023 г.
Evol-Instruct tuned Code Llama
Top open-source coding model of its era
Strong on HumanEval
Code Llama 34B: Открытая модель для генерации кода от Meta AI
Выпущен 24 августа 2023 г.
Specialized Llama 2 for code generation
Supports Python, C++, Java, and more
100K context window
Llama 2: Как Meta AI Запустила Революцию в Открытых Языковых Моделях
Выпущен 18 июля 2023 г.
First truly open-weight large model for commercial use
7B/13B/70B sizes with RLHF-tuned chat variants
Founded the modern open LLM ecosystem
Claude 2 от Anthropic: революция в контекстном окне и безопасном ИИ
Выпущен 11 июля 2023 г.
200K context window
Constitutional AI approach
Strong coding and analysis capabilities
ChatGLM2: Второе поколение мощной модели Zhipu AI с улучшенной производительностью и контекстом 32K
Выпущен 25 июня 2023 г.
Second generation GLM, 32K context
42% faster inference
Stronger math and coding
Falcon 180B: Прорывной 180-миллиардный открытый LLM от TII
Выпущен 25 мая 2023 г.
Trained on 3.5T tokens of RefinedWeb
Topped the Open LLM Leaderboard
Apache 2.0 license
PaLM 2: Google's Revolutionary 340B Parameter Language Model Powers Bard and Gemini
Выпущен 10 мая 2023 г.
Google's next-gen model powering Bard/Gemini
Improved multilingual, reasoning, and coding
MPT-7B: Открытая архитектура коммерчески доступной модели с контекстом до 84K токенов
Выпущен 5 мая 2023 г.
Commercially usable open-source model
Trained on 1T tokens
Apache 2.0 license
StarCoder 15.5B: Открытая модель кодирования для разработчиков
Выпущен 4 мая 2023 г.
Open-source code LLM trained on The Stack (1T tokens, 80+ languages)
8K context window
StableLM от Stability AI: Открытая альтернатива закрытым LLM
Выпущен 19 апреля 2023 г.
Stability AI's open-source LLM family
3B and 7B sizes, trained on 1.5T tokens
CC-BY-SA license
Vicuna от LMSYS: Открытая альтернатива ChatGPT с 90% производительности
Выпущен 30 марта 2023 г.
Fine-tuned LLaMA on ShareGPT conversations
Achieved ~90% of ChatGPT quality
Launched the Chatbot Arena
Claude 1 от Anthropic: первый публичный релиз безопасной языковой модели
Выпущен 14 марта 2023 г.
Anthropic's first public model
Constitutional AI for safety
100K context window
GPT-4: Революционная мультимодальная модель от OpenAI, изменившая ИИ навсегда
Выпущен 14 марта 2023 г.
Multimodal (text + vision), passed the bar exam (90th percentile)
Massive leap in reasoning over GPT-3.5
~1.8T parameters (MoE estimated)
Alpaca от Stanford: Открытая модель с инструкциями на 52K данных
Выпущен 13 марта 2023 г.
Fine-tuned LLaMA on 52K instructions generated by GPT-3.5
Showed cheap instruction tuning works
LLaMA 1: Как 65B-модель от Meta зажгла революцию в open-source ИИ
Выпущен 24 февраля 2023 г.
Leaked weights ignited the open-source LLM revolution
Showed small models can match GPT-3
65B parameters
2022
ChatGPT: Как революционная модель OpenAI определила эпоху ИИ
Выпущен 30 ноября 2022 г.
GPT-3.5 with RLHF in a chat interface
Reached 100M users in 2 months
Defined the AI era
Flan-T5: Революция в инструкционном тюнинге от Google с 11 миллиардами параметров
Выпущен 20 октября 2022 г.
Instruction-tuned T5
Demonstrated instruction tuning dramatically improves task generalization
BLOOM: Исторический прорыв в открытой науке ИИ с первым 176B-параметрическим многоязычным LLM
Выпущен 6 июля 2022 г.
First 100B+ open-source multilingual model
Built by 1000+ researchers across 70+ countries
46 languages supported
OPT 175B: Мета раскрывает свой открытый аналог GPT-3 с полными весами
Выпущен 3 мая 2022 г.
Meta's open-source GPT-3 equivalent
Full model weights released for research
175B parameters
GPT-NeoX: Как 20-миллиардная модель от EleutherAI изменила открытый ИИ
Выпущен 14 апреля 2022 г.
EleutherAI's 20B open model
First glimpse that local LLMs could scale to GPT-3 territory
Predecessor to today open-source ecosystem
PaLM: 540B Параметров Google и Революция в Языковом Моделировании
Выпущен 4 апреля 2022 г.
540B parameter model
Breakthrough capabilities in reasoning, code, and multilingual tasks
Chinchilla от Google DeepMind: Революция в масштабировании языковых моделей
Выпущен 29 марта 2022 г.
Proved smaller models trained on more data outperform larger undertrained ones
Redefined scaling laws for LLMs
InstructGPT: Как OpenAI Революционизировал Обучение Языковых Моделей на Инструкциях
Выпущен 27 января 2022 г.
Introduced RLHF for alignment
Pioneered training models to follow human instructions safely
2021
Gopher от Google DeepMind: Революционная модель с 280 миллиардами параметров
Выпущен 8 декабря 2021 г.
280B parameter model
Extensive analysis of scaling laws across 152 tasks
OpenAI Codex: Революционная модель кодирования, изменившая разработку ПО
Выпущен 10 августа 2021 г.
GPT-3 fine-tuned on code
Powered GitHub Copilot
Proved LLMs could write functional programs
GPT-J: Первый открытый LLM с 6 миллиардами параметров для потребительского хардвара
Выпущен 9 июня 2021 г.
First open model runnable on consumer hardware
6B params, GPT-2 architecture
Widely deployed in early local AI applications
Switch Transformer от Google: Прорыв в масштабировании языковых моделей с 1.6 триллионами параметров
Выпущен 11 января 2021 г.
1.6 trillion parameter MoE model
Demonstrated efficient scaling through sparse expert routing
2020
GShard от Google: первый в истории языковой модель масштаба 600B MoE
Выпущен 30 июня 2020 г.
First Mixture of Experts model at massive scale
600B parameters for machine translation
GPT-3: Как 175-миллиардный языковой моделью OpenAI изменила ИИ навсегда
Выпущен 28 мая 2020 г.
175B parameters — demonstrated few-shot learning without fine-tuning
Sparked the modern LLM revolution
2019
T5: Как Google изменила подход к обработке естественного языка с помощью Text-to-Text Transfer Transformer
Выпущен 23 октября 2019 г.
Text-to-Text Transfer Transformer
Unified framework treating all NLP tasks as text generation
RoBERTa от Meta AI: Революционная оптимизация BERT для NLP
Выпущен 26 июля 2019 г.
Robustly Optimized BERT
Showed BERT was significantly undertrained
Achieved new SOTA with better training
XLNet: Революционная языковая модель от Google и CMU с 340 млрд параметров
Выпущен 19 июня 2019 г.
Generalized autoregressive pretraining
Outperformed BERT on 20 NLP tasks
GPT-2: Как OpenAI создала модель, которую не хотели выпускать
Выпущен 14 февраля 2019 г.
Initially withheld due to misuse concerns — "Too dangerous to release"
Showed emergent text generation quality at scale
2018
BERT от Google: Революционная модель, изменившая NLP навсегда
Выпущен 11 октября 2018 г.
Bidirectional Encoder Representations from Transformers
Revolutionized NLP benchmarks
Became the foundation for search engines
GPT-1: Как первый декодерный трансформер изменил ИИ в 2018 году
Выпущен 11 июня 2018 г.
First GPT model — decoder-only transformer
Demonstrated generative pre-training for language understanding
ELMo: Революционная модель контекстных векторных представлений от Allen AI
Выпущен 15 февраля 2018 г.
Embeddings from Language Models
Contextualized word representations using bidirectional LSTMs
2017
Transformer от Google: революционная архитектура, изменившая ИИ в 2017 году
Выпущен 12 июня 2017 г.
'Attention Is All You Need' paper introduces the Transformer architecture
The foundation of all modern LLMs