Последние новости, туториалы и идеи об ИИ
Meta releases Llama 3.1, a 405B parameter model matching GPT-4 performance with 128K context. Developers can now deploy this milestone open-source model.

Mistral NeMo — это 12B модель, оптимизированная для работы на одном GPU с контекстом 128K и лицензией Apache 2.0.

Откройте для себя InternLM 2.5 — мощный открытый модель с 20B параметрами, превосходящий конкурентов в математике и программировании.

Gemma 2 от DeepMind предлагает 9B и 27B параметров, превосходя модели вдвое крупнее благодаря дистилляции знаний.

Anthropic представила Claude 3.5 Sonnet 20 июня 2024 года. Модель превзошла GPT-4o и Gemini 1.5 Pro, предлагая лучшее соотношение скорости и стоимости для сложных задач.

DeepSeek AI представила новую модель DeepSeek Coder V2. Это первая открытая MoE модель кодинга, которая конкурирует с GPT-4 Turbo.

NVIDIA представила Nemotron-4 340B — мощную открытую модель для генерации синтетических данных с пермиссивной лицензией.

Qwen2 предлагает мощную архитектуру 72B параметров с лицензией Apache 2.0, конкурируя с Llama 3.

Обзор новой модели GLM-4 с контекстом 128K, поддержкой 26 языков и производительностью, сопоставимой с Llama 3 8B.