Последние новости, туториалы и идеи об ИИ

Новая open-source модель DeepSeek R1 вызвала глобальный шок на рынке, предлагая возможности, сравнимые с закрытыми системами o1, за копейки.

Mistral AI выпустила Mistral Small 3.0 с 24B параметрами и лицензией Apache 2.0. Модель демонстрирует SOTA результаты в бенчмарках и доступна для коммерческого использования.

Allen AI представила OLMo 2 с полностью открытыми весами и данными. Модель 7B/13B конкурирует с Llama 3.1 и Gemma 2.

DeepSeek V3 представляет собой исторический прорыв в индустрии ИИ. Модель с 671B параметрами, обученная всего за $5.5M, превосходит конкурентов и доступна бесплатно.

Falcon 3 — это мощная открытая модель 10B параметров от TII, предлагающая улучшенную многозадачность и лицензию Apache 2.0.

Microsoft выпустила Phi-4, открытую модель на 14B параметров, которая превосходит гигантов в STEM и математике.

Google DeepMind представила Gemini 2.0 Flash — модель для эры агентов с нативной генерацией изображений и аудио. Скорость в два раза выше Gemini 1.5 Pro.

Meta представила Llama 3.3, которая превосходит 405B модель по эффективности. Разбор архитектуры, цен и бенчмарков.

OpenAI представила o1-pro, модель с усиленным вычислительным ресурсом для решения сложных задач. Доступна в тарифе ChatGPT Pro.