Skip to content
Назад к Блогу
Model Releases

Google DeepMind: Gemini 2.5 Pro (06-05) — Мощный прорыв в агентном ИИ

Новая версия Gemini 2.5 Pro предлагает окно контекста 1 млн токенов и улучшенное кодирование. Разбираем возможности модели для разработчиков.

5 июня 2025 г.
Model ReleaseGemini 2.5 Pro (06-05)
Gemini 2.5 Pro (06-05) - official image

Введение: Новый стандарт для разработчиков

Google DeepMind официально представила модель Gemini 2.5 Pro (06-05) 5 июня 2025 года. Это флагманский продукт, призванный переопределить возможности мультимодальных нейросетей в эпоху автономных агентов. Для инженеров и разработчиков это не просто обновление, а фундаментальный скачок в производительности, позволяющий решать задачи, ранее недоступные для автоматизации.

Модель позиционируется как 'thinking model', что подразумевает наличие внутреннего механизма рассуждения перед формированием ответа. Это критически важно для сложных логических цепочек и программирования. Несмотря на статус 'preview', модель уже доступна через Google Cloud Platform, открывая доступ к передовым инструментам ИИ для профессионального использования.

Важно отметить, что модель не является open-source. Она доступна исключительно через платформу Google Vertex AI и API. Это ограничивает доступность, но гарантирует стабильность и интеграцию с экосистемой Google Cloud, что ценно для крупных корпоративных проектов.

  • Дата релиза: 2025-06-05
  • Статус: Preview (Превью)
  • Тип: Closed Source (Закрытый исходный код)

Архитектура и ключевые возможности

Gemini 2.5 Pro построена на основе архитектуры Mixture of Experts (MoE), что позволяет динамически активировать только необходимые параметры для конкретной задачи. Это значительно снижает задержки и повышает энергоэффективность по сравнению с плотными моделями. Основная особенность — поддержка мультимодального ввода, включающего текст, изображения, видео и аудио в едином потоке.

Окно контекста увеличено до 1 миллиона токенов. Это позволяет модели анализировать огромные объемы данных, такие как целые репозитории кода, технические документация или многочасовые видеозаписи, без потери качества внимания к деталям. Для RAG-систем это означает возможность загружать базы знаний значительно большего размера.

Разработчики получили доступ к функциям 'thinking preview', которые позволяют видеть промежуточные шаги логического вывода модели. Это повышает доверие к результатам и упрощает отладку генераций кода или научных гипотез.

  • Контекстное окно: 1,000,000 токенов
  • Мультимодальность: Текст, Изображение, Видео, Аудио
  • Технология: MoE (Mixture of Experts)

Производительность и бенчмарки

На независимых тестах Gemini 2.5 Pro демонстрирует результаты на уровне State-of-the-Art (SOTA). На бенчмарке ARC-AGI-2 модель достигает 77.1%, что в два раза превосходит показатели предыдущих версий. Это свидетельствует о значительном улучшении способности к абстрактному логическому мышлению и решению задач, требующих глубокого понимания.

В задачах программирования модель лидирует на HumanEval и SWE-bench. Google заявляет об улучшении качества кода и снижении количества ошибок в интеграционных тестах. Однако эксперты по безопасности отмечают, что отчет по рискам, опубликованный через недели после релиза, был назван 'meager' и вызывает обеспокоенность в профессиональном сообществе.

Скорость ответа оптимизирована для агентов. Модель способна выполнять код и анализировать его результаты в реальном времени, что критично для инструментов автоматизации разработки.

  • ARC-AGI-2: 77.1%
  • SWE-bench: Top-tier performance
  • HumanEval: Улучшенный код

API ценообразование и тарифы

Стоимость использования Gemini 2.5 Pro доступна через Google Vertex AI. Для разработчиков важно понимать структуру затрат при масштабировании. Цена за входные токены составляет $12.00 за миллион, а за выходные токены — $36.00 за миллион. Это делает модель конкурентоспособной по сравнению с аналогами премиум-класса.

Существует бесплатная квота для тестирования в рамках Google Cloud Free Tier, но она ограничена небольшим количеством запросов. Для коммерческих проектов необходимо настроить бюджет и лимиты через Cloud Console. Оптимизация запросов (например, использование кэширования) может существенно снизить итоговую стоимость.

В отличие от некоторых конкурентов, здесь нет разделения на 'Flash' и 'Pro' в рамках одного аккаунта без доплат. Вы платите за модель, которую используете, что упрощает бюджетирование.

  • Вход (Input): $12.00 / 1M токенов
  • Выход (Output): $36.00 / 1M токенов
  • Платформа: Google Vertex AI

Сравнение с конкурентами

Для объективной оценки стоит сравнить Gemini 2.5 Pro с другими лидерами рынка. В таблице ниже представлены ключевые метрики. Gemini 2.5 Pro выигрывает у большинства конкурентов по размеру контекстного окна и способности к многошаговому планированию. Однако в задачах, требующих мгновенной генерации текста без глубокого анализа, конкуренты могут быть быстрее.

Claude 3.5 Sonnet остается сильным соперником в области безопасности и написания текста, но уступает в обработке видео. GPT-4o демонстрирует высокую скорость, но контекстное окно часто ограничено меньшим объемом для сложных задач.

  • Преимущество: Глубокий анализ контекста
  • Недостаток: Высокая стоимость вывода
  • Специализация: Код и Рeasoning

Сценарии использования

Gemini 2.5 Pro идеально подходит для создания автономных агентов, способных самостоятельно планировать и выполнять задачи в среде разработки. Это включает рефакторинг кода, написание тестов и деплой изменений. Интеграция с RAG-системами позволяет создавать умных помощников, работающих на базе внутренней документации компании.

В области анализа данных модель способна обрабатывать видео и аудио, извлекая ключевые метрики и создавая отчеты. Для научных исследований это открывает возможности по анализу больших массивов экспериментальных данных без необходимости ручной обработки.

Разработчики могут использовать модель для генерации архитектурных решений и проектирования баз данных, что значительно ускоряет процесс стартапа.

  • Автоматизация разработки (Coding Agents)
  • Анализ видео и аудио данных
  • Расширенные RAG системы

Начало работы

Доступ к Gemini 2.5 Pro осуществляется через Google Cloud Console. Необходимо создать проект и подключить Vertex AI SDK. Для Python используется библиотека `google-cloud-aiplatform`, которая позволяет отправлять запросы напрямую к модели.

API endpoint доступен по стандартному адресу для Vertex AI. Рекомендуется использовать асинхронные вызовы для задач, требующих больших объемов токенов, чтобы избежать блокировки соединений. Документация обновлена для новой версии 06-05.

Для локального тестирования можно использовать бесплатные квоты, но для продакшена необходимо настроить ключи API и ограничения на стоимость.

  • SDK: Python, Node.js, Go
  • Консоль: Vertex AI
  • Документация: Google AI

Comparison

Model: Gemini 2.5 Pro (06-05) | Context: 1M Tokens | Max Output: 8K Tokens | Input $/M: $12.00 | Output $/M: $36.00 | Strength: Reasoning & Coding

Model: Claude 3.5 Sonnet | Context: 200K Tokens | Max Output: 4K Tokens | Input $/M: $3.00 | Output $/M: $15.00 | Strength: Safety & Text

Model: GPT-4o | Context: 128K Tokens | Max Output: 4K Tokens | Input $/M: $5.00 | Output $/M: $15.00 | Strength: Multimodal Speed

API Pricing — Input: $12.00 / Output: $36.00 / Context: 1M Tokens


Sources

Google DeepMind Gemini 2.5 Report

Gemini 2.5 Pro Preview 06-05: Pricing & Performance

Google AI Blog: Models and Research

MSNBC: Safety Risks Report Analysis