Introduction

12 июня 2026 года Moonshot AI выпустила kimi-k2.7-code — специализированную coding model из семейства Kimi. Для разработчиков и AI-инженеров это не просто очередная модель для автодополнения: релиз делает ставку на длинные агентные сценарии, глубокое рассуждение, работу с большими репозиториями и нативную обработку текста, изображений и видео. Модель распространяется как open-weights и доступна через HuggingFace, API и Kimi Code IDE, что расширяет выбор между self-hosting, управляемым API и IDE-интеграцией.

Почему это важно: K2.6 уже задавал высокую планку для open-моделей в автономной разработке, а kimi-k2.7-code заявляет существенные улучшения именно на кодинговых бенчмарках. Главный практический сигнал — модель стала не только сильнее, но и эффективнее: по данным релиза, внутреннее рассуждение требует на 30% меньше токенов, чем у K2.6. В агентных рабочих процессах, где одна задача может порождать десятки промптов, это напрямую влияет на latency, стабильность контекста и стоимость orchestration.

Релиз: 2026-06-12.
Категория: coding model для разработки, агентов и рассуждений.
Open-weights: да, веса доступны на HuggingFace.
Каналы запуска: API, Kimi Code IDE и self-hosting через открытые веса.
Отдельный режим High-Speed с заявленным ускорением 6x ожидается отдельно.

Key Features & Architecture

По публичным материалам точное число параметров kimi-k2.7-code не раскрыто, поэтому корректно говорить о модели как open-weights, а не задавать неподтвержденный 1T, 7B или 32B. Это важно для engineering-оценки: при выборе железа ориентируйтесь на фактический размер весов, требования к VRAM, quantization и inference backend, а не только на название поколения. Для сравнения, K2.6 в публичных обзорах описывалась как модель с 1T параметров, но это не переносится автоматически на K2.7.

Архитектурно модель поддерживает long thinking и deep reasoning при 256k контекстном окне. В API pricing указан контекст 262,144 tokens — технически это и есть 256K в двоичной нотации. Нативная мультимодальная архитектура принимает text, image и video input, что полезно для генерации кода по макетам, разбора UI-видео, инспекции логов и объяснения ошибок по скриншотам. Поддерживаются ToolCalls, JSON Mode, Partial Mode и automatic context caching.

Parameters: open-weights; точное число параметров в релизных материалах не указано.
MoE: публичные архитектурные детали не раскрыты; модель оптимизирована для long thinking и deep reasoning.
Context window: 256k, или 262,144 tokens.
Modalities: text, image и video input.

Kimi K2.7 Code: открытая code-модель Moonshot AI

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Use Cases

Getting Started

Sources