Moonshot AI lanza kimi-k2.7-code, un modelo de código open-source/open-weights con mejoras significativas frente a K2.6, soporte multimodal nativo y ventana de contexto de 256k tokens. Para desarrolladores, destaca por ToolCalls, JSON Mode, Partial Mode y caching automático de contexto.

El 2026-06-12, Moonshot AI publicó kimi-k2.7-code, un modelo de código open-source/open-weights diseñado para tareas de programación, razonamiento profundo y agentes de desarrollo. La noticia importa porque combina una ventana de contexto de 256k tokens, arquitectura multimodal nativa y mejoras medibles frente a K2.6 en benchmarks orientados a código.
Para equipos de ingeniería, la promesa no es solo generar snippets: es mantener repositorios grandes en contexto, razonar durante más tiempo con menos tokens internos, usar herramientas mediante ToolCalls y producir salidas estructuradas con JSON Mode. Además, los pesos están disponibles en Hugging Face, mientras que el modelo también se expone vía API y dentro de Kimi Code IDE.
kimi-k2.7-code se posiciona como un modelo code-first con soporte para long thinking y deep reasoning. Su ventana de contexto oficial es de 256k tokens, equivalente a 262.144 tokens en la ficha de API, lo que lo hace apto para análisis de repositorios, documentación técnica extensa, RAG de código y sesiones largas de agentes.
La arquitectura publicada confirma pesos open-weights, pero el conteo exacto de parámetros y la configuración MoE no se han divulgado en los datos disponibles. Lo más relevante para desarrolladores es la combinación de multimodalidad nativa, capacidades de razonamiento, ToolCalls, JSON Mode, Partial Mode y caching automático de contexto. Moonshot también anuncia un modo separado 6x High-Speed próximamente, aunque su disponibilidad y precio aún no están confirmados.
Moonshot AI reporta mejoras claras frente a K2.6: +21.8% en Kimi Code Bench v2, +11% en Program Bench y +31.5% en MLS Bench Lite. También destaca una reducción del 30% en tokens de razonamiento interno frente a K2.6, una métrica relevante para agentes que ejecutan pasos de planificación, depuración y llamadas a herramientas antes de responder.
En benchmarks públicos clásicos, los datos disponibles no publican cifras verificables de MMLU, HumanEval ni SWE-bench Verified para kimi-k2.7-code, por lo que no deben rellenarse con estimaciones. Tampoco hay una tabla oficial de comparación directa contra GPT-5.4, Claude Opus 4.6 o Gemini 2.5 Pro en el material disponible; la comparación más sólida hoy es contra K2.6 y mediante evaluaciones internas en el stack propio de cada equipo.
La tarifa verificada para kimi-k2.7-code es de $0.95 por millón de tokens de entrada, $0.19 por millón de tokens de entrada con cache hit y $4.00 por millón de tokens de salida. El contexto disponible en API es de 262.144 tokens, alineado con la ventana de 256k tokens anunciada para el modelo.
La disponibilidad de capa gratuita no está confirmada en los datos de pricing verificados, por lo que debe tratarse como N/A hasta que Moonshot AI publique condiciones específicas. La característica de precio más interesante es el cache hit, útil para RAG de repositorios, agentes de larga duración y flujos donde el mismo contexto se reutiliza muchas veces.
kimi-k2.7-code es especialmente adecuado para agentes de coding que necesitan leer grandes bases de código, planificar cambios, invocar herramientas y entregar respuestas estructuradas. Su combinación de 256k tokens, ToolCalls y JSON Mode lo hace útil para generación de código, refactorización, escritura de tests, reparación de bugs y análisis de pull requests.
También encaja bien en flujos multimodales: subir capturas de errores, diagramas de arquitectura, vídeos de reproducción de bugs o documentación escaneada junto con prompts de texto. Para RAG empresarial, el caching automático puede reducir costes cuando el mismo contexto de repositorio, tickets o documentación se reutiliza en múltiples iteraciones de agente.
Los desarrolladores pueden empezar por Hugging Face para acceder a los pesos open-weights, por la API de Moonshot AI para integrarlo en aplicaciones, o por Kimi Code IDE para probar flujos interactivos de programación. El programa beta está abierto para equipos que quieran acceso anticipado a futuras actualizaciones, incluido el modo separado 6x High-Speed.
El endpoint exacto de API y el SDK específico no están confirmados en los datos verificados proporcionados, así que conviene consultar la documentación oficial de Moonshot AI antes de integrar producción. Una ruta práctica es evaluar kimi-k2.7-code contra K2.6 con Kimi Code Bench v2, Program Bench, MLS Bench Lite, HumanEval, SWE-bench Verified y un conjunto interno de tickets reales.
API Pricing — Input: $0.95 / Output: $4.00 / Context: 262,144 tokens