GLM-5.2 de Zhipu AI: el modelo open source de 1M tokens que cambia la ingeniería con IA

GLM-5.2 es un hito histórico para el open source: un modelo de lenguaje de Zhipu AI con ventana de 1M tokens, 128K tokens de salida, licencia MIT y resultados líderes en código y razonamiento. Para desarrolladores, promete llevar agentes, RAG y análisis de repositorios completos a una nueva escala.

16 de junio de 2026

Model ReleaseGLM-5.2

Introduction

Zhipu AI, también conocida como Z.AI, lanzó GLM-5.2 el 2026-06-16, y el anuncio tiene el perfil de un punto de inflexión para el ecosistema open source. No se trata solo de otro modelo grande más: GLM-5.2 combina una ventana de contexto de 1M tokens realmente usable para ingeniería a escala de proyecto, una salida máxima de 128K tokens y una licencia MIT, lo que lo convierte en una referencia histórica para equipos que construyen agentes, herramientas de código, RAG avanzado y sistemas de razonamiento autónomo.

La importancia de GLM-5.2 está en la combinación de escala, apertura y utilidad práctica. Muchas ventanas largas han sido más un experimento que una superficie de trabajo diaria. Zhipu AI sitúa este lanzamiento como un modelo foundation flagship diseñado para ingerir repositorios completos, trazas largas, documentación extensa y flujos de agentes complejos sin perder capacidad de respuesta. Además, la disponibilidad de pesos en Hugging Face y ModelScope bajo MIT reduce la fricción para auditoría, fine-tuning, despliegue privado y experimentación.

Para ingenieros de IA, GLM-5.2 llega en un momento crítico: los modelos cerrados siguen marcando récords, pero los costes, restricciones de despliegue y dependencia de API son barreras reales. GLM-5.2 intenta cerrar esa brecha ofreciendo un modelo abierto con arquitectura optimizada para contexto largo, decoding especulativo mejorado y capacidades productivas como function calling, structured output, streaming y MCP integration.

Modelo: GLM-5.2.
Proveedor: Zhipu AI, Z.AI.
Fecha de lanzamiento: 2026-06-16.
Licencia: MIT.
Contexto anunciado: 1M tokens.
Salida máxima anunciada: 128K tokens.
Categoría: language model open source.

Key Features & Architecture

GLM-5.2 se presenta como el modelo foundation flagship de Zhipu AI para tareas de código, razonamiento y agentes. El dato arquitectónico más relevante es IndexShare, una arquitectura diseñada para reducir los FLOPs por token en contextos extremadamente largos. Según el anuncio, IndexShare reduce los FLOPs por token en 2.9x a una longitud de contexto de 1M tokens, un avance clave porque el verdadero cuello de botella de los contextos largos no es solo almacenar KV cache, sino atenderlo de forma eficiente.

El decoding también recibe una mejora importante. GLM-5.2 introduce decoding especulativo mejorado mediante MTP junto con IndexShare y KVShare, aumentando la longitud de aceptación en un 20%. Para equipos que despliegan agentes o generación larga, esto puede traducirse en menor latencia efectiva y mejor rendimiento por dólar, aunque el coste exacto de inferencia debe verificarse en la documentación oficial de Zhipu AI.

GLM-5.2 de Zhipu AI: el modelo open source de 1M tokens que cambia la ingeniería con IA

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Use Cases

Getting Started

Sources