Introducción: Un Hito Histórico para el Open Source

Google DeepMind ha marcado un hito histórico con el lanzamiento de Gemma 4, una nueva generación de modelos diseñada específicamente para el razonamiento avanzado y los agentes de IA. Esta familia de modelos representa la evolución más significativa de la serie open source de la compañía, construida directamente sobre la investigación propietaria de Gemini 3. A diferencia de versiones anteriores, Gemma 4 no es solo una mejora incremental; es un cambio de paradigma hacia la accesibilidad comercial y la eficiencia en hardware local.

La decisión de liberar estos modelos bajo la licencia Apache 2.0 es crucial para el ecosistema de IA global. Esto permite a los desarrolladores utilizar los modelos para cualquier propósito, incluidos los comerciales, sin las restricciones de atribución o prohibiciones de uso que suelen acompañar a los modelos propietarios. En un momento donde otros laboratorios están reduciendo su apertura, Google se posiciona como el líder en democratización de la inteligencia artificial de frontera.

El lanzamiento oficial se produjo el 2 de abril de 2026, ofreciendo una suite completa de modelos que van desde dispositivos móviles hasta centros de datos. Esta iniciativa busca facilitar el despliegue de IA en entornos edge, permitiendo que la tecnología de punta llegue a usuarios finales sin depender exclusivamente de la nube centralizada.

Basado en investigación Gemini 3.
Licencia Apache 2.0 para uso comercial.
Lanzamiento oficial: 2026-04-02.

Características Clave y Arquitectura

La arquitectura de Gemma 4 ofrece cuatro variantes para cubrir todo el espectro de hardware disponible en el mercado actual. Desde modelos de borde (E2B, E4B) hasta modelos densos de alto rendimiento (26B MoE, 31B Dense), cada versión está optimizada para diferentes necesidades de latencia y consumo energético. Lo más destacado es el soporte nativo multimodal, permitiendo el procesamiento de texto, imágenes y audio sin necesidad de pipelines externos complejos.

La ventana de contexto nativa de hasta 256K tokens es una ventaja competitiva significativa, permitiendo a los desarrolladores cargar documentos extensos o mantener conversaciones largas sin perder coherencia. Además, el soporte para más de 140 idiomas garantiza que las soluciones de IA sean verdaderamente globales y accesibles para mercados emergentes.

En términos de eficiencia, el modelo 26B MoE (Mixture of Experts) activa solo 3.8B parámetros durante la inferencia, reduciendo drásticamente el costo computacional. Esta característica es vital para el despliegue en dispositivos móviles y servidores de bajo consumo, manteniendo un rendimiento comparable a modelos densos mucho más grandes.

Google DeepMind lanza Gemma 4: El Futuro del Open Source en IA

Introducción: Un Hito Histórico para el Open Source

Características Clave y Arquitectura

Rendimiento y Benchmarks

API Pricing y Disponibilidad

Tabla Comparativa

Casos de Uso

Cómo Empezar

Comparison

Sources