Introducción

Google DeepMind ha anunciado oficialmente la liberación de Gemma 2 el 27 de junio de 2024. Este lanzamiento marca un hito significativo en el ecosistema de modelos de lenguaje de código abierto, posicionándose como una alternativa robusta a los modelos propietarios cerrados.

A diferencia de sus predecesores, Gemma 2 ofrece una mejora sustancial en la eficiencia y el rendimiento cognitivo, diseñada específicamente para ser accesible tanto en entornos de borde como en centros de datos. Los desarrolladores pueden ahora acceder a una herramienta de vanguardia que compite directamente con los modelos propietarios más grandes.

La importancia de este modelo radica en su transparencia y en la capacidad de permitir a la comunidad de investigación auditar y mejorar las capacidades de la IA de manera colaborativa.

Fecha de lanzamiento: 27 de junio de 2024
Licencia: Apache 2.0
Proporcionado por: Google DeepMind

Características Clave y Arquitectura

La familia de modelos incluye versiones de 9B y 27B parámetros, ofreciendo un equilibrio entre capacidad de razonamiento y recursos computacionales. Utiliza técnicas avanzadas de distilación de conocimiento desde Gemini para maximizar la eficiencia del aprendizaje.

La versión de 27B emplea una arquitectura MoE (Mixture of Experts) para reducir el costo computacional durante la inferencia. Esto permite un despliegue más eficiente en hardware limitado sin sacrificar la calidad de las respuestas generadas.

El contexto ventana se ha optimizado para manejar tareas complejas de manera fluida, integrando capacidades multimodales que facilitan el procesamiento de datos diversos en aplicaciones reales.

Tamaños: 9B y 27B parámetros
Arquitectura: Mixture of Experts (MoE)
Ventana de contexto: 8192 tokens
Base de conocimiento: Distilación de Gemini

Rendimiento y Benchmarks

Gemma 2 supera a modelos dos veces más grandes en benchmarks estándar como MMLU y HumanEval, demostrando una eficiencia de rendimiento excepcional. En pruebas de código, el modelo muestra una precisión superior en tareas de generación y depuración.

Las puntuaciones en SWE-bench confirman su capacidad para resolver problemas de software reales, mientras que las evaluaciones en GPQA validan su conocimiento experto en dominios científicos complejos. Estos resultados son críticos para la adopción empresarial.

Gemma 2 de Google DeepMind: El Nuevo Estándar de IA Abierta

Introducción

Características Clave y Arquitectura

Rendimiento y Benchmarks

Precios y Disponibilidad

Tabla Comparativa

Casos de Uso

Cómo Empezar

Comparison

Sources