Introduction

Google DeepMind a officiellement annoncé la sortie de Gemma 2 le 27 juin 2024, marquant une étape cruciale dans l'accessibilité de l'intelligence artificielle avancée pour les développeurs. Ce nouveau modèle open-source permet aux chercheurs et ingénieurs d'auditer, modifier et déployer les poids du modèle sans restrictions majeures. Cette transparence favorise l'innovation collaborative et la confiance dans les systèmes d'IA générative.

Contrairement aux modèles fermés propriétaires, Gemma 2 offre une alternative puissante pour les applications locales et cloud. La disponibilité des versions 9B et 27B permet d'adapter le modèle aux contraintes matérielles variées, des serveurs haute performance aux environnements de développement plus restreints. Cette approche démocratise l'accès à des capacités de raisonnement de pointe.

L'objectif principal de cette release est de combler le fossé entre la recherche académique et les applications industrielles réelles. En fournissant des modèles performants sous licence Apache 2.0, Google encourage l'écosystème open-source à s'épanouir autour de ces architectures. Les développeurs peuvent désormais construire des solutions sur mesure sans dépendre exclusivement des API payantes.

Date de sortie : 27 juin 2024
Licence : Apache 2.0
Accès : Poids ouverts sur Hugging Face

Key Features & Architecture

L'architecture de Gemma 2 repose sur des tailles de paramètres de 9B et 27B, conçues pour offrir un équilibre optimal entre performance et efficacité. Le modèle utilise une distillation de connaissances avancée provenant de Gemini pour optimiser les capacités d'inférence. Cette technique permet de transférer la sagesse du modèle parent vers une architecture plus légère tout en conservant la précision.

Gemma 2 intègre une fenêtre de contexte étendue pour gérer des documents longs et des flux de conversation complexes. Les capacités multimodales sont renforcées pour le traitement de données textuelles et contextuelles. L'architecture est optimisée pour fonctionner efficacement sur des infrastructures hétérogènes, du cloud aux machines locales.

Les fonctionnalités clés incluent un support natif pour le raisonnement agentic, permettant aux modèles de planifier et d'exécuter des tâches séquentielles. L'optimisation pour l'infrastructure locale et cloud assure une flexibilité maximale pour les déploiements. La licence Apache 2.0 garantit un usage commercial libre sans restrictions de propriété intellectuelle.

Tailles : 9B et 27B paramètres

Gemma 2 de Google DeepMind : La Nouvelle Référence Open-Source

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Comparison Table

Use Cases

Getting Started

Comparison

Sources