Introduction

Microsoft a officiellement annoncé le lancement de Phi-3.5 le 20 août 2024, marquant une étape cruciale dans l'évolution des modèles linguistiques légers. Ce modèle open-source de 4 milliards de paramètres utilise une architecture MoE (Mixture of Experts) pour offrir des performances exceptionnelles sur des dispositifs à ressources limitées. Contrairement aux géants de l'IA nécessitant des GPU puissants, Phi-3.5 redéfinit la frontière de l'intelligence artificielle accessible sur le bord du réseau.

L'industrie de l'IA a connu une courbe de flexion significative en 2024 vers l'IA générale, mais Phi-3.5 prouve que l'efficacité ne signifie pas nécessairement des compromis majeurs. En optimisant les poids pour les appareils mobiles et les serveurs locaux, Microsoft vise à démocratiser l'accès à des capacités de raisonnement avancées sans les coûts cachés du cloud. C'est une réponse directe à la demande croissante des ingénieurs cherchant des modèles locaux performants.

Date de sortie : 20 août 2024
Licence : Open Source
Fournisseur : Microsoft

Key Features & Architecture

L'architecture repose sur une variante de 4B paramètres MoE, complétée par une version allégée de 3.8B paramètres. La fenêtre de contexte étonnante de 128K tokens permet de traiter des documents longs ou des flux de données complexes sans perte d'information contextuelle. Le support multilingue a été considérablement amélioré par rapport à la génération Phi-3 précédente, couvrant désormais des langues à faible ressource avec une précision accrue.

Les capacités multimodales sont intégrées nativement, bien que le modèle soit principalement conçu pour le texte et le code. L'optimisation pour les périphériques (edge) signifie que l'inférence peut se faire sur des smartphones de gamme moyenne. Cela réduit la latence et protège la confidentialité des données sensibles en évitant l'envoi vers des serveurs externes.

Architecture : 4B MoE et 3.8B variant
Context Window : 128K tokens
Support : Multilingue amélioré
Optimisé : Edge devices & Mobile

Performance & Benchmarks

Sur les benchmarks standards, Phi-3.5 surpasse les modèles de plus grande taille dans sa catégorie. Il atteint un score de 76% sur MMLU, 88% sur HumanEval pour le code, et 65% sur SWE-bench. Ces chiffres démontrent une capacité de raisonnement logique robuste pour sa classe de taille, surpassant souvent les modèles de 7B paramètres non optimisés.

Microsoft Phi-3.5 : Le Modèle Open Source MoE

Introduction

Key Features & Architecture

Performance & Benchmarks

API Pricing

Comparison Table

Use Cases

Getting Started

Comparison

Sources