Introduction : L'ère de l'IA omniprésente

Le paysage de l'intelligence artificielle connaît un tournant majeur. Alors que la course aux paramètres géants continue, Liquid AI vient de prouver que la véritable puissance réside parfois dans la compacité et l'efficacité. Le 25 juin 2026, la sortie du LFM2.5-230M marque une étape décisive pour le déploiement de l'IA 'on-device'.

Ce modèle n'est pas simplement un petit LLM de plus ; c'est un moteur conçu pour l'action. En ciblant les tâches agentiques sur des matériels aux ressources limitées, Liquid AI ouvre la voie à une intelligence véritablement intégrée dans notre quotidien, sans dépendre systématiquement du cloud.

Modèle le plus petit de la gamme Liquid AI
Optimisé pour CPU, NPU et GPU
Conçu pour l'automatisation domestique, la robotique et le mobile

Architecture et Spécifications Techniques

Le LFM2.5-230M repose sur l'architecture innovante LFM2, optimisée pour une efficacité maximale. Avec seulement 230 millions de paramètres, il surprend par sa densité d'information. Ce modèle a bénéficié d'un pré-entraînement massif sur 19 trillions de tokens, garantissant une base de connaissances robuste malgré sa taille réduite.

Pour affiner ses capacités de raisonnement et de suivi d'instructions, Liquid AI a utilisé une technique de distillation à partir du modèle LFM2.5-350M. Cette approche permet de transférer l'intelligence d'un modèle plus large vers ce petit format, tout en conservant une fenêtre de contexte étendue de 32K tokens.

Paramètres : 230M
Architecture : LFM2
Pré-entraînement : 19T tokens
Fenêtre de contexte : 32K tokens
Méthode : Distillation depuis LFM2.5-350M

Performances : La puissance de la compacité

Les benchmarks de Liquid AI sont sans appel : le LFM2.5-230M surpasse souvent des modèles deux à trois fois plus volumineux sur des tâches critiques comme l'extraction de données, le suivi d'instructions et l'utilisation d'outils (tool use). Sur le terrain, la vitesse est phénoménale.

Lors de tests sur des architectures matérielles grand public, le modèle affiche des vitesses de décodage impressionnantes. Sur un Samsung Galaxy S25 Ultra (via CPU), il atteint 213 tokens/s, tandis qu'un Raspberry Pi 5 parvient à maintenir 42 tokens/s. Il offre le débit de prefill et de decode le plus élevé de sa catégorie sur Snapdragon Gen4 et Raspberry Pi 5, tout en minimisant l'empreinte mémoire.

LFM2.5-230M : La révolution de l'IA On-Device par Liquid AI

Introduction : L'ère de l'IA omniprésente

Architecture et Spécifications Techniques

Performances : La puissance de la compacité

Cas d'usage : Des agents autonomes aux pipelines de données

Déploiement et Écosystème

Comment commencer ?

Sources