Découvrez le nouveau LFM2.5-230M de Liquid AI, un modèle ultra-léger conçu pour transformer les appareils Edge, des smartphones aux robots, avec des performances dépassant largement sa taille.

Le paysage de l'intelligence artificielle connaît un tournant majeur. Alors que la course aux paramètres géants continue, Liquid AI vient de prouver que la véritable puissance réside parfois dans la compacité et l'efficacité. Le 25 juin 2026, la sortie du LFM2.5-230M marque une étape décisive pour le déploiement de l'IA 'on-device'.
Ce modèle n'est pas simplement un petit LLM de plus ; c'est un moteur conçu pour l'action. En ciblant les tâches agentiques sur des matériels aux ressources limitées, Liquid AI ouvre la voie à une intelligence véritablement intégrée dans notre quotidien, sans dépendre systématiquement du cloud.
Le LFM2.5-230M repose sur l'architecture innovante LFM2, optimisée pour une efficacité maximale. Avec seulement 230 millions de paramètres, il surprend par sa densité d'information. Ce modèle a bénéficié d'un pré-entraînement massif sur 19 trillions de tokens, garantissant une base de connaissances robuste malgré sa taille réduite.
Pour affiner ses capacités de raisonnement et de suivi d'instructions, Liquid AI a utilisé une technique de distillation à partir du modèle LFM2.5-350M. Cette approche permet de transférer l'intelligence d'un modèle plus large vers ce petit format, tout en conservant une fenêtre de contexte étendue de 32K tokens.
Les benchmarks de Liquid AI sont sans appel : le LFM2.5-230M surpasse souvent des modèles deux à trois fois plus volumineux sur des tâches critiques comme l'extraction de données, le suivi d'instructions et l'utilisation d'outils (tool use). Sur le terrain, la vitesse est phénoménale.
Lors de tests sur des architectures matérielles grand public, le modèle affiche des vitesses de décodage impressionnantes. Sur un Samsung Galaxy S25 Ultra (via CPU), il atteint 213 tokens/s, tandis qu'un Raspberry Pi 5 parvient à maintenir 42 tokens/s. Il offre le débit de prefill et de decode le plus élevé de sa catégorie sur Snapdragon Gen4 et Raspberry Pi 5, tout en minimisant l'empreinte mémoire.
L'une des démonstrations les plus frappantes est le déploiement du modèle sur un robot Unitree G1. Fonctionnant entièrement en local sur un Jetson Orin, le LFM2.5-230M agit comme une couche de sélection de compétences, décomposant des instructions en langage naturel en plans d'appels d'outils structurés.
Pour les entreprises, le modèle est un candidat idéal pour les pipelines d'extraction de données à grande échelle et les charges de travail agentiques légères. Sa faible latence en fait également un choix de premier ordre pour les services de chat interactifs sur appareils mobiles.
Liquid AI a mis un point d'honneur à assurer une compatibilité universelle. Le LFM2.5-230M est disponible sur toutes les plateformes de déploiement majeures, facilitant l'intégration immédiate dans les workflows existants des développeurs.
Pour les déploiements en production de niveau entreprise, Liquid AI propose également sa propre pile d'inférence GPU interne. Cette stack permet d'atteindre une latence de bout en bout considérablement plus basse que les autres petits modèles sur SGLang, même avec des niveaux de concurrence élevés.
Les développeurs peuvent accéder dès maintenant aux versions LFM2.5-230M et LFM2.5-230M-Base. Que vous souhaitiez tester le modèle sur votre propre matériel ou l'intégrer dans une application cloud via une stack optimisée, les ressources sont disponibles immédiatement.
Il est recommandé de commencer par l'implémentation via llama.cpp pour les tests sur matériel embarqué, ou via vLLM pour les tests de montée en charge sur serveur.