Introducción: El fin de la dependencia de la nube para la IA Agéntica

El panorama de la inteligencia artificial está experimentando un cambio de paradigma. Mientras el mundo se obsesiona con modelos de billones de parámetros que requieren granjas de GPUs masivas, Liquid AI ha decidido mirar hacia donde reside la verdadera acción: el borde (edge). El lanzamiento del LFM2.5-230M el 25 de junio de 2026 marca un hito en la computación local.

Este modelo no es simplemente 'otro modelo pequeño'. Es una herramienta diseñada específicamente para la era de la IA agéntica, donde la latencia y la privacidad son críticas. Ya sea en un smartphone, un robot de servicio o un sistema de automatización doméstica, el LFM2.5-230M está diseñado para ejecutar tareas complejas sin enviar un solo bit a la nube.

Enfoque radical en la eficiencia On-Device.
Optimizado para arquitecturas CPU, NPU y GPU.
Ideal para despliegues en robótica y IoT.

Arquitectura y Especificaciones Técnicas

El LFM2.5-230M es el modelo más compacto de la familia Liquid AI hasta la fecha, pero su arquitectura es anything but small. Construido sobre la avanzada arquitectura LFM2, este modelo de 230 millones de parámetros ha sido entrenado con una escala de datos sin precedentes para su tamaño: 19 billones (19T) de tokens.

Para maximizar su capacidad de razonamiento y comprensión de contextos largos, Liquid AI ha implementado una extensión de contexto de 32K. Además, el modelo ha pasado por un proceso de post-entrenamiento mediante destilación de conocimiento desde el modelo LFM2.5-350M, lo que le permite retener capacidades cognitivas que normalmente requerirían un modelo mucho más pesado.

Parámetros: 230M.
Arquitectura: LFM2.
Pre-entrenamiento: 19T tokens.
Ventana de contexto: 32K tokens.
Método de optimización: Destilación desde LFM2.5-350M.

Rendimiento Extremo: Benchmarks de Velocidad y Eficiencia

Lo que realmente separa al LFM2.5-230M de sus competidores es su rendimiento bruto en hardware de consumo. En un Samsung Galaxy S25 Ultra (utilizando la CPU), el modelo alcanza una velocidad de decodificación de 213 tokens por segundo. Incluso en hardware mucho más limitado como una Raspberry Pi 5, logra 42 tokens por segundo, una cifra impresionante para un dispositivo de este tipo.

En términos de eficiencia de recursos, el modelo ofrece el mayor throughput de prefill y decodificación en su clase, manteniendo la huella de memoria más pequeña del mercado. Sorprendentemente, en tareas de seguimiento de instrucciones (instruction following), extracción de datos y uso de herramientas (tool use), el LFM2.5-230M compite y supera con frecuencia a modelos que tienen más del doble de su tamaño.

LFM2.5-230M: La Revolución de la IA On-Device de Liquid AI

Introducción: El fin de la dependencia de la nube para la IA Agéntica

Arquitectura y Especificaciones Técnicas

Rendimiento Extremo: Benchmarks de Velocidad y Eficiencia

Casos de Uso: De la Extracción de Datos a la Robótica Autónoma

Ecosistema de Despliegue y Disponibilidad

Conclusión: El Futuro es Local

Sources