Разбор новой сверхкомпактной модели LFM2.5-230M от Liquid AI: как 230 миллионов параметров меняют правила игры для робототехники и мобильных агентов.

25 июня 2026 года компания Liquid AI совершила качественный скачок в области Edge AI, представив LFM2.5-230M. В то время как индустрия продолжает гонку за триллионами параметров, Liquid AI выбрала другой путь — путь экстремальной эффективности и локального исполнения. Это самая маленькая модель в линейке LFM, созданная специально для того, чтобы приносить агентские возможности (agentic tasks) непосредственно на устройства пользователя.
LFM2.5-230M — это не просто 'урезанная' версия большой модели. Это специализированный инструмент, предназначенный для работы на CPU, NPU и GPU в условиях ограниченных ресурсов. Будь то ваш смартфон, домашний робот или сетевой контроллер — эта модель готова стать 'мозгом' устройства, работая без необходимости постоянного подключения к облаку.
В основе LFM2.5-230M лежит передовая архитектура LFM2. Несмотря на скромный объем в 230 миллионов параметров, модель обладает невероятной плотностью знаний. Она прошла масштабное предварительное обучение на колоссальном датасете объемом 19 триллионов токенов, что позволяет ей демонстрировать эрудицию, сопоставимую с гораздо более крупными моделями.
Одной из ключевых особенностей является метод обучения: модель прошла процесс дистилляции (distillation) из более мощной версии LFM2.5-350M. Это позволило 'сжать' сложные паттерны рассуждений в компактный формат, сохранив при этом расширенное контекстное окно в 32K токенов, что критически важно для обработки длинных инструкций и анализа данных.
Для разработчиков Edge AI ключевым показателем является не только точность, но и throughput (пропускная способность). LFM2.5-230M демонстрирует феноменальные результаты на стандартном потребительском железе. На флагманском Samsung Galaxy S25 Ultra (используя CPU) модель достигает скорости декодирования в 213 токенов в секунду. Даже на бюджетном Raspberry Pi 5 скорость составляет внушительные 42 токена в секунду.
В сравнении с конкурентами, модель показывает лучшие результаты по prefill и decode throughput в своем классе, при этом сохраняя минимальный объем занимаемой оперативной памяти. Это делает её идеальным кандидатом для сценариев, где ресурсы системы жестко ограничены, но требуется мгновенная реакция.
Наиболее впечатляющим демонстрационным кейсом стало развертывание модели на роботе Unitree G1. Работающая полностью on-device на бортовом чипе Jetson Orin, LFM2.5-230M выполняла роль 'слоя выбора навыков' (skill-selection layer). Она декомпозировала сложные команды на естественном языке в структурированные планы вызовов инструментов (multi-step tool-call plans), обеспечивая автономность робота.
Для корпоративного сектора Liquid AI разработала внутренний стек GPU-инференса. В условиях высоконагруженных систем LFM2.5-230M показывает значительно более низкую сквозную задержку (end-to-end latency) по сравнению с другими малыми моделями при использовании SGLang, что делает её отличным выбором для пайплайнов массовой экстракции данных.
Liquid AI позаботилась о том, чтобы разработчики могли интегрировать модель в любой существующий стек. Поддержка охватывает все ключевые платформы: от мобильных и edge-устройств до серверных решений. Это обеспечивает бесшовный переход от прототипирования на ноутбуке к продакшн-решениям на железе.
Модель доступна в различных форматах, что позволяет оптимизировать её под конкретные задачи: использование GGUF через llama.cpp для edge-устройств, MLX для Apple Silicon, vLLM и SGLang для GPU-серверов, а также ONNX для кроссплатформенного развертывания.
LFM2.5-230M доказывает, что размер не всегда имеет значение, если архитектура и данные подобраны правильно. Эта модель открывает двери для создания по-настоящему умных автономных систем, которые не зависят от облачных API и обеспечивают приватность данных на уровне устройства.
Модели LFM2.5-230M и LFM2.5-230M-Base уже доступны для скачивания и тестирования. Если вы занимаетесь разработкой робототехники, IoT или мобильных приложений, это именно тот инструмент, который стоит добавить в ваш стек прямо сейчас.
API Pricing — Context: 32K