Введение: Эра локального интеллекта

25 июня 2026 года компания Liquid AI совершила качественный скачок в области Edge AI, представив LFM2.5-230M. В то время как индустрия продолжает гонку за триллионами параметров, Liquid AI выбрала другой путь — путь экстремальной эффективности и локального исполнения. Это самая маленькая модель в линейке LFM, созданная специально для того, чтобы приносить агентские возможности (agentic tasks) непосредственно на устройства пользователя.

LFM2.5-230M — это не просто 'урезанная' версия большой модели. Это специализированный инструмент, предназначенный для работы на CPU, NPU и GPU в условиях ограниченных ресурсов. Будь то ваш смартфон, домашний робот или сетевой контроллер — эта модель готова стать 'мозгом' устройства, работая без необходимости постоянного подключения к облаку.

Цель: Обеспечение агентских функций на Edge-устройствах.
Применение: Робототехника, IoT, мобильные приложения.
Доступность: Open Source (LFM2.5-230M и LFM2.5-230M-Base).

Архитектура и ключевые характеристики

В основе LFM2.5-230M лежит передовая архитектура LFM2. Несмотря на скромный объем в 230 миллионов параметров, модель обладает невероятной плотностью знаний. Она прошла масштабное предварительное обучение на колоссальном датасете объемом 19 триллионов токенов, что позволяет ей демонстрировать эрудицию, сопоставимую с гораздо более крупными моделями.

Одной из ключевых особенностей является метод обучения: модель прошла процесс дистилляции (distillation) из более мощной версии LFM2.5-350M. Это позволило 'сжать' сложные паттерны рассуждений в компактный формат, сохранив при этом расширенное контекстное окно в 32K токенов, что критически важно для обработки длинных инструкций и анализа данных.

Параметры: 230M
Архитектура: LFM2
Обучение: 19T токенов (Pre-training) + Distillation от LFM2.5-350M
Контекстное окно: 32K токенов

Производительность: Скорость, которая впечатляет

Для разработчиков Edge AI ключевым показателем является не только точность, но и throughput (пропускная способность). LFM2.5-230M демонстрирует феноменальные результаты на стандартном потребительском железе. На флагманском Samsung Galaxy S25 Ultra (используя CPU) модель достигает скорости декодирования в 213 токенов в секунду. Даже на бюджетном Raspberry Pi 5 скорость составляет внушительные 42 токена в секунду.

В сравнении с конкурентами, модель показывает лучшие результаты по prefill и decode throughput в своем классе, при этом сохраняя минимальный объем занимаемой оперативной памяти. Это делает её идеальным кандидатом для сценариев, где ресурсы системы жестко ограничены, но требуется мгновенная реакция.

LFM2.5-230M: Революция Edge AI от Liquid AI — Маленькая модель с огромными амбициями

Введение: Эра локального интеллекта

Архитектура и ключевые характеристики

Производительность: Скорость, которая впечатляет

Реальные кейсы: От роботов до Enterprise

Экосистема и развертывание

Заключение и как начать

Sources