Microsoft выпустила Phi-4, открытую модель на 14B параметров, которая превосходит гигантов в STEM и математике.

12 декабря 2024 года Microsoft представила Phi-4, новую открытую модель, которая ставит под сомнение традиционные представления о масштабе в искусственном интеллекте. Это не просто еще один большой язык, это инструмент, доказывающий, что эффективность может превосходить сырой объем параметров. Для разработчиков и инженеров это означает возможность развертывать мощные системы на ограниченном оборудовании без потери качества.
Модель была создана с фокусом на логическое мышление и точность, особенно в научных и технических областях. В отличие от предыдущих поколений, Phi-4 использует уникальную архитектуру, позволяющую модели «думать» только тогда, когда это необходимо, что значительно снижает затраты на вычислительные ресурсы. Это изменение парадигмы критически важно для внедрения ИИ в реальные бизнес-процессы.
Phi-4 обладает 14 миллиардами параметров, что помещается в категорию средних моделей, но с производительностью, близкой к гигантам. Архитектура модели оптимизирована для работы с контекстом и сложными задачами, используя методы, которые позволяют ей экономить токены при генерации.
Модель поддерживает мультимодальные возможности, что позволяет обрабатывать не только текст, но и визуальные данные в определенных конфигурациях. Это делает её универсальным инструментом для агентных систем, способных анализировать как код, так и изображения.
В тестовых сценариях Phi-4 демонстрирует выдающиеся результаты в области STEM (наука, технология, инженерия, математика). Модель превосходит значительно более крупные конкуренты в задачах, требующих глубокого логического вывода.
На бенчмарках MMLU (Massive Multitask Language Understanding) модель набирает 84.5%, что сопоставимо с моделями на 70B параметров. В задачах HumanEval (кодирование) показатель достигает 78.2%, что подтверждает её пригодность для разработки программного обеспечения.
Хотя модель является открыто-взвешенной, для удобного доступа через API Microsoft предлагает тарифы через Azure AI. Это позволяет инженерам интегрировать модель без необходимости настройки собственной инфраструктуры для обучения.
Стоимость использования модели рассчитывается исходя из объема токенов. Это делает её экономически эффективной по сравнению с проприетарными аналогами, особенно при больших объемах запросов.
Ниже приведено сравнение Phi-4 с другими популярными моделями на рынке, показывающее её конкурентные преимущества в контексте и стоимости.
Phi-4 идеально подходит для создания автономных агентов, которые должны выполнять сложные задачи по поиску и анализу информации. В сфере разработки она способна генерировать и отлаживать код с высокой точностью.
Также модель эффективно работает в системах RAG (Retrieval-Augmented Generation), где требуется точное извлечение информации из больших баз данных знаний без галлюцинаций.
Для начала работы с Phi-4 разработчики могут использовать стандартные библиотеки Hugging Face или SDK Azure AI. Документация доступна на официальных ресурсах Microsoft, где описаны примеры кода на Python.
Рекомендуется начать с использования предобученных весов на Hugging Face, а затем развернуть модель локально или на облачной инфраструктуре для тестирования производительности.
API Pricing — Input: 0.00025 / Output: 0.0010 / Context: 128k