Введение

BigCode, коллаборативное сообщество исследователей и инженеров, представила StarCoder - одну из самых значимых открытых моделей для генерации кода в 2023 году. Выпущенная 4 мая 2023 года, StarCoder представляет собой 15.5 миллиардов параметров модели, специально оптимизированной для задач программирования и понимания кода.

Модель является результатом совместной работы между ведущими университетами, технологическими компаниями и организациями по разработке ПО с открытым исходным кодом. StarCoder демонстрирует стремление BigCode к демократизации ИИ через открытые источники и науку.

Ключевое значение этой модели заключается в её способности эффективно работать с 80+ языками программирования, что делает её универсальным инструментом для разработчиков по всему миру. Это важный шаг в сторону более доступных и ответственных ИИ-инструментов для программистов.

С поддержкой контекста до 8K токенов, StarCoder может обрабатывать сложные кодовые базы и длинные последовательности программного кода, что делает её особенно полезной для реальных сценариев разработки.

Ключевые особенности и архитектура

StarCoder основана на архитектуре decoder-only transformer с 15.5 миллиардами параметров. Модель была обучена на 1 триллионе токенов из датасета The Stack, который включает код на более чем 80 языках программирования.

Одним из ключевых аспектов архитектуры является поддержка контекста длиной до 8192 токенов (8K), что значительно превышает большинство предыдущих моделей кодирования. Это позволяет обрабатывать более длинные функции, классы и даже целые файлы без потери информации.

Модель также поддерживает возможность заполнения (infilling), что позволяет ей заполнять пропуски в существующем коде, что полезно для задач рефакторинга и автоматического завершения кода.

Архитектура оптимизирована для быстрого вывода при больших батчах, что делает её подходящей для промышленного использования в IDE и других инструментах разработки.

15.5B параметров
8K контекстное окно
Обучение на 1T токенов из The Stack
Поддержка 80+ языков программирования
Возможность заполнения (infilling)
Оптимизация для быстрого вывода

Производительность и бенчмарки

StarCoder показывает впечатляющие результаты на стандартных бенчмарках для оценки производительности генерации кода. На HumanEval, который тестирует способность модели генерировать корректный код для простых задач, StarCoder достигает 37.7% точности, что превосходит многие предыдущие открытые модели.

StarCoder 15.5B: Открытая модель кодирования для разработчиков

Введение

Ключевые особенности и архитектура

Производительность и бенчмарки

Ценообразование API

Таблица сравнения

Сценарии использования

Начало работы

Comparison

Sources