Introducción

La comunidad de desarrollo ha recibido una noticia emocionante con el lanzamiento de StarCoder 2 por parte de BigCode y ServiceNow el 6 de febrero de 2024. Este modelo representa una evolución significativa en la generación de código basada en inteligencia artificial, ofreciendo a los desarrolladores herramientas más potentes y accesibles para acelerar su flujo de trabajo.

StarCoder 2 no es solo una actualización incremental; es una reinvención completa que aborda las limitaciones de su predecesor al tiempo que introduce capacidades sin precedentes. Con soporte para más de 600 lenguajes de programación y un contexto extendido de 16K, este modelo está diseñado específicamente para satisfacer las necesidades complejas del desarrollo moderno.

Lo que hace especialmente notable a StarCoder 2 es su compromiso con el código de licencia permisiva, lo que significa que los desarrolladores pueden utilizarlo sin preocuparse por problemas de derechos de autor. Esta característica lo convierte en una opción ideal para empresas que buscan soluciones de IA confiables y éticas.

El modelo también destaca por su naturaleza completamente de código abierto, permitiendo a la comunidad inspeccionar, modificar y adaptar el modelo según sus necesidades específicas, algo que contrasta fuertemente con muchas alternativas comerciales.

Características Clave y Arquitectura

StarCoder 2 se presenta en tres configuraciones distintas: 3 mil millones, 7 mil millones y 15 mil millones de parámetros, ofreciendo flexibilidad para diferentes casos de uso y restricciones de recursos. Cada tamaño ha sido cuidadosamente optimizado para proporcionar el mejor equilibrio entre rendimiento y eficiencia.

El modelo ha sido entrenado en más de 4 billones de tokens provenientes de The Stack v2, una colección masiva de código de licencia permisiva. Esta base de datos incluye una amplia variedad de proyectos de código abierto, lo que permite al modelo comprender patrones de codificación de alta calidad y prácticas recomendadas.

Una característica arquitectónica clave es la implementación de atención de ventana deslizante (sliding window attention) con un contexto de 16,000 tokens. Esto permite al modelo mantener el contexto durante sesiones de codificación más largas, mejorando significativamente su capacidad para comprender y generar código coherente en archivos extensos.

Además de su capacidad de generación de código tradicional, StarCoder 2 incorpora funcionalidad de 'fill-in-the-middle', lo que permite completar fragmentos de código intermedios en lugar de limitarse únicamente a la generación de continuación. Esta característica es especialmente útil para tareas como la refactorización de código existente o la inserción de nuevas funcionalidades.

StarCoder 2: La Revolución de Código Abierto con Tres Tamaños y 600+ Lenguajes

Introducción

Características Clave y Arquitectura

Rendimiento y Benchmarks

Precios API

Tabla Comparativa

Casos de Uso

Cómo Comenzar

Comparison

Sources