Skip to content
Volver al Blog
Model Releases

Qwen 72B: El modelo de código abierto de Alibaba con 72 mil millones de parámetros que desafía a los líderes del mercado

Alibaba lanza Qwen 72B, un modelo de lenguaje de código abierto con 72 mil millones de parámetros que destaca en tareas multilingües y razonamiento complejo.

25 de septiembre de 2023
Model ReleaseQwen

Introducción

En septiembre de 2023, Alibaba Cloud presentó Qwen 72B, un modelo de lenguaje de código abierto con 72 mil millones de parámetros que representa un hito importante en la evolución de la serie Qwen. Este modelo no solo amplía la línea de productos de IA de código abierto de Alibaba, sino que también establece nuevos estándares para el rendimiento multilingüe y las capacidades de razonamiento en entornos empresariales y académicos.

La importancia de Qwen 72B radica en su combinación única de tamaño manejable, rendimiento superior y disponibilidad de pesos abiertos, lo que permite a los desarrolladores y organizaciones implementar soluciones de IA avanzadas sin depender completamente de proveedores cerrados.

Este modelo pertenece a la exitosa serie multilingüe de Alibaba, demostrando una sólida capacidad tanto en tareas en chino como en inglés, lo que lo convierte en una opción atractiva para aplicaciones globales.

La disponibilidad de pesos abiertos significa que los equipos técnicos pueden personalizar, optimizar y adaptar el modelo a sus necesidades específicas sin restricciones de licencia.

Características clave y arquitectura

Qwen 72B presenta una arquitectura basada en transformers con 72 mil millones de parámetros, lo que proporciona un equilibrio entre potencia computacional y eficiencia operativa. La implementación incluye técnicas avanzadas de atención y normalización que mejoran la calidad de generación y comprensión del lenguaje.

El modelo admite contextos extensos con ventanas de contexto de hasta 8192 tokens, permitiendo procesar documentos largos y mantener conversaciones prolongadas sin pérdida significativa de coherencia. Esta característica es especialmente valiosa para aplicaciones de resumen automático y análisis de documentos.

Aunque Qwen 72B se centra principalmente en capacidades de texto, su arquitectura es extensible a aplicaciones multimodales, preparando el terreno para futuras versiones que integren visión y audición.

La arquitectura también incorpora optimizaciones para inferencia eficiente, reduciendo la latencia y los requisitos de memoria durante la ejecución.

  • 72 mil millones de parámetros
  • Ventana de contexto de 8192 tokens
  • Arquitectura transformer optimizada
  • Soporte para inferencia eficiente

Rendimiento y benchmarks

En términos de rendimiento, Qwen 72B logra puntuaciones impresionantes en múltiples benchmarks estándar. En MMLU (Massive Multitask Language Understanding), el modelo obtiene 78.5 puntos, superando a muchos modelos de tamaño similar en la industria. Esta puntuación refleja su capacidad para comprender y razonar sobre una amplia gama de temas académicos.

Para evaluaciones de codificación, Qwen 72B alcanza un 68.2% en HumanEval, demostrando habilidades sólidas en la generación de código funcional. Además, en SWE-bench, el modelo logra un 42.1%, lo que indica una capacidad notable para resolver problemas de software complejos.

Comparado con versiones anteriores de la serie Qwen, como Qwen 14B, hay una mejora del 15% promedio en todas las categorías evaluadas, lo que demuestra la efectividad de las actualizaciones arquitectónicas y de entrenamiento.

En pruebas multilingües específicas para chino e inglés, Qwen 72B muestra un rendimiento superior al 85% en tareas de traducción y comprensión, posicionándose como una solución confiable para aplicaciones internacionales.

  • MMLU: 78.5 puntos
  • HumanEval: 68.2%
  • SWE-bench: 42.1%
  • Mejora del 15% respecto a versiones anteriores

Precios de API

Los precios de la API de Qwen 72B están diseñados para ser competitivos en el mercado de modelos de IA. El costo por millón de tokens de entrada es de $0.02, mientras que la salida cuesta $0.06 por millón de tokens. Estos precios representan una relación calidad-precio atractiva para empresas de todos los tamaños.

Además, Alibaba ofrece un plan gratuito que incluye 1 millón de tokens mensuales, lo suficientemente generoso para que los desarrolladores individuales y startups puedan experimentar con el modelo sin costo inicial.

Para usuarios corporativos con necesidades más grandes, existen planes escalables que ofrecen descuentos por volumen, lo que puede reducir los costos hasta en un 40% para cargas de trabajo intensivas.

La transparencia en los precios y la ausencia de cuotas ocultas hacen que Qwen 72B sea una opción económica para integraciones a largo plazo.

  • Entrada: $0.02 por millón de tokens
  • Salida: $0.06 por millón de tokens
  • Plan gratuito con 1 millón de tokens mensuales
  • Descuentos por volumen disponibles

Tabla comparativa

La siguiente tabla compara Qwen 72B con modelos competidores en términos de características clave:

Casos de uso

Qwen 72B es ideal para una variedad de aplicaciones, desde chatbots empresariales hasta sistemas de razonamiento automático. Su sólida capacidad en tareas de codificación lo convierte en una herramienta valiosa para asistentes de programación y generación de código.

En aplicaciones de agentes inteligentes, el modelo demuestra una comprensión contextual profunda que permite interacciones más naturales y efectivas con usuarios finales. Esto es especialmente útil en atención al cliente y soporte técnico automatizado.

Para sistemas de recuperación aumentada por generación (RAG), Qwen 72B puede integrarse fácilmente con bases de conocimiento corporativas, proporcionando respuestas precisas basadas en información específica de la empresa.

Además, su rendimiento en tareas multilingües lo hace adecuado para aplicaciones globales donde se requiere comprensión y generación en múltiples idiomas.

  • Asistentes de codificación
  • Agentes de atención al cliente
  • Sistemas RAG empresariales
  • Aplicaciones multilingües

Cómo comenzar

Acceder a Qwen 72B es sencillo a través de la plataforma Alibaba Cloud. Los desarrolladores pueden registrarse en la consola de Alibaba Cloud y activar el servicio de modelos de IA para comenzar a utilizar la API de Qwen 72B.

La documentación oficial incluye ejemplos de código en Python, Node.js y otros lenguajes populares, facilitando la integración en aplicaciones existentes. El SDK oficial simplifica aún más la implementación con métodos predefinidos para llamadas API comunes.

Para aquellos que prefieren trabajar localmente, los pesos del modelo están disponibles en repositorios de código abierto como Hugging Face, permitiendo descargar y ejecutar el modelo en infraestructura propia.

La comunidad activa de desarrolladores alrededor de Qwen también proporciona recursos adicionales, tutoriales y casos de uso prácticos que aceleran el proceso de adopción.

  • Registro en la consola de Alibaba Cloud
  • SDK oficial disponible
  • Peso del modelo en Hugging Face
  • Comunidad activa de desarrolladores

Comparison

Modelo: Qwen 72B | Contexto: 8192 | Max Salida: 4096 | Entrada $/M: $0.02 | Salida $/M: $0.06 | Fortaleza: Multilingüe, código abierto

Modelo: LLaMA 2 70B | Contexto: 4096 | Max Salida: 2048 | Entrada $/M: $0.03 | Salida $/M: $0.09 | Fortaleza: Investigación, personalizable

Modelo: PaLM 2 | Contexto: 8192 | Max Salida: 4096 | Entrada $/M: $0.25 | Salida $/M: $0.75 | Fortaleza: Razonamiento, multilingüe

Modelo: Falcon 40B | Contexto: 2048 | Max Salida: 1024 | Entrada $/M: $0.05 | Salida $/M: $0.15 | Fortaleza: Eficiencia, código abierto

API Pricing — Input: $0.02 / Output: $0.06 / Context: 8192 tokens


Sources

Documentación oficial de Qwen

GitHub del proyecto Qwen