Introducción: La Nueva Era de Qwen

Alibaba Cloud ha confirmado oficialmente el lanzamiento de Qwen 3 el 29 de abril de 2025, marcando un hito significativo en el ecosistema de modelos de lenguaje abiertos. Este modelo representa una evolución masiva en la eficiencia y la capacidad de razonamiento, diseñado específicamente para competir con los modelos propietarios más costosos. La decisión de mantenerlo bajo licencia Apache 2.0 asegura que las empresas y desarrolladores puedan utilizarlo sin restricciones comerciales, fomentando la innovación abierta en la industria de la IA.

En un mercado saturado de modelos cerrados, Qwen 3 se destaca por su arquitectura de Mezcla de Expertos (MoE) que permite activar solo los parámetros necesarios para cada tarea, reduciendo drásticamente el costo de inferencia sin sacrificar inteligencia. Para los ingenieros de IA, esto significa mayor control sobre el despliegue en servidores locales o en la nube, con una flexibilidad que los modelos propietarios no pueden igualar.

Fecha de lanzamiento: 29 de abril de 2025
Licencia: Apache 2.0 (Comercialmente libre)
Proveedor: Alibaba Cloud
Enfoque: Rendimiento de alto nivel y eficiencia

Características Clave y Arquitectura

La arquitectura subyacente de Qwen 3 se basa en un diseño híbrido de Mezcla de Expertos (MoE) que combina 235 mil millones de parámetros totales, con 22 mil millones de parámetros activos por token. Esta configuración híbrida permite un rendimiento de punta mientras mantiene una huella computacional manejable. El modelo ofrece variantes escalables que van desde versiones compactas de 0.6B hasta el modelo masivo de 235B, cubriendo desde dispositivos de borde hasta servidores de gran escala.

Además de la capacidad de procesamiento masivo, Qwen 3 soporta un contexto ventana expandido y capacidades multimodales integradas. El soporte multilingüe abarca 119 idiomas, lo que lo hace ideal para aplicaciones globales. La capacidad de razonamiento mejorada se integra directamente en la arquitectura, permitiendo al modelo 'pensar' antes de generar respuestas complejas, una característica crucial para tareas de programación y análisis lógico.

Parámetros Totales: 235B (MoE)
Parámetros Activos: 22B
Variantes: 0.6B a 235B
Idiomas Soportados: 119
Capacidad: Multimodal y Razonamiento Híbrido

Rendimiento y Benchmarks

En pruebas de benchmarking, Qwen 3 demuestra un rendimiento superior en comparación con versiones anteriores y competidores directos. En MMLU, el modelo alcanza puntuaciones que superan a los modelos de contexto estándar, mientras que en HumanEval y SWE-bench, su capacidad de generación de código es excepcional. Los resultados indican que la arquitectura MoE de 22B activos logra una eficiencia de token que reduce el tiempo de inferencia en un 40% comparado con modelos densos de tamaño similar.

Qwen 3: El Nuevo Modelo Open-Source de 235B Parámetros de Alibaba Cloud

Introducción: La Nueva Era de Qwen

Características Clave y Arquitectura

Rendimiento y Benchmarks

Estructura de Precios y API

Tabla de Comparación

Casos de Uso Recomendados

Cómo Empezar con Qwen 3

Comparison

Sources