Introducción: Un Hit Histórico en el Desarrollo de IA

En un movimiento sin precedentes para el ecosistema de inteligencia artificial, Meta AI ha lanzado oficialmente Llama 4 el 5 de abril de 2025. Este lanzamiento no es simplemente una actualización incremental, sino un hito histórico que marca el punto de inflexión hacia modelos de código abierto verdaderamente capaces de procesar texto, imágenes y video de manera nativa. Para los ingenieros y desarrolladores, esto representa una oportunidad única para acceder a arquitecturas de última generación sin las barreras de entrada de los modelos propietarios cerrados.

La decisión de Meta de abrir los pesos de Llama 4 de manera nativa cambia las reglas del juego en la industria. A diferencia de versiones anteriores, Llama 4 ofrece una integración profunda de capacidades multimodales desde el nivel del modelo, permitiendo una comprensión contextual superior. Este modelo establece un nuevo estándar para la transparencia y la accesibilidad en la investigación de IA, invitando a la comunidad global a construir, auditar y mejorar sobre una base robusta y verificable.

Lanzamiento oficial: 5 de abril de 2025
Acceso abierto a los pesos del modelo
Integración nativa de texto, imagen y video
Arquitectura Mixture of Experts (MoE) avanzada

Arquitectura y Modelos: Scout y Maverick

Llama 4 se presenta en dos variantes principales diseñadas para diferentes escalas de infraestructura. El modelo Scout, con 109B de parámetros, está optimizado para ejecutarse en una sola GPU H100, ofreciendo un contexto de 10 millones de tokens. Esta versión es ideal para despliegues en la nube o entornos locales con recursos limitados pero de alta potencia.

Por otro lado, el modelo Maverick es una bestia de 400B+ parámetros que utiliza una arquitectura MoE (Mixture of Experts) para maximizar la eficiencia computacional. Maverick requiere un sistema H100 DGX para su despliegue óptimo, ofreciendo capacidades de razonamiento complejo y generación de video que superan a las versiones anteriores en tareas de fusión temprana. Esta dualidad permite a las empresas elegir entre agilidad y potencia bruta.

Scout: 109B parámetros, 1 GPU H100
Maverick: 400B+ parámetros MoE, H100 DGX
Ventana de contexto: Hasta 10M tokens
Fusión temprana de modalidades

Rendimiento y Benchmarks Técnicos

Las pruebas de rendimiento de Llama 4 demuestran una mejora significativa en tareas de razonamiento lógico y comprensión de código. En el benchmark MMLU, el modelo alcanza un 88.5%, superando a la competencia directa en preguntas de ciencias y humanidades. La capacidad de Maverick para manejar contextos largos sin degradación es notable, manteniendo una coherencia del 92% en documentos legales de 100,000 tokens.

Llama 4 de Meta: El Nuevo Estándar Abierto para IA Multimodal

Introducción: Un Hit Histórico en el Desarrollo de IA

Arquitectura y Modelos: Scout y Maverick

Rendimiento y Benchmarks Técnicos

Precios y Modelo de Acceso

Tabla de Comparación: Llama 4 vs Competidores

Casos de Uso: Aplicaciones Prácticas

Cómo Empezar con Llama 4

Comparison

Sources