Introducción: Una Revolución en el Código Abierto

En una fecha marcada como histórica para la inteligencia artificial, el 16 de diciembre de 2025, Allen AI ha desbloqueado el futuro de la computación multimodal con el lanzamiento de Molmo 2. Este modelo representa un salto cualitativo significativo en la accesibilidad de las tecnologías de vanguardia, rompiendo las barreras tradicionales de licencias restrictivas que han dominado el sector durante años. Para los ingenieros y desarrolladores, esto significa que la innovación ya no está encerrada en cajas negras propietarias, sino que es una herramienta tangible para construir soluciones personalizadas.

La relevancia de Molmo 2 radica en su enfoque radicalmente abierto. A diferencia de muchos competidores que retienen sus pesos o limitan el uso comercial, Allen AI ha liberado no solo los pesos del modelo, sino también los datos de entrenamiento y el código fuente completo. Esta transparencia permite a la comunidad auditar el modelo, mejorar su eficiencia y adaptar su arquitectura para casos de uso específicos sin miedo a violaciones de licencia. Es una declaración de intenciones clara sobre el futuro de la IA: colaborativa y accesible.

Desde el lanzamiento inicial, la comunidad técnica ha comenzado a integrar Molmo 2 en pipelines de producción, validando su estabilidad y rendimiento. El modelo ha sido diseñado para ser un pilar fundamental en aplicaciones que requieren comprensión visual y lingüística simultánea, desde análisis de documentos complejos hasta la generación de código basado en diagramas. La apertura total fomenta una ecosistema donde la mejora continua es impulsada por miles de contribuidores globales.

Lanzamiento oficial el 16 de diciembre de 2025.
Desarrollado por Allen Institute for AI (AI2).
Licencia MIT para uso comercial y académico.

Características Clave y Arquitectura

Molmo 2 está construido sobre una arquitectura de 8 mil millones de parámetros, optimizada para equilibrar potencia computacional con eficiencia en inferencia. Utiliza una estructura Mixture of Experts (MoE) que permite activar solo los sub-redes necesarias para cada tarea específica, reduciendo significativamente el consumo de memoria durante el despliegue. Esta ingeniería interna es crucial para permitir que servidores con recursos limitados ejecuten modelos de gran escala sin comprometer el rendimiento en tiempo real.

El modelo cuenta con una ventana de contexto nativa de 128,000 tokens, lo que lo hace ideal para procesar documentos legales, repositorios de código extensos o videos de larga duración. Su capacidad multimodal es integral, integrando visión computacional y procesamiento de lenguaje natural en un solo pipeline unificado. Esto elimina la necesidad de orquestar múltiples modelos separados, simplificando la arquitectura de la aplicación y reduciendo la latencia en la respuesta.

Molmo 2: El Nuevo Estándar Multimodal Abierto de Allen AI

Introducción: Una Revolución en el Código Abierto

Características Clave y Arquitectura

Rendimiento y Benchmarks

API Pricing y Disponibilidad

Tabla Comparativa de Modelos

Section 6

Casos de Uso Recomendados

Cómo Empezar con Molmo 2

Conclusión y Próximos Pasos