Meituan redefine los límites de la IA con LongCat-2.0, un modelo MoE de 1.6T de parámetros que supera a GPT-5.5 en benchmarks de ingeniería de software.
El 30 de junio de 2026 quedará marcado en los anales de la inteligencia artificial como el día en que el paradigma del desarrollo asistido por IA cambió para siempre. Meituan ha lanzado oficialmente LongCat-2.0, un modelo que no solo compite con los gigantes cerrados de Silicon Valley, sino que los supera en tareas críticas de ingeniería de software.
Lo que hace que este lanzamiento sea verdaderamente histórico es su naturaleza open-source. Tras haber operado bajo el nombre de Owl Alpha en OpenRouter, el modelo completo se libera hoy para la comunidad global. No estamos ante una simple actualización incremental; estamos ante un salto generacional que democratiza la capacidad de procesamiento de contextos masivos y razonamiento complejo.
LongCat-2.0 utiliza una arquitectura Mixture-of-Experts (MoE) extremadamente sofisticada. Con un total de 1.6 billones de parámetros, el modelo no activa toda su capacidad en cada paso, lo que lo hace increíblemente eficiente. En su lugar, utiliza aproximadamente 48B de parámetros activos por token, permitiendo una profundidad de conocimiento sin precedentes sin los costos computacionales prohibitivos de un modelo denso.
La verdadera magia reside en su arquitectura MOPD (Multi-Objective Parameter Distribution). El modelo organiza sus expertos en tres grupos especializados: Agentes, Razonamiento e Interacción. Mediante un enrutamiento por tareas (gate-routing), el modelo selecciona dinámicamente entre 33B y 56B de parámetros por token, implementando lo que Meituan denomina 'Zero-Compute Experts' para asegurar que no haya desperdicio de cómputo en la inferencia.
Si los benchmarks son el termómetro de la inteligencia, LongCat-2.0 está rompiendo el mercurio. En el exigente SWE-bench Pro, el modelo ha alcanzado una puntuación de 59.5, superando el 58.6 de GPT-5.5. Esto demuestra una capacidad superior para resolver problemas reales de repositorios de software, gestionando dependencias y lógica de sistemas complejos.
Su dominio se extiende a la capacidad multilingüe y de búsqueda. Con un 77.3 en SWE-bench Multilingual y puntuaciones sobresalientes en FORTE (73.2) y RWSearch (78.8), LongCat-2.0 se posiciona como la herramienta definitiva para equipos de desarrollo globales que operan en múltiples lenguajes de programación y entornos culturales.
Meituan ha diseñado una estructura de precios que favorece el uso intensivo de contextos largos, algo vital para el análisis de bases de código completas. La implementación de la tecnología de caché permite que las consultas repetitivas sobre el mismo contexto sean extremadamente económicas.
Con un costo de entrada de solo $0.75 por millón de tokens y un precio de caché de apenas $0.015, los desarrolladores pueden alimentar el modelo con repositorios enteros sin temor a que la factura se dispare. El costo de salida de $2.95 por millón de tokens es altamente competitivo para un modelo de esta escala.
Debido a su ventana de contexto de 1 millón de tokens y su especialización en razonamiento, este modelo no es solo un chat. Es un motor de ingeniería. Es ideal para el 'Repository-level Understanding', donde el modelo puede leer toda la documentación y el código de un proyecto para proponer refactorizaciones o encontrar bugs.
Además, su arquitectura de expertos lo hace perfecto para la creación de Agentes Autónomos de software. Gracias a su grupo de expertos en 'Interaction' y 'Agent', puede ejecutar comandos en terminales, navegar por la web para buscar documentación técnica y razonar sobre los resultados de forma iterativa.
Para los desarrolladores que desean probar la potencia de LongCat-2.0 de inmediato, el modelo ya está disponible a través de endpoints de API compatibles con OpenAI. También pueden acceder a él mediante plataformas como OpenRouter para pruebas rápidas de integración.
Si prefieres el despliegue local o controlado, al ser un modelo open-source, los pesos están disponibles para su descarga, permitiendo optimizaciones específicas para hardware especializado mediante frameworks de inferencia de última generación.
API Pricing — Input: 0.75 / Output: 2.95 / Context: 1000000