Sakana AI presenta Fugu, un sistema de orquestación multi-agente que coordina inteligencia artificial de vanguardia a través de un API compatible con OpenAI, ofreciendo un camino hacia la independencia del proveedor único.

El 22 de junio de 2026 marcó un hito histórico en la evolución de los modelos de lenguaje con el lanzamiento de Sakana Fugu por parte de Sakana AI. Este no es simplemente otro modelo de inteligencia artificial; es una transformación fundamental en cómo concebimos la coordinación de sistemas de IA complejos. Mientras que los modelos tradicionales se esfuerzan por superar a sus pares en benchmarks específicos, Fugu adopta una estrategia revolucionaria: en lugar de competir directamente, elige inteligentemente entre los modelos de vanguardia existentes para optimizar cada tarea.
Esta innovación responde a una creciente preocupación en la industria: la dependencia excesiva de proveedores únicos de IA. Con restricciones recientes como el bloqueo de Fable 5 y Mythos de Anthropic, las empresas han buscado alternativas que no comprometan su continuidad operativa. Fugu emerge como una solución elegante, no intentando reemplazar a los gigantes, sino coordinándolos de manera inteligente.
Sakana Fugu representa una arquitectura radicalmente diferente: es un modelo de lenguaje entrenado específicamente para llamar a otros LLMs en un pool de agentes. Esta capacidad de auto-orquestación incluye instancias de sí mismo llamadas recursivamente, creando un sistema dinámico que aprende cuándo delegar, cómo los agentes deben comunicarse, y cómo combinar sus salidas en una respuesta coherente. A diferencia de los sistemas con roles codificados rígidos, Fugu aprende el arte de la coordinación a través del entrenamiento.
El sistema se presenta en dos variantes distintas. La versión estándar Fugu prioriza el equilibrio entre rendimiento y latencia, ideal para tareas cotidianas de codificación, revisión y chatbots. Por otro lado, Fugu Ultra maximiza la calidad en problemas multietapa complejos, estableciéndose como la opción premium para desafíos de razonamiento avanzado. La flexibilidad de exclusión de agentes está disponible en Fugu estándar, permitiendo cumplir con requisitos de privacidad y cumplimiento, mientras que Fugu Ultra mantiene un pool fijo sin opciones de exclusión.
Los resultados de benchmarks de Fugu Ultra han causado sensación en la comunidad de IA. Según informes verificados, el sistema lidera la mayoría de los benchmarks publicados en codificación y razonamiento, superando directamente a modelos de vanguardia como Fable 5 y Mythos de Anthropic. Lo más notable es que el orquestador supera el rendimiento de los modelos individuales que coordina, demostrando que la sinergia entre múltiples agentes puede exceder la suma de sus partes.
En evaluaciones como MMLU (Massive Multitask Language Understanding), HumanEval para codificación y SWE-bench para razonamiento de ingeniería de software, Fugu Ultra ha mostrado ventajas significativas. Esta superioridad no se debe a un modelo monolítico más grande, sino a la capacidad de seleccionar dinámicamente el modelo más adecuado para cada subproblema y sintetizar sus respuestas de manera óptima. La selección de modelos por consulta permanece oculta al llamador, protegiendo la estrategia de orquestación como ventaja competitiva propietaria.
La estructura de precios de Sakana Fugu refleja su enfoque en la escalabilidad y la flexibilidad. Para consultas dentro de la ventana de contexto estándar de 272K tokens, el costo de entrada es de $5 por millón de tokens, mientras que la salida cuesta $30 por millón de tokens. Cuando se supera esta ventana de contexto, los precios aumentan a $10 para entrada y $45 para salida, reflejando el mayor costo computacional de procesamiento extendenido.
Una característica distintiva es el precio de caché. Cuando hay aciertos en caché, el costo de entrada se reduce drásticamente a $0.50 por millón de tokens (o $1.00 cuando el contexto supera 272K), permitiendo ahorros significativos en aplicaciones repetitivas. Sakana ofrece tres niveles de suscripción mensual: Standard ($20/mes), Pro ($100/mes con 10x capacidad Standard) y Max ($200/mes con 30x capacidad Standard), con una promoción de segundo mes gratuito para suscripciones antes de finales de julio de 2026.
Sakana Fugu destaca especialmente en aplicaciones que requieren razonamiento complejo y múltiples pasos de ejecución. Para desarrollo de software, el sistema puede delegar diferentes aspectos del código a modelos especializados: generación de algoritmos a uno, revisión de seguridad a otro, y optimización de rendimiento a un tercero. Esta división de responsabilidades permite resultados superiores a los obtenidos con un solo modelo monolítico.
En aplicaciones de chatbot y asistente, Fugu puede adaptar su estrategia según la naturaleza de la consulta. Preguntas técnicas complejas pueden enrutarse a modelos especializados en programación, mientras que consultas creativas van hacia modelos con fuerte capacidad lingüística. El sistema también excelente para tareas de RAG (Retrieval-Augmented Generation), donde puede coordinar la búsqueda de información, la verificación de hechos y la síntesis final de manera óptima.
Para comenzar a utilizar Sakana Fugu, los desarrolladores pueden acceder al sistema a través del endpoint de API compatible con OpenAI. Esto significa que las bibliotecas y herramientas existentes como LangChain, LlamaIndex o las SDKs oficiales de OpenAI pueden integrarse con mínimos cambios. La documentación oficial proporciona ejemplos de implementación para las variantes Fugu y Fugu Ultra.
La plataforma requiere registro para obtener credenciales de API, y se recomienda comenzar con el nivel Standard para evaluar el rendimiento en casos de uso específicos. Las aplicaciones pueden especificar explícitamente qué agentes excluir del pool para cumplir con requisitos de privacidad, aunque esta opción no está disponible para Fugu Ultra. La comunidad de desarrolladores ya ha comenzado a compartir tutoriales y mejores prácticas para aprovechar al máximo las capacidades de orquestación.
API Pricing — Input: $5 / million tokens ($10 when context > 272K) / Output: $30 / million tokens ($45 when context > 272K) / Context: 272K tokens (price step threshold)