Sakana AI dévoile Sakana Fugu, un système d'orchestration multi-agent révolutionnaire qui coordonne intelligemment plusieurs LLMs derrière une API compatible OpenAI, offrant une alternative novatrice face à la dépendance fournisseur unique.

Le 22 juin 2026 marque une date clé dans l'histoire de l'intelligence artificielle avec le lancement de Sakana Fugu par Sakana AI. Ce système d'orchestration multi-agent représente une rupture majeure dans la manière dont les modèles de langage sont conçus et déployés, introduisant une approche entièrement nouvelle pour atteindre les performances frontier à moindre coût.
Contrairement aux modèles traditionnels qui tentent de tout faire en interne, Fugu adopte une stratégie radicalement différente : il s'agit d'un modèle de langage entraîné spécifiquement pour appeler et coordonner d'autres LLMs au sein d'un pool d'agents. Cette architecture révolutionnaire permet à Fugu de surpasser les modèles individuels qu'il orchestre, créant un effet synergique qui redéfinit les limites du possible en IA générative.
Sakana Fugu se distingue par son architecture d'orchestration intelligente. Le système est disponible en deux variantes distinctes : Fugu, optimisé pour un équilibre performance/faible latence adapté au codage quotidien, aux revues de code et aux chatbots ; et Fugu Ultra, conçu pour maximiser la qualité sur les problèmes complexes multi-étapes. Le modèle Fugu Ultra porte l'ID fugu-ultra-20260615.
L'architecture repose sur un apprentissage profond de la coordination plutôt que sur des rôles prédéfinis. Fugu apprend par lui-même quand déléguer les tâches, comment les agents communiquent entre eux, et comment combiner leurs sorties pour produire une réponse cohérente et précise. Il peut même s'appeler récursivement, créant des boucles d'orchestration sophistiquées pour les défis les plus ardus.
Les résultats de benchmark placent Fugu Ultra en tête de liste sur la plupart des évaluations de codage et de raisonnement publiées. Le système orchestreur a démontré sa capacité à surpasser les modèles individuels qu'il coordonne, atteignant des scores qui rivalisent avec les meilleurs modèles frontier tels que Fable 5 et Mythos de Anthropic. Cette performance exceptionnelle s'explique par la sélection optimale des modèles et la synthèse intelligente des réponses.
Sur MMLU (Multi-choice Multi-task Language Understanding), Fugu Ultra atteint un score de 92,3%, dépassant Claude Mythos Preview (91,8%) et Fable 5 (90,9%). Le HumanEval score atteint 94,2%, positionnant le modèle parmi les meilleurs sur les tâches de génération de code. Sur SWE-bench, la performance de 87,6% établit un nouveau standard pour les systèmes multi-étapes.
Le système de tarification de Sakana Fugu reflète sa philosophie d'optimisation coûts-performance. Pour les requêtes dans la fenêtre de contexte standard (≤272K tokens), le prix d'entrée est de $5 par million de tokens, avec un prix de sortie de $30 par million de tokens. Les lectures depuis le cache sont fortement incitées à $0,50 par million de tokens pour l'entrée.
Lorsque la fenêtre de contexte dépasse 272K tokens, les prix augmentent respectivement à $10 et $45 pour les tokens d'entrée et de sortie. Cette structure tarifaire encourage l'utilisation efficace des ressources tout en maintenant un accès abordable aux performances frontier. Les trois niveaux d'abonnement mensuel offrent flexibilité : Standard à $20/mois, Pro à $100/mois (10x Standard), et Max à $200/mois (30x Standard).
Sakana Fugu excelle particulièrement dans les applications nécessitant une combinaison subtile de raisonnement, de génération de code et de compréhension contextuelle approfondie. Le modèle Fugu standard est idéal pour le développement quotidien, la revue de code automatisée et les assistants conversationnels nécessitant une réponse rapide et précise. Sa compatibilité Codex en fait un choix privilégié pour les environnements de développement existants.
Fugu Ultra vise les défis les plus complexes : résolution de problèmes multi-étapes, analyse approfondie de code legacy, et tâches de raisonnement nécessitant une synthèse de multiples sources d'information. L'option de désactivation sélective d'agents dans le pool répond aux exigences de conformité et de confidentialité des données, permettant aux entreprises de maintenir leur souveraineté sur les données sensibles.
Pour commencer à utiliser Sakana Fugu, les développeurs peuvent accéder au système via l'API compatible OpenAI. L'endpoint principal pour Fugu Ultra est accessible avec le modèle ID 'fugu-ultra-20260615'. Les SDK officiels sont disponibles sur le portail développeur de Sakana AI, avec des bibliothèques supportées pour Python, JavaScript, et Go.
L'intégration se fait en modifiant simplement l'endpoint de base dans votre code existant. Par exemple, en Python avec l'OpenAI SDK : client = OpenAI(base_url='https://api.sakana.ai/v1', api_key='votre-clé'). Les documentation complètes et les exemples de code sont disponibles sur docs.sakana.ai, avec un programme bêta ouvert aux développeurs inscrits.
API Pricing — Input: $5 / million tokens ($10 when context > 272K) / Output: $30 / million tokens ($45 when context > 272K) / Context: 272K tokens (price step threshold)