Actualités, tutoriels et perspectives sur l'IA

Découvrez DeepSeek V2, le modèle MoE open-source qui redéfinit l'efficacité avec 21B paramètres actifs et une architecture Multi-head Latent Attention.

Découvrez Snowflake Arctic, un modèle MoE de 480B paramètres optimisé pour SQL et le code. Une analyse technique complète.
Découvrez comment Phi-3 de Microsoft redéfinit l'efficacité avec des performances surprenantes sur des architectures compactes, rivalisant avec des modèles bien plus grands.

Meta lance Llama 3, un modèle open-source de pointe entraîné sur 15T tokens. Découvrez les specs, les benchmarks et l'intégration pour les développeurs.

Découvrez Mixtral 8x22B, le dernier modèle ouvert de Mistral AI avec 176 milliards de paramètres MoE, offrant des performances exceptionnelles en multilinguisme et en programmation.

Découvrez Command R+, le modèle open-source de 104B paramètres de Cohere optimisé pour les applications RAG et les déploiements enterprise.
Découvrez le nouveau modèle open-source de 52 milliards de paramètres de AI21 Labs, combinant les architectures Mamba et Transformer avec une fenêtre de contexte de 256K.

Découvrez DBRX, le modèle ouvert de Databricks avec 132 milliards de paramètres MoE et 36B actifs qui dépasse Llama 2 70B et Mixtral.

xAI dévoile Grok-1, le plus grand modèle d'expertise mixte open source avec 314 milliards de paramètres, sous licence Apache 2.0.