Blog
Últimas noticias, tutoriales y perspectivas sobre IA
Últimas noticias, tutoriales y perspectivas sobre IA

ByteDance presenta Doubao, un modelo LLM de código abierto con capacidades multimodales y soporte para 50+ escenarios. Descubre su arquitectura y rendimiento.

OpenAI lanza GPT-4o, un modelo nativo multimodal que redefine la interacción humano-máquina con velocidad y precisión sin precedentes.

DeepSeek AI lanza DeepSeek V2, un modelo MoE de 236B parámetros con 21B activos. Descubre su arquitectura, benchmarks y precios API.

Snowflake presenta Arctic, un modelo MoE de 480B parámetros optimizado para SQL y código bajo licencia Apache 2.0.
Microsoft lanza Phi-3, una familia de modelos de lenguaje de 14B parámetros que rivaliza con gigantes como Mixtral, diseñado para ejecutarse en dispositivos móviles y servidores locales.

Meta ha lanzado Llama 3, un modelo de 70B parámetros que establece un nuevo SOTA en código abierto y redefine la arquitectura moderna.

Mistral AI lanza Mixtral 8x22B, un modelo MoE de 176 mil millones de parámetros con pesos abiertos que destaca en tareas multilingües y generación de código.

Cohere lanza Command R+, un modelo de 104 mil millones de parámetros diseñado específicamente para aplicaciones empresariales y RAG con soporte multilingüe.
AI21 Labs lanza Jamba, el primer modelo híbrido Mamba-Transformer de 52 mil millones de parámetros con 256K de contexto y arquitectura SSM.