Introducción

Anthropic ha revelado oficialmente el lanzamiento de Claude 4.5 Sonnet el 29 de julio de 2025. Este modelo representa un salto significativo en la arquitectura de los LLMs modernos, enfocándose específicamente en la mejora de la escritura creativa y el razonamiento de múltiples pasos. A diferencia de sus predecesores, esta versión prioriza la precisión en contextos complejos.

Los ingenieros de IA han observado mejoras sustanciales en la coherencia lógica durante pruebas internas. La capacidad de mantener el hilo narrativo en documentos extensos es ahora un punto fuerte clave. Esto permite a los desarrolladores utilizar el modelo para tareas que requieren una comprensión profunda y sostenida.

El modelo no es de código abierto, lo que lo posiciona como una solución empresarial premium. Sin embargo, su rendimiento en tareas de razonamiento lo hace indispensable para flujos de trabajo críticos que demandan alta fiabilidad y seguridad en la generación de contenido técnico.

Lanzamiento oficial: 29 de julio de 2025
Proveedor: Anthropic
Categoría: Modelo de Lenguaje
Open Source: No

Características Clave y Arquitectura

La arquitectura subyacente utiliza una estructura MoE (Mixture of Experts) avanzada. Esto permite que el modelo active solo los parámetros necesarios para cada tarea específica, optimizando el uso de recursos computacionales y reduciendo la latencia durante la inferencia.

La ventana de contexto se ha expandido considerablemente, permitiendo el procesamiento de hasta 200,000 tokens en una sola sesión. Esta característica es vital para la implementación de RAG y análisis de código completo sin necesidad de recortes.

Además, las capacidades multimodales han sido refinadas para interpretar gráficos y diagramas de flujo. La integración con entornos de desarrollo es más fluida que nunca, permitiendo una interacción directa con IDEs modernos.

Ventana de contexto: 200,000 tokens
Arquitectura: Mixture of Experts (MoE)
Capacidad: Multimodal y de Códig
Razonamiento: Multi-paso mejorado

Rendimiento y Benchmarks

En pruebas de HumanEval, el modelo alcanza un 92% de precisión, superando a competidores directos. Esto confirma su estatus como el mejor modelo de codificación del mercado según las afirmaciones de Anthropic.

El puntaje en MMLU ha subido a 89%, demostrando una comprensión superior en ciencias y humanidades. Esto indica que el modelo puede manejar consultas complejas que requieren conocimiento general y específico.

Claude 4.5 Sonnet: El Nuevo Estándar en Codificación y Razonamiento

Introducción

Características Clave y Arquitectura

Rendimiento y Benchmarks

API y Precios

Tabla de Comparación

Casos de Uso

Cómo Empezar

Comparison

Sources