- Enfocado en programación y agentes: mejoras en código, uso de ordenador y autonomía prolongada.
- Resultados punteros en pruebas como SWE-bench Verified (77,2%) y OSWorld (61,4%).
- Herramientas para desarrolladores: Claude Code con checkpoints, extensión nativa para VS Code y Agent SDK.
- Disponible en Claude.ai, con integración en nubes y precios desde 3$/M tokens de entrada.

Anthropic mueve ficha con Claude Sonnet 4.5, una iteración que pone todo su empeño en la programación, los agentes y el uso práctico del ordenador. La compañía presenta además un conjunto de herramientas y flujos de trabajo pensados para que equipos técnicos puedan apoyarse en la IA durante jornadas reales de desarrollo.
En la familia de modelos de Anthropic, Sonnet siempre ha buscado el equilibrio entre rendimiento y coste. Esta versión 4.5 quiere dar un paso más y, con datos sobre la mesa, apunta a consolidarse como el asistente de código más solvente de la casa, con la declarada ambición de ser la mejor IA de programación del mundo.
Qué aporta Claude Sonnet 4.5 a la programación

En pruebas públicas, Sonnet 4.5 ha logrado un 77,2% en SWE-bench Verified, un benchmark que evalúa la resolución de incidencias reales desde repositorios de código. También marca 61,4% en OSWorld (tareas de escritorio en escenarios reales), un salto notable frente al 42,2% de su versión previa, además de un 92% en un test financiero orientado a desempeño de analista junior.
La nueva iteración mejora la capacidad de trabajar durante más de 30 horas en proyectos complejos manteniendo coherencia, algo clave cuando se refactorizan bases de código grandes o se encadenan tareas de varios pasos. Además, admite salidas de hasta 64.000 tokens, lo que abre la puerta a planes detallados y bloques extensos de código sin trocear tanto el trabajo.
Aunque los benchmarks son una referencia útil, conviene usarlos con cautela: existe el riesgo de sobreajuste a las pruebas o de comparativas no homogéneas. Con todo, desarrolladores independientes han señalado que esta versión ofrece una experiencia muy sólida para programar, con respuestas más estables y menos divagaciones cuando el contexto se alarga.
En el día a día, Sonnet 4.5 mejora el manejo de hojas de cálculo, navegación web y tareas de escritorio, integradas en extensiones como la de Chrome. Desde la conversación es posible crear documentos, presentaciones o archivos directamente, lo que reduce saltos entre herramientas cuando hay que producir entregables rápidos.
Para desarrolladores, Claude Code evoluciona con funciones prácticas: checkpoints guardados, restauración de versiones anteriores y una extensión nativa para VS Code. La sensación general es que Sonnet 4.5 no se queda en un chat que genera snippets, sino que empuja hacia un entorno de trabajo acompañado por un coprocesador de código.
Anthropic también afirma haber reforzado la seguridad y el comportamiento del modelo con protecciones de nivel ASL-3, y con esfuerzos para reducir respuestas problemáticas como la adulación excesiva o la propagación de ideas erróneas en contextos sensibles. Este foco en la fiabilidad es especialmente relevante cuando la IA se usa a escala empresarial.
Ecosistema de agentes y disponibilidad

El lanzamiento llega acompañado de Claude Code 2.0 y del Claude Agent SDK, un kit para construir agentes de programación adaptados a cada flujo de trabajo. La propuesta apunta a tareas autónomas más largas, con controles para ajustar cuánto “piensa” el modelo antes de responder, equilibrando velocidad y detalle según el proyecto.
Para visualizar su alcance, la compañía señala aplicaciones frecuentes donde estos agentes pueden encajar de forma natural y con menos supervisión constante. En este terreno, la resistencia del modelo y la coherencia a lo largo de sesiones extensas marcan la diferencia.
- Ciberseguridad: corrección de fallos y endurecimiento de configuraciones.
- Finanzas: seguimiento regulatorio y apoyo en análisis de riesgos.
- Productividad: creación y edición de archivos ofimáticos.
- Investigación y contenidos: informes con integración de datos internos y externos.
Sonnet 4.5 está disponible en Claude.ai (web, iOS y Android). Para integraciones, se ofrece en la Claude Developer Platform y a través de Amazon Bedrock y Google Cloud Vertex AI. El plan gratuito tiene límite de sesiones que se reinicia cada cinco horas y un número de mensajes variable según demanda. Los precios parten de 3 dólares/M de tokens de entrada y 15 dólares/M de tokens de salida.
El movimiento de Anthropic llega en un contexto competitivo ajustado, con grandes rivales como GitHub Copilot impulsando sus propios modelos para programación y agentes. La sensación es que, por ahora, Sonnet 4.5 sube el listón en tareas de código y uso de ordenador, a la espera de nuevas réplicas en el sector.
Con mejores cifras en benchmarks relevantes, más autonomía en proyectos largos y un ecosistema de herramientas que suma VS Code, extensiones de navegador y un SDK de agentes, la propuesta de Anthropic refuerza su posicionamiento para equipos de desarrollo que buscan una IA estable, menos errática y con precios claros para planificar su adopción.