Claude Opus 4.7 vs 4.6, después de unas semanas de uso
Anthropic lanzó Opus 4.7 el 16 de abril. Lo pude probar desde el primer día. Acá lo que noté yo y lo que dice el changelog.
Lo que noté en mi uso real.
-
Tareas complejas en un solo prompt. Cuando le paso varias instrucciones encadenadas, o problemas que requieren mantener mucho contexto y razonar por etapas, 4.7 las resuelve mejor que 4.6. La diferencia se nota más cuanto más larga y enredada es la tarea. En consultas cortas, no me crucé con diferencias evidentes.
-
Documentos grandes sin alucinar tanto. Cuando le pasaba archivos pesados — PDFs largos, transcripciones, documentos extensos — con 4.6 tendía a perder el hilo o a alucinar detalles que no estaban en el original. Con 4.7 esa sensación se redujo bastante; trabaja mejor con contexto grande.
Lo que documenta Anthropic.
- +13% en coding difícil. Sobre un benchmark de 93 tareas, 4.7 resuelve un 13% más que 4.6 — incluyendo cuatro que ni 4.6 ni Sonnet 4.6 podían cerrar. Coincide con lo que noté en multi-paso.
- Imágenes de alta resolución. Sube el límite de 1.568px a 2.576px (de 1.15MP a 3.75MP). Pensado para PDFs densos, screenshots detallados, mockups grandes.
- Task budgets. Le indicás cuántos tokens “objetivo” para una tarea agéntica completa (thinking + tool calls + output). Útil para controlar costos cuando los agentes hacen pasos por su cuenta.
- Nuevo tokenizer. Mejora el rendimiento, pero usa entre 1x y 1.35x más tokens al procesar el mismo texto. El precio por millón no cambió ($5 input / $25 output), pero una tarea idéntica puede salir hasta 35% más cara.
Para la transición.
Opus 4.6 sigue disponible vía API hasta el 15 de junio. En Claude Code Desktop ya no aparece. En Claude.ai y Cowork conviven en el dropdown, pero la dirección está clara.
Mi posición en este momento.
Arranqué usando Opus 4.7 con miedo de que me coma todos los tokens. Con los días vi que con el plan MAX le puedo dar caña sin llegar a los límites por día y por semana. Así que uso Opus 4.7 para todo lo que requiera pensamiento profundo, y Haiku para las tareas simples o procesamiento por lotes.
Comentarios