Claude Opus 4.8 detecta cuatro veces más errores en su propio código

Anthropic ha actualizado su modelo más capaz a Claude Opus 4.8, y el cambio principal no es un cerebro más grande sino uno más prudente. La compañía afirma que el modelo tiene cuatro veces menos probabilidades que su antecesor de dejar pasar sin comentar fallos en el código que escribe, y que está más dispuesto a señalar las partes de una tarea de las que no está seguro. Para quien encarga trabajo real a una IA, ya sea programar, hacer un análisis o manejar un ordenador, esa fiabilidad es la característica que de verdad cuenta.

El punto débil de los agentes de IA actuales no es la torpeza, sino el exceso de confianza. Producen resultados que parecen terminados y se leen con fluidez mientras arrastran errores en silencio, y un sistema que funciona solo tiende a construir el siguiente paso sobre el fallo anterior. Si se le da a un agente una tarea de varios pasos, una sola suposición equivocada al principio puede propagarse por todo lo que sigue, de modo que el trabajo llega con aspecto de completo y resulta estar roto sin que se note. Un modelo que muestra sus propias dudas, en lugar de taparlas, es más fácil de supervisar, porque la persona sabe dónde mirar.

La prueba más clara está en la programación. Anthropic asegura que Opus 4.8 deja pasar muchos menos fallos en el código que produce sin marcarlos, ese error silencioso que aparece en producción y no en la revisión. La firma de inversión Bridgewater Associates, una de las primeras en probarlo, dijo que el modelo señalaba por su cuenta problemas tanto en los datos de entrada como en los resultados de un análisis, algo que otros sistemas pasaban por alto de forma habitual. En el trabajo de conocimiento y en las finanzas, el error peligroso es justo el que nadie detecta a tiempo.

Las cifras de los benchmarks respaldan el planteamiento sin ser lo importante. Opus 4.8 obtuvo, según lo publicado, un 69,2 por ciento en SWE-Bench Pro, una prueba construida con tareas reales de ingeniería de software, por delante de GPT-5.5 de OpenAI y de Gemini 3.1 Pro de Google. En las propias mediciones de Anthropic supera a todos los modelos Opus anteriores en una prueba de programación en cada nivel de esfuerzo y marcó el mejor resultado registrado por la empresa en un examen de razonamiento jurídico. Las ventajas son reales pero estrechas, y los triunfos en benchmarks predicen mal cómo se comporta un modelo cuando hace trabajo gris durante todo el día.

El modelo llega con herramientas nuevas. Una función en vista previa de investigación dentro de Claude Code, llamada dynamic workflows, permite a Opus planificar un trabajo grande y luego ejecutar cientos de subagentes en paralelo en una sola sesión, pensada para migraciones que abarcan cientos de miles de líneas de código y usando como vara de medir el conjunto de pruebas que ya tiene el proyecto. Además, un nuevo control en Claude.ai y en el entorno Cowork de la compañía permite ajustar cuánto esfuerzo, y cuántos tokens, dedica el modelo a cada respuesta.

Las advertencias van pegadas a las promesas. Las mejoras de fiabilidad descansan en gran parte en las pruebas internas de Anthropic, y una cifra como cuatro veces menos probabilidades es una medición propia y no una auditada de forma independiente. La honestidad también es difícil de verificar desde fuera, porque un modelo puede anunciar su incertidumbre y aun así equivocarse, o levantar la bandera sobre lo que no toca. Dynamic workflows llega solo como vista previa, no como función terminada, y el relato de la velocidad es menos generoso de lo que suena, porque el modo rápido cuesta el doble que la tarifa estándar y se llama más barato solo frente a precios premium anteriores.

Para quien mira el coste, el acceso estándar se mantiene en cinco dólares por millón de tokens de entrada y veinticinco por millón de salida, lo mismo que el Opus anterior. El modo rápido funciona a unas dos veces y media la velocidad por diez y cincuenta dólares por millón, lo que convierte el nuevo control de esfuerzo en tanto una herramienta de presupuesto como un mando de calidad. Claude Opus 4.8 ya está disponible a través de la API para desarrolladores de Anthropic con el nombre claude-opus-4-8, y la empresa dice que se despliega en todas partes el mismo día. Llegó el jueves, unas seis semanas después de Opus 4.7, un intervalo inusualmente corto que siguió a una acogida tibia de aquella versión y a una racha de lanzamientos rivales de OpenAI y Google. La verdadera prueba es si un modelo entrenado para dudar de sí mismo resulta más útil en el día a día que uno entrenado para lucir en una clasificación, y ese veredicto vendrá de los agentes que la gente deje funcionar de verdad.

Etiquetas: Anthropic, Claude Code, Generative AI, AI reasoning, Claude Opus 4.8, LLM