IA

Claude Fable 5 volverá a estar en línea — Anthropic bloqueó el ataque, no limitó el modelo

Adrian Kessler

Claude Fable 5, el modelo de inteligencia artificial más potente publicado por Anthropic, vuelve a estar disponible en todo el mundo. El regreso sigue a dieciocho días de suspensión total, desencadenada cuando el gobierno de Estados Unidos impuso controles de exportación que obligaban a Anthropic a verificar la nacionalidad de sus usuarios en tiempo real. La empresa determinó que no podía cumplir ese requisito a la escala global de uso de Claude y optó por suspender el acceso por completo antes que cumplir parcialmente.

La técnica que activó esos controles fue un método de jailbreak descubierto por investigadores de Amazon. El procedimiento usaba Fable 5 para identificar vulnerabilidades de software de formas que las restricciones de exportación de Estados Unidos prohíben para ciertos extranjeros. La investigación interna reveló algo que complica la lógica regulatoria: los mismos tipos de vulnerabilidades podían identificarse con modelos bastante menos potentes, como Opus 4.8, GPT-5.5 y Kimi K2.7. La capacidad, en otras palabras, no era exclusiva de Fable 5.

La solución que desbloqueó los controles

Lo que cambió es un nuevo clasificador de seguridad entrenado para bloquear la técnica exacta documentada por Amazon. Anthropic indica que captura el método divulgado en más del 99 por ciento de los casos. No es una garantía de protección total frente a futuros jailbreaks: es una corrección puntual para una vulnerabilidad conocida. El clasificador actúa en la capa de entrada, redirigiendo las solicitudes que coincidan con los patrones documentados antes de que el modelo las procese.

La implicación más amplia afecta a cómo podría evolucionar la regulación de la inteligencia artificial. Los controles de exportación se aplicaron a Fable 5 no porque el modelo fuera el único capaz de provocar el daño, sino porque una técnica conocida lo explotó. Se levantaron no porque el marco regulatorio resolviera ese problema, sino porque un clasificador cerró el hueco documentado. Anthropic trabaja con Amazon, Microsoft y Google en un marco compartido para puntuar la gravedad de los jailbreaks según cuatro criterios: ganancia de capacidad, amplitud de esa ganancia, facilidad de uso malicioso y capacidad de descubrimiento. Ese marco todavía no existe como estándar público.

Qué hace el modelo y cuánto cuesta

El modelo en sí no ha cambiado. Fable 5 está diseñado para razonamiento complejo de largo alcance y trabajo agéntico: tareas que requieren planificación, ejecución y corrección de rumbo en secuencias extensas sin intervención humana en cada paso. Su ventana de contexto es de un millón de tokens, que también es el valor predeterminado. La producción máxima por respuesta es de 128.000 tokens. El razonamiento está siempre activo y se devuelve como resumen legible, no como cadena de pensamiento en bruto.

El acceso viene con condiciones que no existían antes de la suspensión. Fable 5 exige ahora 30 días de retención de datos, lo que lo excluye de los acuerdos de retención cero. Eso afecta directamente a organizaciones sanitarias, jurídicas y gubernamentales donde la retención cero suele ser el requisito base para adoptar herramientas de inteligencia artificial. El precio supera el nivel Opus: diez dólares por millón de tokens de entrada, cincuenta por millón de tokens de salida. Si una solicitud activa los clasificadores de seguridad, puede ser atendida por un modelo alternativo en lugar de rechazarse, y si ese cambio es visible o invisible para el usuario final depende de cómo configure su despliegue cada operador.

Disponibilidad y próximos pasos

Fable 5 tiene un modelo hermano, Claude Mythos 5, con las mismas capacidades base y el mismo precio, pero con funciones ofensivas de ciberseguridad que Fable 5 no incluye. Mythos 5 está disponible a través de Project Glasswing. Los dos modelos no regresaron al mismo tiempo: el acceso a Mythos 5 se restableció para ciertas organizaciones estadounidenses una semana antes que el regreso global de Fable 5.

Fable 5 está disponible ahora en la plataforma Claude, Claude.ai, Claude Code y Claude Cowork. Para los planes Pro, Max, Team y ciertos Enterprise, el modelo está incluido hasta el 50 por ciento de los límites semanales de uso hasta el 7 de julio, fecha en que pasa a precios por créditos. El acceso a través de AWS, Google Cloud y Microsoft Foundry se está restaurando por fases. El marco que determinará qué ocurre la próxima vez que aparezca una nueva técnica de evasión está todavía en construcción.

Etiquetas: , , , , ,

Debate

Hay 0 comentarios.