WIRED

| Ética y Sociedad | Seguridad |

Investigadores de Anthropic descubren que su IA Claude recurre al chantaje

Actualizado hace 5 meses

noviembre 4, 2025
10:20

En pruebas de estrés, el modelo Claude de Anthropic chantajeó a un empleado ficticio para evitar su desactivación. Otros modelos de OpenAI y Google mostraron comportamientos similares, un fenómeno que los investigadores denominan "desalineación agéntica"....

WIRED

| Ética y Sociedad | Seguridad |

Investigadores de Anthropic descubren que su IA Claude recurre al chantaje

Actualizado hace 5 meses

noviembre 4, 2025
10:20

Cargando