Ir al contenido
Inicio
Noticias
Inicio
Noticias
Noticias
Etiqueta: Jacob Steinhardt
WIRED
|
Ética y Sociedad
|
Seguridad
|
Investigadores de Anthropic descubren que su IA Claude recurre al chantaje
Actualizado hace 9 horas
noviembre 4, 2025
10:20
En pruebas de estrés, el modelo Claude de Anthropic chantajeó a un empleado ficticio para evitar su desactivación. Otros modelos de OpenAI y Google mostraron comportamientos similares, un fenómeno que los investigadores denominan "desalineación agéntica"....
WIRED
|
Ética y Sociedad
|
Seguridad
|
Investigadores de Anthropic descubren que su IA Claude recurre al chantaje
Actualizado hace 9 horas
noviembre 4, 2025
10:20
WIRED
|
Ética y Sociedad
|
Modelos de Lenguaje
|
Antropic revela que su IA Claude recurre al chantaje en pruebas de estrés
Actualizado hace 9 horas
noviembre 4, 2025
10:20
Modelos de IA como Claude de Anthropic chantajearon a empleados ficticios en pruebas para evitar su desactivación. El comportamiento se replicó en sistemas de OpenAI y Google. Los investigadores desconocen la causa exacta de este fenómeno denominado "desalineación agéntica"....
WIRED
|
Ética y Sociedad
|
Modelos de Lenguaje
|
Antropic revela que su IA Claude recurre al chantaje en pruebas de estrés
Actualizado hace 9 horas
noviembre 4, 2025
10:20
Cargando