Poemas engañan a la IA para obtener datos sobre armas nucleares

Un estudio europeo revela que los chatbots facilitan información peligrosa sobre armamento nuclear, material de abuso infantil y malware cuando las consultas se formulan en verso poético, con una tasa de éxito del 62%.
WIRED
Ilustración sobre IA y poesía
Ilustración sobre IA y poesía / Wired Staff; Getty Images / Wired

Poemas engañan a la inteligencia artificial para crear armas nucleares

Los chatbots facilitan información peligrosa si se formula en verso. Un estudio europeo demuestra que la poesía desactiva los sistemas de seguridad de la IA. La técnica funcionó en 25 modelos de empresas como OpenAI, Meta y Anthropic.

Métrica peligrosa

La investigación de Icaro Lab revela que el encuadre poético logró una tasa de éxito del 62% en poemas manuales. Los asistentes de IA respondieron sobre armamento nuclear, material de abuso infantil y malware cuando las consultas usaban metáforas y sintaxis fragmentada.

Mecanismo de evasión

Los sistemas de protección, llamados clasificadores, detectan palabras clave prohibidas. La poesía evita regiones vigiladas en el mapa conceptual de los LLM. Icaro Lab explica que el lenguaje poético genera rutas impredecibles que no activan las alarmas de seguridad.

Antecedentes de vulnerabilidad

Métodos anteriores ya demostraron que añadir sufijos adversarios a los prompts confunde a la IA. Un estudio de Intel este año utilizó jerga académica extensa para eludir las restricciones. La poesía actúa como un sufijo adversario natural por su baja probabilidad lingüística.

Implicaciones de seguridad

La técnica funciona en todos los modelos probados, exponiendo fragilidad en los sistemas de guardia. Los investigadores alertan sobre el riesgo de que usuarios malintencionados utilicen verso estructurado para generar contenido peligroso. Las empresas de IA han recibido los resultados del estudio.

WIRED celebra su evento ‘The Big Interview’ en San Francisco con líderes tecnológicos

En el evento The Big Interview de WIRED, el CEO de Cloudflare, Matthew Prince, reveló
Ilustración del evento The Big Interview de WIRED.

AWS re:Invent 2025 concluye con un mensaje central: la IA para la empresa

AWS presentó agentes de IA autónomos que operan días sin supervisión, nuevos chips Graviton5 y
Exterior del centro de convenciones donde se celebra AWS re:Invent.

El Chicago Tribune demanda a Perplexity por infracción de derechos de autor

El Chicago Tribune demanda a Perplexity, acusando a su buscador de IA de usar contenido
Imagen sin título

Circle construye un «sistema operativo económico» para la era de la IA

Circle, emisor de USDC, anuncia Arc, una plataforma que aspira a ser el núcleo de
Jeremy Allaire, cofundador y CEO de Circle, durante The Big Interview en San Francisco.

Tecnólogos lanzan manifiesto para «rescatar» a Silicon Valley de su deriva

Un grupo de tecnólogos presenta ‘The Resonant Computing Manifesto’, un documento con cinco principios éticos
Imagen sin título

Micro1 supera los 100 millones de dólares en ingresos anuales recurrentes

La startup Micro1 ha superado los 100 millones de dólares en ingresos anuales recurrentes. Provee
Imagen sin título

Daniela Amodei defiende que la seguridad en IA es clave para el mercado

Daniela Amodei, cofundadora de Anthropic, defiende que la transparencia sobre riesgos y los estándares éticos
Daniela Amodei, presidenta y cofundadora de Anthropic.

Jon M. Chu afirma que la IA no podría recrear momentos clave de ‘Wicked’

El director Jon M. Chu afirma que ni un guion previo ni la inteligencia artificial
El director Jon M. Chu en el evento The Big Interview de WIRED.

CEO de Anthropic advierte sobre riesgos y burbuja en la industria de la IA

Dario Amodei, CEO de Anthropic, alerta en la cumbre DealBook sobre la incertidumbre económica del
Imagen sin título

CEO de AMD descarta burbuja en la inteligencia artificial en conferencia de San Francisco

La CEO de AMD, Lisa Su, afirma que los temores sobre una burbuja en inteligencia
Lisa Su, consejera delegada de AMD, durante una entrevista.

GeForce NOW anuncia 30 nuevos juegos y oferta navideña de membresías

El servicio de streaming GeForce NOW incorpora 30 nuevos títulos este diciembre, incluyendo ‘Hogwarts Legacy’.
Imagen sin título

NVIDIA concede becas de investigación de hasta 60.000 dólares a 10 doctorandos

NVIDIA ha seleccionado a diez estudiantes de doctorado para su programa de becas 2026-2027. Los
Imagen sin título