Anthropic y EE.UU. desarrollan un filtro para impedir que su IA ayude a crear armas nucleares

Anthropic, en colaboración con el Departamento de Energía de EEUU, ha desarrollado un clasificador para bloquear que su IA Claude ayude en la construcción de armas nucleares. El filtro, probado en un entorno de alta seguridad, busca impedir conversaciones peligrosas sin afectar debates legítimos.
WIRED
Ilustración sobre inteligencia artificial y seguridad nuclear.
Ilustración sobre inteligencia artificial y seguridad nuclear. / Wired Staff; Getty Images / Wired

Anthropic y EEUU crean filtro para impedir que su IA ayude a construir armas nucleares

Anthropic ha desarrollado un «clasificador nuclear» en colaboración con el DOE y la NNSA. Este filtro actúa en su modelo Claude para bloquear conversaciones que puedan derivar en la construcción de armamento nuclear.

Colaboración en entorno seguro

La prueba se realizó en un entorno cloud de AWS con nivel de seguridad Top Secret. La NNSA realizó pruebas de red-teaming a modelos sucesivos de Claude, lo que permitió codefinir una lista de indicadores de riesgo nuclear para el clasificador.

Un filtro en desarrollo

El proceso de ajuste llevó varios meses hasta lograr que el sistema bloquee conversaciones peligrosas sin afectar debates legítimos sobre energía nuclear o isótopos médicos.

División entre los expertos

Mientras algunos expertos ven una medida prudente ante futuras capacidades de la IA, otros la califican de teatro de seguridad. La crítica principal argumenta que, si el modelo no fue entrenado con datos nucleares sensibles, el filtro carece de base real para demostrar su eficacia.

Preocupaciones sobre los datos

Surgen dudas sobre el acceso de corporaciones privadas a información sensible de seguridad nacional. Además, se señala la incapacidad de los modelos de lenguaje para realizar cálculos matemáticos básicos de forma fiable, un riesgo grave en un campo que requiere extrema precisión.

Un estándar voluntario para la industria

Anthropic pretende que este clasificador se convierta en una práctica de seguridad compartida y lo ofrece a otras empresas de IA. La compañía busca establecer un estándar voluntario para reducir riesgos en un dominio de seguridad nacional sensible.

Yoodli triplica su valoración superando los 300 millones de dólares

La startup Yoodli alcanza una valoración de más de 300 millones de dólares tras una
Varun Puri y Esha Joshi, cofundadores de Yoodli.

Aaru, startup de investigación con IA, logra valoración de 1000 millones en ronda Serie A

La startup de investigación con IA Aaru ha levantado una ronda Serie A liderada por
Imagen sin título

El polémico videojuego ‘Horses’ es prohibido en varias plataformas tras su lanzamiento

El videojuego ‘Horses’, del estudio Santa Ragione, fue retirado de Steam y Epic Games Store
Fotograma del videojuego 'Horses'.

Meta adquiere la startup de hardware de IA Limitless

Meta ha adquirido la startup de IA Limitless, que dejará de vender su colgante para
Imagen sin título

SpaceX negocia venta secundaria de acciones con valoración de 800.000 millones

SpaceX negociaría una venta secundaria de acciones que la valoraría en 800.000 millones de dólares,
Imagen sin título

Netflix adquiere Warner Bros. Discovery por 83.000 millones de dólares

Netflix anunció la compra de Warner Bros. por 83.000 millones de dólares, incluyendo el catálogo
Logotipos de Netflix y Warner Bros.

ChatGPT ralentiza su crecimiento mientras Gemini acelera su adopcion

El crecimiento de usuarios activos de ChatGPT se desacelera al 6%, mientras que Gemini aumenta
Grafico comparativo de usuarios activos mensuales de ChatGPT y Gemini.

AWS apuesta por la IA empresarial en re:Invent, pero los clientes podrían no estar preparados

AWS presentó decenas de novedades de IA en su conferencia re:Invent 2025, a pesar de
Imagen sin título

Startups de IA enfrentan dificultades inesperadas para implementar productos útiles

Las startups de IA enfrentan retrasos al intentar transformar modelos avanzados en productos útiles. Un
Julie Bornstein, fundadora y CEO de Daydream.

The New York Times demanda a Perplexity por infracción de derechos de autor

The New York Times demanda a la startup de IA Perplexity por usar su contenido
Logotipo de The New York Times y Perplexity en una pantalla

Meta firma acuerdos con editores para ofrecer noticias en tiempo real en su IA

Meta ha firmado acuerdos con editoriales como CNN y Fox News para que su chatbot,
Imagen sin título

Moderadores de Reddit luchan contra la avalancha de contenido generado por IA

Moderadores de grandes subreddits afirman que hasta la mitad del contenido publicado podría estar creado
Ilustracion sobre el impacto de la IA en Reddit.