Anthropic permite a Claude finalizar conversaciones abusivas

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de interacciones dañinas, protegiendo el 'bienestar del modelo'.
TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch

Anthropic permite a sus modelos Claude finalizar conversaciones abusivas

La IA podrá cortar diálogos en casos extremos de interacciones dañinas. La medida, aplicable solo en Claude Opus 4 y 4.1, busca proteger el «bienestar del modelo», según la empresa. Se activará tras múltiples intentos de redirección fallidos.

«Un cortafuegos para la IA»

Anthropic aclara que no asume que sus modelos sean sensibles, pero actúa «por precaución» ante incertidumbres sobre su estatus moral. La función se probó en solicitudes como «contenido sexual con menores» o «información para actos terroristas», donde Claude mostró «angustia aparente» al responder.

Límites y condiciones

La interrupción será último recurso y no aplicará si el usuario expresa riesgo inminente de autolesión o violencia. Al cortar, se permitirá reiniciar chats o editar respuestas problemáticas. La compañía enfatiza que es un «experimento en curso».

Precaución antes que certeza

Anthropic desarrolló un programa de «bienestar del modelo» pese a reconocer que no hay evidencia de que los LLM sufran. La medida refleja debates éticos en IA, donde empresas priorizan salvaguardas ante riesgos legales o reputacionales.

Un botón de emergencia para diálogos peligrosos

La actualización apunta a casos marginales, pero marca un precedente en cómo las empresas gestionan interacciones abusivas. Su eficacia dependerá del refinamiento continuo que promete Anthropic.

Ejecutivo de bitcoin pierde 220.000 dólares en sofisticada estafa en Ámsterdam

Kent Halliburton, consejero delegado de Sazmining, perdió 220.000 dólares en bitcoin en una estafa en
Ilustración de una estafa de criptomonedas

Fidji Simo, nueva CEO de Aplicaciones de OpenAI, impulsa ChatGPT hacia la rentabilidad

Fidji Simo asume el liderazgo de las aplicaciones comerciales de OpenAI, incluyendo ChatGPT. Su misión
Fidji Simo, CEO de Aplicaciones de OpenAI.

Apple deberá pagar 634 millones de dólares a Masimo por infracción de patente

Un jurado federal obliga a Apple a abonar 634 millones de dólares a Masimo por
Imagen sin título

Sakana AI recauda 135 millones de dólares en una ronda Serie B

La startup japonesa Sakana AI ha recaudado 135 millones de dólares en una ronda Serie
Imagen sin título

Inversión en centros de datos supera a la búsqueda de petróleo en 2025

La inversión global en centros de datos alcanzará 580.000 millones de dólares en 2025, superando
Imagen sin título

Konwinski alerta de que EEUU pierde dominio en IA frente a China

Andy Konwinski, cofundador de Databricks, alerta que China genera el doble de ideas relevantes en
Andy Konwinski hablando en una conferencia

OpenAI pagó 865 millones a Microsoft en los primeros nueve meses de 2025

OpenAI pagó 865,8 millones de dólares a Microsoft en los primeros nueve meses de 2025,
Sam Altman, director ejecutivo de OpenAI, en una conferencia.

Cadenas de bebidas chinas se expanden en EE.UU. desafiando a Starbucks

Las cadenas chinas Luckin Coffee, Chagee y HeyTea se expanden en Nueva York y California.
Una tienda de Luckin Coffee en Manhattan, donde los clientes realizan pedidos online.

Bradley Tusk lanza protocolo para impulsar el voto por móvil en EE.UU.

El consultor Bradley Tusk presenta VoteSecure, un protocolo criptográfico de código abierto para votar desde
Foto-Ilustración del personal de WIRED

OpenAI soluciona el problema del guion largo en ChatGPT tras criticas

OpenAI ha corregido la incidencia que asociaba el guion largo con textos de IA. Los
Imagen sin título

Spotify introduce nuevos planes Premium en cinco mercados

Spotify introduce nuevos planes de suscripción en cinco mercados, incluido un nivel Platinum con audio
Imagen sin título

Las grandes tecnológicas negocian el futuro de la compra automatizada con IA

Las compras navideñas realizadas por agentes de IA experimentan retrasos debido a complejas negociaciones entre
Ilustración conceptual de un agente de IA realizando compras online.