Anthropic permite a Claude finalizar conversaciones abusivas

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de interacciones dañinas, protegiendo el 'bienestar del modelo'.
TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch

Anthropic permite a sus modelos Claude finalizar conversaciones abusivas

La IA podrá cortar diálogos en casos extremos de interacciones dañinas. La medida, aplicable solo en Claude Opus 4 y 4.1, busca proteger el «bienestar del modelo», según la empresa. Se activará tras múltiples intentos de redirección fallidos.

«Un cortafuegos para la IA»

Anthropic aclara que no asume que sus modelos sean sensibles, pero actúa «por precaución» ante incertidumbres sobre su estatus moral. La función se probó en solicitudes como «contenido sexual con menores» o «información para actos terroristas», donde Claude mostró «angustia aparente» al responder.

Límites y condiciones

La interrupción será último recurso y no aplicará si el usuario expresa riesgo inminente de autolesión o violencia. Al cortar, se permitirá reiniciar chats o editar respuestas problemáticas. La compañía enfatiza que es un «experimento en curso».

Precaución antes que certeza

Anthropic desarrolló un programa de «bienestar del modelo» pese a reconocer que no hay evidencia de que los LLM sufran. La medida refleja debates éticos en IA, donde empresas priorizan salvaguardas ante riesgos legales o reputacionales.

Un botón de emergencia para diálogos peligrosos

La actualización apunta a casos marginales, pero marca un precedente en cómo las empresas gestionan interacciones abusivas. Su eficacia dependerá del refinamiento continuo que promete Anthropic.

Jeff Bezos regresa como co-CEO de la startup de IA Project Prometheus

Jeff Bezos regresa a la gestión operativa como co-CEO de Project Prometheus, una startup de
Jeff Bezos en un evento

Luminal recauda 5,3 millones para optimizar compiladores de GPU

La startup Luminal ha obtenido 5,3 millones de dólares en una ronda semilla para desarrollar
Imagen sin título

Runlayer lanza startup de seguridad MCP con 11 millones de dólares

La startup Runlayer ha levantado 11 millones de dólares en una ronda semilla para su
Imagen sin título

PowerLattice recibe 25 millones de dólares liderados por Pat Gelsinger

La startup PowerLattice ha obtenido 25 millones de dólares en una ronda Serie A, liderada
Imagen sin título

Ejecutivo de bitcoin pierde 220.000 dólares en sofisticada estafa en Ámsterdam

Kent Halliburton, consejero delegado de Sazmining, perdió 220.000 dólares en bitcoin en una estafa en
Ilustración de una estafa de criptomonedas

Fidji Simo, nueva CEO de Aplicaciones de OpenAI, impulsa ChatGPT hacia la rentabilidad

Fidji Simo asume el liderazgo de las aplicaciones comerciales de OpenAI, incluyendo ChatGPT. Su misión
Fidji Simo, CEO de Aplicaciones de OpenAI.

Apple deberá pagar 634 millones de dólares a Masimo por infracción de patente

Un jurado federal obliga a Apple a abonar 634 millones de dólares a Masimo por
Imagen sin título

Sakana AI recauda 135 millones de dólares en una ronda Serie B

La startup japonesa Sakana AI ha recaudado 135 millones de dólares en una ronda Serie
Imagen sin título

Inversión en centros de datos supera a la búsqueda de petróleo en 2025

La inversión global en centros de datos alcanzará 580.000 millones de dólares en 2025, superando
Imagen sin título

Konwinski alerta de que EEUU pierde dominio en IA frente a China

Andy Konwinski, cofundador de Databricks, alerta que China genera el doble de ideas relevantes en
Andy Konwinski hablando en una conferencia

OpenAI pagó 865 millones a Microsoft en los primeros nueve meses de 2025

OpenAI pagó 865,8 millones de dólares a Microsoft en los primeros nueve meses de 2025,
Sam Altman, director ejecutivo de OpenAI, en una conferencia.

Cadenas de bebidas chinas se expanden en EE.UU. desafiando a Starbucks

Las cadenas chinas Luckin Coffee, Chagee y HeyTea se expanden en Nueva York y California.
Una tienda de Luckin Coffee en Manhattan, donde los clientes realizan pedidos online.