| Compañías | Ética y Sociedad |

Anthropic permite a Claude finalizar conversaciones abusivas

TechCrunch

Anthropic says some Claude models can now end ?harmful or abusive? conversations | TechCrunch
Anthony Ha
TechCrunch
inglés
Estados Unidos
en-US
1755363643
1755363643
2025-08-16T17:00:43Z
2025-08-16T15:50:05Z
2025-08-16T15:50:11Z
https://techcrunch.com/2025/08/16/anthropic-says-some-claude-models-can-now-end-harmful-or-abusive-conversations

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de interacciones dañinas, protegiendo el 'bienestar del modelo'.

Anthropic permite a sus modelos Claude finalizar conversaciones abusivas

La IA podrá cortar diálogos en casos extremos de interacciones dañinas. La medida, aplicable solo en Claude Opus 4 y 4.1, busca proteger el «bienestar del modelo», según la empresa. Se activará tras múltiples intentos de redirección fallidos.

«Un cortafuegos para la IA»

Anthropic aclara que no asume que sus modelos sean sensibles, pero actúa «por precaución» ante incertidumbres sobre su estatus moral. La función se probó en solicitudes como «contenido sexual con menores» o «información para actos terroristas», donde Claude mostró «angustia aparente» al responder.

Límites y condiciones

La interrupción será último recurso y no aplicará si el usuario expresa riesgo inminente de autolesión o violencia. Al cortar, se permitirá reiniciar chats o editar respuestas problemáticas. La compañía enfatiza que es un «experimento en curso».

Precaución antes que certeza

Anthropic desarrolló un programa de «bienestar del modelo» pese a reconocer que no hay evidencia de que los LLM sufran. La medida refleja debates éticos en IA, donde empresas priorizan salvaguardas ante riesgos legales o reputacionales.

Un botón de emergencia para diálogos peligrosos

La actualización apunta a casos marginales, pero marca un precedente en cómo las empresas gestionan interacciones abusivas. Su eficacia dependerá del refinamiento continuo que promete Anthropic.

Post Views: 108

| Adweek | Anthony Ha | Anthropic | Anuncio de capacidades de terminación de conversaciones | Hollister Free Lance | Maxwell Zeff | New York City | TechCrunch | VentureBeat |

| Compañías |

noviembre 17, 2025

Ejecutivo de bitcoin pierde 220.000 dólares en sofisticada estafa en Ámsterdam

Kent Halliburton, consejero delegado de Sazmining, perdió 220.000 dólares en bitcoin en una estafa en

| Compañías |

noviembre 17, 2025

Fidji Simo, nueva CEO de Aplicaciones de OpenAI, impulsa ChatGPT hacia la rentabilidad

Fidji Simo asume el liderazgo de las aplicaciones comerciales de OpenAI, incluyendo ChatGPT. Su misión

| Compañías |

noviembre 17, 2025

Apple deberá pagar 634 millones de dólares a Masimo por infracción de patente

Un jurado federal obliga a Apple a abonar 634 millones de dólares a Masimo por

| Compañías |

noviembre 17, 2025

Sakana AI recauda 135 millones de dólares en una ronda Serie B

La startup japonesa Sakana AI ha recaudado 135 millones de dólares en una ronda Serie

| Compañías |

noviembre 16, 2025

Inversión en centros de datos supera a la búsqueda de petróleo en 2025

La inversión global en centros de datos alcanzará 580.000 millones de dólares en 2025, superando

| Compañías |

noviembre 15, 2025

Konwinski alerta de que EEUU pierde dominio en IA frente a China

Andy Konwinski, cofundador de Databricks, alerta que China genera el doble de ideas relevantes en

| Compañías |

noviembre 15, 2025

OpenAI pagó 865 millones a Microsoft en los primeros nueve meses de 2025

OpenAI pagó 865,8 millones de dólares a Microsoft en los primeros nueve meses de 2025,

| Compañías |

noviembre 14, 2025

Cadenas de bebidas chinas se expanden en EE.UU. desafiando a Starbucks

Las cadenas chinas Luckin Coffee, Chagee y HeyTea se expanden en Nueva York y California.

| Ética y Sociedad |

noviembre 14, 2025

Bradley Tusk lanza protocolo para impulsar el voto por móvil en EE.UU.

El consultor Bradley Tusk presenta VoteSecure, un protocolo criptográfico de código abierto para votar desde

| Compañías |

noviembre 14, 2025

OpenAI soluciona el problema del guion largo en ChatGPT tras criticas

OpenAI ha corregido la incidencia que asociaba el guion largo con textos de IA. Los

| Compañías |

noviembre 14, 2025

Spotify introduce nuevos planes Premium en cinco mercados

Spotify introduce nuevos planes de suscripción en cinco mercados, incluido un nivel Platinum con audio

| Compañías |

noviembre 14, 2025

Las grandes tecnológicas negocian el futuro de la compra automatizada con IA

Las compras navideñas realizadas por agentes de IA experimentan retrasos debido a complejas negociaciones entre