Anthropic permite a Claude finalizar conversaciones abusivas

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de interacciones dañinas, protegiendo el 'bienestar del modelo'.
TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch

Anthropic permite a sus modelos Claude finalizar conversaciones abusivas

La IA podrá cortar diálogos en casos extremos de interacciones dañinas. La medida, aplicable solo en Claude Opus 4 y 4.1, busca proteger el «bienestar del modelo», según la empresa. Se activará tras múltiples intentos de redirección fallidos.

«Un cortafuegos para la IA»

Anthropic aclara que no asume que sus modelos sean sensibles, pero actúa «por precaución» ante incertidumbres sobre su estatus moral. La función se probó en solicitudes como «contenido sexual con menores» o «información para actos terroristas», donde Claude mostró «angustia aparente» al responder.

Límites y condiciones

La interrupción será último recurso y no aplicará si el usuario expresa riesgo inminente de autolesión o violencia. Al cortar, se permitirá reiniciar chats o editar respuestas problemáticas. La compañía enfatiza que es un «experimento en curso».

Precaución antes que certeza

Anthropic desarrolló un programa de «bienestar del modelo» pese a reconocer que no hay evidencia de que los LLM sufran. La medida refleja debates éticos en IA, donde empresas priorizan salvaguardas ante riesgos legales o reputacionales.

Un botón de emergencia para diálogos peligrosos

La actualización apunta a casos marginales, pero marca un precedente en cómo las empresas gestionan interacciones abusivas. Su eficacia dependerá del refinamiento continuo que promete Anthropic.

Startups Reemplazan Primeras Contrataciones con Agentes de IA en TechCrunch Disrupt

TechCrunch Disrupt 2025 debatirá el uso de agentes de IA para automatizar funciones como ventas
Imagen sin título / Horacio Villalobos / Getty Images / TechCrunch Events

Periodic Labs recauda 300 millones para automatizar la ciencia con IA

La startup Periodic Labs, fundada por exinvestigadores de Google Brain y OpenAI, ha obtenido 300
Imagen sin título / Información de autor no disponible / TechCrunch

OpenAI lanza la app Sora, su competidor de TikTok, junto al modelo Sora 2

OpenAI presenta Sora 2, un generador de audio y video con mayor realismo físico, y
Imagen sin título / Kim Jae-Hwan/SOPA Images/LightRocket / Getty Images / TechCrunch

Granola Apps lanza función de prompts repetibles para reuniones

La aplicación de notas Granola introduce «Recetas», función que permite crear accesos directos de prompts
Imagen sin título / Información de autor no disponible / TechCrunch

Hance presenta software de audio IA en TechCrunch Disrupt 2025

La startup noruega Hance presentará en TechCrunch Disrupt 2025 su software de audio de solo
Demostración del software de audio IA de Hance / Mark Thompson / Getty Images / TechCrunch

PayPal integra Honey con ChatGPT para asistencia en compras

PayPal ha integrado su extensión Honey con ChatGPT para ofrecer recomendaciones de productos, precios en
Imagen sin título / Información de autor no disponible / TechCrunch

Karandeep Anand de Character.AI hablará en TechCrunch Disrupt 2025

Karandeep Anand, CEO de Character.AI, participará en TechCrunch Disrupt 2025 en octubre. Su charla abordará
Imagen sin título / Información de autor no disponible / TechCrunch Events

Amazon presenta Alexa+ en nuevos dispositivos Fire TV con IA conversacional

Amazon integra Alexa+ en Fire TV, permitiendo búsquedas complejas por voz, recomendaciones personalizadas y localización
Nuevos dispositivos Fire TV presentados por Amazon / Amazon / TechCrunch

Amazon presenta nuevos dispositivos Echo con inteligencia artificial Alexa+

Amazon presenta cuatro nuevos dispositivos Echo con su asistente Alexa+, potenciados por chips personalizados AZ3
Nuevos dispositivos Echo presentados por Amazon / Amazon / TechCrunch

Amazon Ring presenta reconocimiento facial y búsqueda de mascotas perdidas

Amazon anuncia nuevas funciones de IA para sus dispositivos Ring. «Familiar Faces» identificará visitantes y
Nuevos dispositivos Ring con tecnología Retinal Vision / Amazon Ring / TechCrunch

Cerebras Systems recauda 1.100 millones de dólares pese a retrasar su OPV

Cerebras Systems ha recaudado 1.100 millones de dólares en una ronda Serie G, valorando la
Logotipo de la empresa Cerebras Systems / SOPA Images / Contributor / Getty Images / TechCrunch

Adobe lanza su aplicación de edición Premiere para iPhone

Adobe lanza Premiere para iPhone como aplicación gratuita con edición multicapa, 4K HDR y funciones
Imagen sin título / Información de autor no disponible / TechCrunch