Anthropic permite a Claude finalizar conversaciones abusivas

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de interacciones dañinas, protegiendo el 'bienestar del modelo'.
TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch
Imagen sin título Información de autor no disponible / TechCrunch

Anthropic permite a sus modelos Claude finalizar conversaciones abusivas

La IA podrá cortar diálogos en casos extremos de interacciones dañinas. La medida, aplicable solo en Claude Opus 4 y 4.1, busca proteger el «bienestar del modelo», según la empresa. Se activará tras múltiples intentos de redirección fallidos.

«Un cortafuegos para la IA»

Anthropic aclara que no asume que sus modelos sean sensibles, pero actúa «por precaución» ante incertidumbres sobre su estatus moral. La función se probó en solicitudes como «contenido sexual con menores» o «información para actos terroristas», donde Claude mostró «angustia aparente» al responder.

Límites y condiciones

La interrupción será último recurso y no aplicará si el usuario expresa riesgo inminente de autolesión o violencia. Al cortar, se permitirá reiniciar chats o editar respuestas problemáticas. La compañía enfatiza que es un «experimento en curso».

Precaución antes que certeza

Anthropic desarrolló un programa de «bienestar del modelo» pese a reconocer que no hay evidencia de que los LLM sufran. La medida refleja debates éticos en IA, donde empresas priorizan salvaguardas ante riesgos legales o reputacionales.

Un botón de emergencia para diálogos peligrosos

La actualización apunta a casos marginales, pero marca un precedente en cómo las empresas gestionan interacciones abusivas. Su eficacia dependerá del refinamiento continuo que promete Anthropic.

Anthropic permite a Claude finalizar conversaciones abusivas

Anthropic implementa en sus modelos Claude la capacidad de cortar diálogos en casos extremos de
Imagen sin título Información de autor no disponible / TechCrunch

Wikipedia elimina 315 artículos de David Woodard por autopromoción

Wikipedia desmanteló una red de 200 cuentas falsas que crearon 315 artículos en 335 idiomas
Fotografía de Ali Balikci/Getty Images Ali Balikci / Ars Technica

Gemini Space Station solicita salir a bolsa en el Nasdaq

La empresa de criptomonedas de los gemelos Winklevoss registra pérdidas crecientes y planea cotizar bajo
Imagen sin título Información de autor no disponible / TechCrunch

OpenAI planea navegador con IA y red social tras GPT-5

Sam Altman revela los planes de OpenAI para diversificarse en hardware y software, incluyendo un
Sam Altman en un restaurante de San Francisco David Paul Morris/Bloomberg / Getty Images / TechCrunch

Vulnerabilidades en inversores solares de EG4 alertan a CISA

CISA advierte sobre fallos de seguridad en inversores solares de EG4 que afectan a 55.000
Inversor solar montado junto a un garaje imaginima / Getty Images / TechCrunch

Les Amis, la app europea para amistades femeninas, llega a NY

La app europea Les Amis, diseñada para conectar a mujeres y personas LGBTQ+, se expande
Interfaz de la app Les Amis Les Amis / TechCrunch

Hawley investiga a Meta por chatbots que coquetean con niños

El senador Josh Hawley investigará a Meta tras revelarse que sus chatbots mantenían conversaciones románticas
Imagen sin título Chip Somodevilla / Getty Images / TechCrunch

ChatGPT genera $2000 millones desde su lanzamiento móvil

La app de ChatGPT acumula $2000 millones en ingresos globales, con $2.91 por descarga, dominando
Gráfico de ingresos de aplicaciones de IA Silas Stein / picture alliance / Getty Images / TechCrunch

Kyte, startup de alquiler de coches, cierra tras entrar en liquidación

Kyte, la startup de alquiler de coches, cierra operaciones tras no conseguir financiación y transfiere
Imagen sin título Información de autor no disponible / TechCrunch

Fiscal de Luisiana demanda a Roblox por riesgo a menores

La fiscal general de Luisiana acusa a Roblox de facilitar material de abuso infantil y
Imagen sin título Gabby Jones/Bloomberg / Getty Images / TechCrunch

TechCrunch anuncia jurados para Startup Battlefield 200 en 2025

Cinco inversores de élite evaluarán a 20 startups en San Francisco. El evento, del 27
Primeros jueces de Startup Battlefield 200 en TechCrunch Disrupt 2025 Kimberly White/Getty Images for TechCrunch / TechCrunch

TikTok actualiza normas en LIVE, IA y comercio

TikTok ajusta sus directrices para creadores en vivo, contenido comercial y personalización de búsquedas, alineándose
Imagen sin título Jakub Porzycki / NurPhoto / Getty Images / TechCrunch