OpenAI admite que los navegadores con IA pueden ser siempre vulnerables a ataques

OpenAI reconoce que los ataques de inyección de prompts, que manipulan a los agentes de IA, son un desafío de seguridad a largo plazo y "improbable que se solucione completamente". La compañía detalla sus medidas de mitigación.
TechCrunch
Demostración de un ataque de inyección de prompt en el navegador Atlas de OpenAI.
Demostración de un ataque de inyección de prompt en el navegador Atlas de OpenAI. / OpenAI / TechCrunch

OpenAI afirma que los ataques de inyección de prompts pueden ser un riesgo permanente

OpenAI reconoce que la inyección de prompts, un ataque que manipula a los agentes de IA, «es improbable que se solucione completamente». La compañía detalla en un blog las medidas para reforzar la seguridad de su navegador Atlas, lanzado en octubre, cuyo «modo agente amplía la superficie de amenaza».

Un desafío de seguridad a largo plazo

OpenAI describe la inyección de prompts como un desafío de seguridad a largo plazo para la IA. La empresa compara este riesgo con “los timos y la ingeniería social en la web”. El Centro Nacional de Ciberseguridad del Reino Unido (NCSC) advirtió este mes que estos ataques “pueden no mitigarse nunca totalmente”.

La respuesta: un atacante automatizado

La estrategia de OpenAI incluye un “atacante automatizado basado en LLM”. Este bot, entrenado con aprendizaje por refuerzo, busca formas de colar instrucciones maliciosas. Puede probar el ataque en simulación y estudiar la respuesta del agente objetivo para perfeccionarlo.

Demostración de un ataque y su mitigación

En una demostración, el atacante automatizado coló un correo malicioso en una bandeja de entrada. Cuando el agente de IA escaneó el buzón, siguió las instrucciones ocultas y envió un mensaje de renuncia. Tras la actualización de seguridad, el “modo agente” detectó el intento de inyección y lo señaló al usuario.

Recomendaciones para reducir el riesgo

OpenAI sugiere a los usuarios limitar el acceso con credenciales y dar instrucciones específicas a los agentes. Un portavoz indicó que Atlas está entrenado para solicitar confirmación del usuario antes de enviar mensajes o realizar pagos. Rami McCarthy, investigador de Wiz, señala que los navegadores agentes tienen “autonomía moderada combinada con un acceso muy alto”.

El equilibrio entre valor y riesgo

McCarthy expresa escepticismo sobre el balance actual. Afirma que “para la mayoría de los casos de uso cotidianos, los navegadores agentes aún no ofrecen suficiente valor” para justificar su perfil de riesgo. El acceso a datos sensibles los hace potentes, pero también aumenta significativamente el peligro.

OpenAI admite que los navegadores con IA pueden ser siempre vulnerables a ataques

OpenAI reconoce que los ataques de inyección de prompts, que manipulan a los agentes de
Demostración de un ataque de inyección de prompt en el navegador Atlas de OpenAI.

Alphabet adquiere Intersect Power por 4.750 millones para asegurar energía para IA

Alphabet, matriz de Google, adquiere la desarrolladora de energía limpia Intersect Power por 4.750 millones
Imagen sin título

Laboratorio de Massachusetts estudia la memoria humana con IA y realidad virtual

El Laboratorio de Biología Marina (MBL) utiliza IA, GPUs NVIDIA y realidad virtual para analizar
Imagen de proyección de núcleos celulares neuronales y dendritas.

ChatGPT lanza su propia versión de «Wrapped» con una revisión anual personalizada

OpenAI despliega «Tu Año con ChatGPT», una función que revisa la actividad anual del usuario
Captura de pantalla de la función "Tu Año con ChatGPT".

OpenAI multiplica por 80 sus reportes de explotación infantil en 2025

OpenAI reportó 75.027 casos al centro estadounidense NCMEC en el primer semestre de 2025, frente
Ilustración sobre reportes de explotación infantil.

Retro lanza Splat, una app que convierte fotos en páginas para colorear con IA

La aplicación Splat, del equipo de Retro, utiliza inteligencia artificial para transformar fotografías en dibujos
Imagen sin título

Elon Musk supera un año turbulento pese a los problemas de Tesla y la política

La fortuna de Elon Musk creció 29.000 millones de dólares en 2025, alcanzando los 462.000
Ilustración de Elon Musk en un año turbulento.

Vandalizan campaña de IA amiga en el metro de Nueva York por rechazo social

Los anuncios de ‘Friend’, una empresa que ofrece un compañero de IA mediante un collar,
Ilustración de un collar de IA compañero sobre fondo blanco.

La campaña de Mamdani utiliza el fandom como estrategia política clave

La campaña de Zohran Mamdani para la alcaldía de Nueva York marcó un cambio en
Ilustración conceptual sobre política y fandom.

Usuarios crean vídeos perturbadores de niños con IA usando Sora 2

Vídeos hiperrealistas con niños generados por IA, creados con Sora 2 de OpenAI para contenido
Ilustración de un vídeo generado por IA que muestra un juguete con forma de rosa vibrante.

Google resume sus 60 principales anuncios de IA en 2025

Google ha recopilado sus principales lanzamientos de IA durante 2025, incluyendo actualizaciones de Gemini, el
Imagen sin título

Waymo suspende su servicio de robotaxis en San Francisco tras un apagón masivo

Waymo ha suspendido temporalmente su servicio de taxis autónomos en San Francisco tras un apagón
Robotaxis de Waymo detenidos en una calle de San Francisco durante el apagón.