Los agentes de IA solo completan el 3% del trabajo freelance disponible

Un estudio del Centro para la Seguridad de la IA y Scale AI revela que los agentes de IA más avanzados solo completaron el 2,9% de tareas freelance simuladas, generando 1.810$ de 143.991$ posibles, debido a limitaciones técnicas actuales.
WIRED
Ilustración de un agente de IA realizando tareas freelance
Ilustración de un agente de IA realizando tareas freelance / WIRED Staff; Getty Images / WIRED

Los mejores agentes de IA automatizan menos del 3% del trabajo freelance

Los agentes de IA más capaces solo completaron el 2,9% de las tareas freelance simuladas. Un nuevo estudio del Centro para la Seguridad de la IA (CAIS) y Scale AI evalúa el potencial real de la automatización de labores económicamente valiosas.

Resultados del Índice de Trabajo Remoto

La investigación probó varios agentes de IA líderes en tareas simuladas de plataformas como Upwork. El agente más eficaz fue Manus, seguido por Grok, Claude, ChatGPT y Gemini. En conjunto, estos sistemas solo generaron 1.810 dólares de los 143.991 posibles.

Limitaciones técnicas actuales

Dan Hendrycks, director de CAIS, indica que los modelos carecen de memoria a largo plazo y no pueden aprender continuamente de experiencias. Aunque han mejorado en codificación o razonamiento lógico, luchan con tareas complejas de múltiples pasos y con el uso integrado de diferentes herramientas.

Antecedentes: Expectativas versus realidad

Avances espectaculares en IA habían llevado a especulaciones sobre que reemplazaría a gran número de trabajadores. En marzo, el CEO de Anthropic sugirió que el 90% del trabajo de codificación se automatizaría en meses. Olas anteriores de IA también generaron predicciones desacertadas, como el reemplazo inminente de radiólogos.

Cierre: Implicaciones para el mercado laboral

El estudio contrasta con el benchmark GDPval de OpenAI, que sugiere que los modelos se acercan a las habilidades humanas. Aunque Amazon anunció 14.000 despidos atribuidos parcialmente a la IA, el índice indica que la IA no asumirá estos roles vacantes a corto plazo. Muchos freelancers probablemente usarán la IA como herramienta para amplificar su productividad, no como reemplazo.

Known, la app de citas con IA de voz, recibe 9,7 millones de dólares

La startup Known ha recaudado 9,7 millones de dólares para su app de citas, que
Logotipo de la aplicación de citas Known.

OpenAI actualiza normas de seguridad para menores en ChatGPT

OpenAI actualiza su Model Spec con reglas estrictas para interacciones con adolescentes, prohibiendo juegos de
Representación de un adolescente usando un ordenador portátil.

Seis predicciones sobre el impacto y riesgos de la IA para 2026

Un análisis periodístico especula que OpenAI, cuya plantilla se quintuplicó hasta 4.500 empleados, podría realizar
Ilustración sobre predicciones de IA para 2026.

Meta desarrolla un nuevo modelo de imagen y video para 2026

Meta planea lanzar en 2026 los modelos de IA Mango, para imagen y vídeo, y
Imagen sin título

OpenAI negocia una ronda de 100.000 millones para una valoración de 830.000 millones

OpenAI negocia una ronda de financiación de hasta 100.000 millones de dólares, según el Wall
Imagen sin título

La autora de ‘Heated Rivalry’ aborda las teorías de fans y la polémica

La adaptación de la novela ‘Heated Rivalry’ se convierte en la serie original más vista
Fotograma de la serie 'Heated Rivalry'.

El videojuego ‘Avatar: Frontiers of Pandora’ supera a las películas según la crítica

Según un sector de la comunidad, el videojuego ‘Avatar: Frontiers of Pandora’ ofrece una experiencia
Fotograma de Avatar: The Way of Water.

Comité de Supervisión de EEUU publica nuevas fotos de la finca de Jeffrey Epstein

El Comité de Supervisión de la Cámara de Representantes de EE.UU. ha publicado un nuevo
Sergey Brin y David Brooks en un evento al que asistió Jeffrey Epstein

NVIDIA se une a la misión Genesis del Departamento de Energía de EE.UU.

NVIDIA se une al Departamento de Energía de EE.UU. como socio industrial en la misión
Imagen sin título

OpenAI lanza un directorio de aplicaciones para ChatGPT

OpenAI abre un directorio de aplicaciones dentro de ChatGPT, permitiendo a los desarrolladores publicar sus
Imagen sin título

NVIDIA lanza la RTX PRO 5000 72GB Blackwell para IA agentica en el escritorio

NVIDIA lanza la RTX PRO 5000 con 72GB de memoria GDDR7, basada en la arquitectura
La tarjeta de gráficos NVIDIA RTX PRO 5000 Blackwell GPU.

Pickle Robot nombra a exdirectivo de Tesla como su primer director financiero

Pickle Robot, fabricante de robots para almacenes, nombra a Jeff Evanson, exvicepresidente de Tesla, como
Imagen sin título