Los agentes de IA solo completan el 3% de tareas laborales freelance
Los agentes de IA más avanzados solo completaron el 3% del trabajo freelance simulado en un nuevo estudio. El índice Remote Labor evalúa la capacidad de automatización de tareas económicamente valiosas.
Resultados del experimento laboral
La investigación del Center for AI Safety (CAIS) y Scale AI reveló que el mejor agente solo ganó 1.810 dólares de 143.991 posibles. Las pruebas incluyeron diseño gráfico, desarrollo de juegos y tareas administrativas utilizando trabajadores verificados de Upwork.
Ranking de agentes evaluados
El agente Manus de una startup china fue el más capaz, seguido por Grok de xAI, Claude de Anthropic, ChatGPT de OpenAI y Gemini de Google. Los investigadores destacan que los modelos aún tienen dificultades con tareas complejas de múltiples pasos.
Contraste con predicciones optimistas
Estos hallazgos contrastan con el benchmark GDPval de OpenAI, que sugiere capacidades cercanas a las humanas. Mientras Amazon anuncia 14.000 despidos atribuidos a la IA, el índice indica que la tecnología no está lista para asumir esos roles.
Limitaciones técnicas actuales
Dan Hendrycks de CAIS explica que los agentes carecen de memoria a largo plazo y aprendizaje continuo. Aunque han mejorado en codificación y razonamiento lógico, no pueden adquirir habilidades en el trabajo como los humanos.
Impacto en el debate sobre empleo
El estudio ofrece una perspectiva medida sobre el desplazamiento laboral. Bing Liu de Scale AI reconoce que muchos profesionales usarán la IA como herramienta de productividad en lugar de ser reemplazados completamente.