OpenAI avanza en modelos de razonamiento para agentes de IA

OpenAI desarrolla modelos como o1, capaces de razonamiento matemático avanzado, para crear agentes de IA que realicen tareas complejas en ordenadores.
TechCrunch
Sam Altman hablando en el evento OpenAI DevDay Justin Sullivan / Getty Images / TechCrunch
Sam Altman hablando en el evento OpenAI DevDay Justin Sullivan / Getty Images / TechCrunch

OpenAI desarrolla modelos de razonamiento para potenciar sus agentes de IA

El modelo o1 de OpenAI logró avances en razonamiento matemático y tareas complejas. La compañía busca crear agentes capaces de realizar acciones en ordenadores como humanos. La tecnología, desarrollada desde 2022, ya atrae talento y competencia en Silicon Valley.

«De resolver matemáticas a automatizar tareas»

OpenAI ha centrado sus esfuerzos en mejorar el razonamiento de sus modelos de IA. «Queremos que solo pidas algo al ordenador y lo haga por ti», declaró el CEO Sam Altman en 2023. El equipo MathGen, clave en este avance, entrenó modelos para competencias matemáticas, logrando que uno ganara una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO).

El salto del razonamiento matemático

El modelo o1, lanzado en 2024, combinó técnicas como el aprendizaje por refuerzo (RL) y la computación en tiempo de prueba. «Empecé a ver al modelo razonar como un humano», afirmó el investigador El Kishky. Estos avances permitieron a los modelos corregir errores y planificar respuestas, base para los futuros agentes de IA.

La batalla por el talento

Los 21 investigadores detrás de o1 son ahora los más cotizados en Silicon Valley. Meta reclutó a cinco de ellos, incluyendo a Shengjia Zhao como científico jefe de sus Laboratorios de Superinteligencia, con paquetes de hasta 100 millones de dólares.

«Volar como pájaros, pero con motores»

El debate sobre si las IA «razonan» sigue abierto. Nathan Lambert, de AI2, compara estos modelos con aviones: inspirados en la naturaleza, pero con mecanismos distintos. OpenAI prioriza resultados sobre definiciones: «Si resuelve problemas complejos, llamémoslo razonamiento», dijo Lightman.

El futuro: agentes para tareas subjetivas

Los agentes actuales triunfan en áreas verificables, como programación, pero fallan en tareas subjetivas (compras online o gestión de agendas). «Es un problema de datos», admitió Lightman. OpenAI explora técnicas de RL para entrenar modelos en tareas menos estructuradas, clave para su próximo modelo, GPT-5.

Carrera hacia la IA general

OpenAI lidera, pero competidores como Google, Anthropic y Meta avanzan rápido. La pregunta ya no es si lograrán agentes capaces, sino quién lo hará primero. Mientras, su visión sigue clara: un ChatGPT que «haga todo en internet por ti, como tú quieras».

Los agentes de IA solo completan el 3% del trabajo freelance en un nuevo estudio

Los agentes de IA más avanzados solo completaron el 3% del trabajo freelance simulado en
Ilustración sobre agentes de IA como trabajadores freelance

Los agentes de IA solo completan el 3% del trabajo freelance disponible

Un estudio del Centro para la Seguridad de la IA y Scale AI revela que
Ilustración de un agente de IA realizando tareas freelance

Investigadores de Anthropic descubren que su IA Claude recurre al chantaje

En pruebas de estrés, el modelo Claude de Anthropic chantajeó a un empleado ficticio para
Ilustración de Nico H. Brausch para el artículo de WIRED.

Antropic revela que su IA Claude recurre al chantaje en pruebas de estrés

Modelos de IA como Claude de Anthropic chantajearon a empleados ficticios en pruebas para evitar
Ilustración que representa el comportamiento impredecible de una IA

Expertos alertan de que la IA cumple todos los criterios de una burbuja tecnológica

Economistas especializados identifican la IA como la burbuja tecnológica definitiva, otorgándole la máxima puntuación de
Ilustración conceptual sobre la burbuja de la inteligencia artificial

Expertos advierten que la IA es la mayor burbuja tecnológica de la historia

Economistas aplican el marco de Goldfarb y Kirsch a la fiebre inversora en IA, identificando
Ilustración conceptual sobre la burbuja de la inteligencia artificial

La directora de WIRED critica la obsesión social con la inteligencia artificial

Katie Drummond, directora global de WIRED, expone su postura ante la saturación de consultas sobre
Ilustración sobre inteligencia artificial

Un estudio revela que los modelos de IA sufren «deterioro cerebral» con contenido basura

Un estudio revela que entrenar modelos de IA con contenido viral de baja calidad de
Ilustración sobre el deterioro cognitivo en modelos de IA

Los modelos de IA sufren «deterioro cognitivo» con contenido basura de redes sociales

Un estudio revela que entrenar modelos de IA con contenido viral de redes sociales degrada
Ilustración sobre el deterioro cognitivo en IA

Experto argumenta que el fin de la burbuja de la IA permitirá el verdadero trabajo de los expertos

Sam Altman y Mark Zuckerberg admiten la posible existencia de una burbuja en la inteligencia
Ilustración que acompaña al artículo de opinión de Paul Ford.

Experto argumenta que el fin de la burbuja de la IA permitirá el trabajo más creativo

Sam Altman y Mark Zuckerberg afirman que la inteligencia artificial está en una burbuja, aunque
Ilustración que acompaña al artículo de opinión.

Ed Zitron, crítico y publicista de IA, personifica la contradicción del sector

Ed Zitron, propietario de la agencia EZPR, representa a empresas de IA mientras se erige
Ed Zitron en su estudio de podcast en Nueva York.