OpenAI desarrolla modelos de razonamiento para potenciar sus agentes de IA
El modelo o1 de OpenAI logró avances en razonamiento matemático y tareas complejas. La compañía busca crear agentes capaces de realizar acciones en ordenadores como humanos. La tecnología, desarrollada desde 2022, ya atrae talento y competencia en Silicon Valley.
«De resolver matemáticas a automatizar tareas»
OpenAI ha centrado sus esfuerzos en mejorar el razonamiento de sus modelos de IA. «Queremos que solo pidas algo al ordenador y lo haga por ti», declaró el CEO Sam Altman en 2023. El equipo MathGen, clave en este avance, entrenó modelos para competencias matemáticas, logrando que uno ganara una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO).
El salto del razonamiento matemático
El modelo o1, lanzado en 2024, combinó técnicas como el aprendizaje por refuerzo (RL) y la computación en tiempo de prueba. «Empecé a ver al modelo razonar como un humano», afirmó el investigador El Kishky. Estos avances permitieron a los modelos corregir errores y planificar respuestas, base para los futuros agentes de IA.
La batalla por el talento
Los 21 investigadores detrás de o1 son ahora los más cotizados en Silicon Valley. Meta reclutó a cinco de ellos, incluyendo a Shengjia Zhao como científico jefe de sus Laboratorios de Superinteligencia, con paquetes de hasta 100 millones de dólares.
«Volar como pájaros, pero con motores»
El debate sobre si las IA «razonan» sigue abierto. Nathan Lambert, de AI2, compara estos modelos con aviones: inspirados en la naturaleza, pero con mecanismos distintos. OpenAI prioriza resultados sobre definiciones: «Si resuelve problemas complejos, llamémoslo razonamiento», dijo Lightman.
El futuro: agentes para tareas subjetivas
Los agentes actuales triunfan en áreas verificables, como programación, pero fallan en tareas subjetivas (compras online o gestión de agendas). «Es un problema de datos», admitió Lightman. OpenAI explora técnicas de RL para entrenar modelos en tareas menos estructuradas, clave para su próximo modelo, GPT-5.
Carrera hacia la IA general
OpenAI lidera, pero competidores como Google, Anthropic y Meta avanzan rápido. La pregunta ya no es si lograrán agentes capaces, sino quién lo hará primero. Mientras, su visión sigue clara: un ChatGPT que «haga todo en internet por ti, como tú quieras».