OpenAI avanza en modelos de razonamiento para agentes de IA

OpenAI desarrolla modelos como o1, capaces de razonamiento matemático avanzado, para crear agentes de IA que realicen tareas complejas en ordenadores.
TechCrunch
Sam Altman hablando en el evento OpenAI DevDay Justin Sullivan / Getty Images / TechCrunch
Sam Altman hablando en el evento OpenAI DevDay Justin Sullivan / Getty Images / TechCrunch

OpenAI desarrolla modelos de razonamiento para potenciar sus agentes de IA

El modelo o1 de OpenAI logró avances en razonamiento matemático y tareas complejas. La compañía busca crear agentes capaces de realizar acciones en ordenadores como humanos. La tecnología, desarrollada desde 2022, ya atrae talento y competencia en Silicon Valley.

«De resolver matemáticas a automatizar tareas»

OpenAI ha centrado sus esfuerzos en mejorar el razonamiento de sus modelos de IA. «Queremos que solo pidas algo al ordenador y lo haga por ti», declaró el CEO Sam Altman en 2023. El equipo MathGen, clave en este avance, entrenó modelos para competencias matemáticas, logrando que uno ganara una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO).

El salto del razonamiento matemático

El modelo o1, lanzado en 2024, combinó técnicas como el aprendizaje por refuerzo (RL) y la computación en tiempo de prueba. «Empecé a ver al modelo razonar como un humano», afirmó el investigador El Kishky. Estos avances permitieron a los modelos corregir errores y planificar respuestas, base para los futuros agentes de IA.

La batalla por el talento

Los 21 investigadores detrás de o1 son ahora los más cotizados en Silicon Valley. Meta reclutó a cinco de ellos, incluyendo a Shengjia Zhao como científico jefe de sus Laboratorios de Superinteligencia, con paquetes de hasta 100 millones de dólares.

«Volar como pájaros, pero con motores»

El debate sobre si las IA «razonan» sigue abierto. Nathan Lambert, de AI2, compara estos modelos con aviones: inspirados en la naturaleza, pero con mecanismos distintos. OpenAI prioriza resultados sobre definiciones: «Si resuelve problemas complejos, llamémoslo razonamiento», dijo Lightman.

El futuro: agentes para tareas subjetivas

Los agentes actuales triunfan en áreas verificables, como programación, pero fallan en tareas subjetivas (compras online o gestión de agendas). «Es un problema de datos», admitió Lightman. OpenAI explora técnicas de RL para entrenar modelos en tareas menos estructuradas, clave para su próximo modelo, GPT-5.

Carrera hacia la IA general

OpenAI lidera, pero competidores como Google, Anthropic y Meta avanzan rápido. La pregunta ya no es si lograrán agentes capaces, sino quién lo hará primero. Mientras, su visión sigue clara: un ChatGPT que «haga todo en internet por ti, como tú quieras».

China prohíbe a sus tecnológicas comprar chips de IA de Nvidia

La Administración del Ciberespacio de China ordena a empresas tecnológicas cesar compras y pruebas de
Jensen Huang, consejero delegado de Nvidia, en una conferencia / Chesnot / Getty Images / TechCrunch

Huawei anuncia nueva infraestructura IA tras prohibición de Nvidia en China

Huawei anuncia SuperPoD Interconnect, una tecnología para conectar 15.000 chips Ascend AI. Es una respuesta
Logotipo de Huawei / Barcroft Media / Getty Images / TechCrunch

OpenAI investiga cómo evitar que los modelos de IA mientan deliberadamente

OpenAI y Apollo Research estudian cómo sus modelos de IA mienten ocultando sus objetivos reales.
Imagen sin título / Información de autor no disponible / TechCrunch

Google Cloud ficha a startups Lovable y Windsurf para impulsar su negocio

Google Cloud anuncia la incorporación de las startups Lovable y Windsurf como clientes de inteligencia
Imagen sin título / Alex Kraus/Bloomberg / Getty Images / TechCrunch

Desarrolladores senior actúan como «niñeras» de la IA en codificación

El 95% de los programadores dedica tiempo extra a verificar y corregir código generado por
Imagen sin título / Información de autor no disponible / TechCrunch

Apple lanza iOS 26 con el diseño Liquid Glass y nuevas funciones de IA

Apple lanza iOS 26, disponible para iPhone 11 y posteriores. Su principal novedad es el
Captura de pantalla que muestra el nuevo diseño Liquid Glass de iOS 26. / Apple / TechCrunch

OpenAI lanza GPT-5-Codex para mejorar su agente de codificación IA

OpenAI lanza GPT-5-Codex, un modelo de IA para codificación que gestiona dinámicamente su tiempo de
Imagen sin título / Bryce Durbin / TechCrunch / TechCrunch

Spotify permite a usuarios gratuitos elegir canciones a demanda

Spotify permite a usuarios gratuitos buscar y reproducir cualquier canción, superando la limitación del modo
Imagen sin título / Información de autor no disponible / TechCrunch

Y Combinator destaca 9 startups con mayor demanda en su Demo Day de verano

Y Combinator presentó su Demo Day de verano con más de 160 startups. Nueve compañías
Logotipo de Y Combinator en evento de presentación de startups / Bryce Durbin / TechCrunch

CodeRabbit recauda 60 millones de dólares en una ronda Serie B

La startup de IA CodeRabbit ha cerrado una ronda de 60 millones de dólares liderada
Harjot Gill, fundador de CodeRabbit / Andriy Onufriyenko / TechCrunch

D-ID adquiere la plataforma de vídeo alemana Simpleshow

D-ID, plataforma de vídeo con IA, anuncia la compra de la startup alemana Simpleshow. La
Logotipos de las empresas D-ID y Simpleshow / Mikkel William / Getty Images Venture / TechCrunch

Gemini lidera App Store tras lanzamiento de editor de imágenes Nano Banana

La aplicación de IA de Google alcanzó el primer puesto en la App Store con
Logotipo de la aplicación Gemini en un teléfono móvil / Yulia Reznikov / TechCrunch