OpenAI presenta su nuevo modelo de razonamiento: o3

OpenAI ha lanzado su último modelo de razonamiento, o3, junto con una versión más pequeña llamada o3-mini, diseñado para mejorar en áreas como la física, ciencia y matemáticas. El modelo busca acercarse a la inteligencia general artificial con mejoras significativas respecto a su predecesor.
Lorem Ipsum
Logotipo estilizado con formas entrelazadas en un fondo de colores suaves.
Representación gráfica de un logotipo con un diseño moderno y colores vibrantes.

OpenAI ha revelado o3, el sucesor del modelo de razonamiento o1 lanzado a principios de este año. El modelo o3 viene junto a una versión más pequeña llamada o3-mini y ha sido diseñado para tareas específicas. Según OpenAI, o3 podría incluso acercarse a la «inteligencia general artificial» (AGI) en ciertas condiciones, aunque con varias advertencias importantes.

Razones para el nombre y disponibilidad

El CEO de OpenAI, Sam Altman, explicó que decidieron llamar al modelo o3 y no o2 para evitar conflictos con la marca de la empresa británica de telecomunicaciones O2. Actualmente, o3 y o3-mini no están ampliamente disponibles, aunque los investigadores de seguridad pueden inscribirse para probar o3-mini a partir de hoy.

Características y limitaciones del o3

O3 es un modelo de razonamiento, lo que significa que tiene la capacidad de revisar sus propios hechos y evitar errores comunes en los modelos de inteligencia artificial. Sin embargo, esto provoca una latencia, haciendo que o3 tarde un poco más en llegar a soluciones comparado con los modelos convencionales. Este modelo fue entrenado para «pensar» antes de responder y ofrece un razonamiento más confiable en áreas como la física, la ciencia y la matemática.

Impacto en el camino hacia la AGI

OpenAI sugiere que o3 podría estar más cerca de alcanzar el AGI, que es la capacidad de un sistema de realizar cualquier tarea que un humano pueda lograr. Según elbenchmark ARC-AGI, o3 logró una puntuación del 87.5% en un entorno de alta capacidad computacional, un salto significativo en comparación con su predecesor o1.

Rendimiento en pruebas y comparación con otros modelos

El o3 supera a muchos de sus competidores en diferentes pruebas y evaluaciones. EnSWE-Bench Verified, un estándar de tareas de programación, el modelo supera a o1 por 22.8 puntos porcentuales. Además, alcanza un 96.7% en el Examen Invitational Americano de Matemáticas de 2024 y establece un nuevo récord en el benchmark Frontier Math de EpochAI.

Tendencias en modelos de razonamiento

Desde que OpenAI lanzó su primera serie de modelos de razonamiento, muchas otras empresas, como Google y la firma de investigación DeepSeek, han lanzado sus propios modelos. Esto muestra una búsqueda creciente de nuevos métodos para refinar la inteligencia artificial generativa.

| AGI | ai | ia | modelo_o3 | o3 |

Kayak lanza un modo de IA para búsquedas y reservas de viajes

El buscador de viajes Kayak ha integrado un chatbot con tecnología ChatGPT en su web.
Imagen sin título

Empresas de IA recopilan sus propios datos para entrenar modelos

Compañías de IA como Turing Labs y Fyxer abandonan el scraping web por la recolección
Imagen sin título

Commonwealth Fusion Systems y Google DeepMind colaboran en reactor de fusión con IA

Google DeepMind colabora con Commonwealth Fusion Systems para optimizar el reactor de fusión Sparc mediante
Imagen sin título

Jefe de IA de Meta recomienda el «vibe coding» para adolescentes

El director de IA de Meta, Alexandr Wang, recomienda a adolescentes dedicar 10.000 horas al
Imagen sin título

Doubao de ByteDance supera a DeepSeek como chatbot de IA más popular en China

Doubao supera a DeepSeek como aplicación de IA más usada en China con 157 millones
Ilustración de la aplicación Doubao

Ejecutivo de IA de Apple, Ke Yang, ficha por Meta

Ke Yang, responsable de la búsqueda web con IA en Apple, se une a Meta.
Imagen sin título

Pinterest introduce controles para limitar el «contenido IA» en los feeds

Pinterest implementa controles para que los usuarios limiten la visualización de contenido generado por IA
Interfaz de configuración de Pinterest mostrando los controles de contenido IA

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

El espacio de exposición para TechCrunch Disrupt 2025 está casi completo. Las startups tienen hasta
Imagen sin título

General Intuition recauda 134 millones de dólares para IA espacial

El laboratorio de IA General Intuition ha obtenido 133,7 millones de dólares en financiación inicial.
Equipo fundador de General Intuition

TechCrunch Disrupt 2025 se celebrará en San Francisco del 27 al 29 de octubre

El evento TechCrunch Disrupt 2025 se celebra en San Francisco del 27 al 29 de
Imagen sin título

Spotify se alía con discográficas para crear productos de IA musical

Spotify pacta con Sony, Universal, Warner y Merlin para desarrollar IA musical que respete derechos
Imagen sin título

Jack & Jill recauda 50 millones para llevar IA conversacional a la búsqueda de empleo

La startup Jack & Jill ha recaudado 50 millones de dólares para su plataforma de
Imagen sin título