OpenAI presenta su nuevo modelo de razonamiento: o3

OpenAI ha lanzado su último modelo de razonamiento, o3, junto con una versión más pequeña llamada o3-mini, diseñado para mejorar en áreas como la física, ciencia y matemáticas. El modelo busca acercarse a la inteligencia general artificial con mejoras significativas respecto a su predecesor.
Lorem Ipsum
Logotipo estilizado con formas entrelazadas en un fondo de colores suaves.
Representación gráfica de un logotipo con un diseño moderno y colores vibrantes.

OpenAI ha revelado o3, el sucesor del modelo de razonamiento o1 lanzado a principios de este año. El modelo o3 viene junto a una versión más pequeña llamada o3-mini y ha sido diseñado para tareas específicas. Según OpenAI, o3 podría incluso acercarse a la «inteligencia general artificial» (AGI) en ciertas condiciones, aunque con varias advertencias importantes.

Razones para el nombre y disponibilidad

El CEO de OpenAI, Sam Altman, explicó que decidieron llamar al modelo o3 y no o2 para evitar conflictos con la marca de la empresa británica de telecomunicaciones O2. Actualmente, o3 y o3-mini no están ampliamente disponibles, aunque los investigadores de seguridad pueden inscribirse para probar o3-mini a partir de hoy.

Características y limitaciones del o3

O3 es un modelo de razonamiento, lo que significa que tiene la capacidad de revisar sus propios hechos y evitar errores comunes en los modelos de inteligencia artificial. Sin embargo, esto provoca una latencia, haciendo que o3 tarde un poco más en llegar a soluciones comparado con los modelos convencionales. Este modelo fue entrenado para «pensar» antes de responder y ofrece un razonamiento más confiable en áreas como la física, la ciencia y la matemática.

Impacto en el camino hacia la AGI

OpenAI sugiere que o3 podría estar más cerca de alcanzar el AGI, que es la capacidad de un sistema de realizar cualquier tarea que un humano pueda lograr. Según elbenchmark ARC-AGI, o3 logró una puntuación del 87.5% en un entorno de alta capacidad computacional, un salto significativo en comparación con su predecesor o1.

Rendimiento en pruebas y comparación con otros modelos

El o3 supera a muchos de sus competidores en diferentes pruebas y evaluaciones. EnSWE-Bench Verified, un estándar de tareas de programación, el modelo supera a o1 por 22.8 puntos porcentuales. Además, alcanza un 96.7% en el Examen Invitational Americano de Matemáticas de 2024 y establece un nuevo récord en el benchmark Frontier Math de EpochAI.

Tendencias en modelos de razonamiento

Desde que OpenAI lanzó su primera serie de modelos de razonamiento, muchas otras empresas, como Google y la firma de investigación DeepSeek, han lanzado sus propios modelos. Esto muestra una búsqueda creciente de nuevos métodos para refinar la inteligencia artificial generativa.

| AGI | ai | ia | modelo_o3 | o3 |

Juez de Florida archiva demanda contra Deel por sanciones rusas

Un juez de Florida desestimó la demanda que acusaba a la empresa de nóminas Deel
Imagen sin título Vaughn Ridley / Sportsfile for Collision / Getty Images / TechCrunch

Google anuncia evento Made by Google para el 20 de agosto

Google presentará su evento Made by Google este miércoles 20 de agosto a las 10:00
Imagen de hardware de Google (créditos: David Paul Morris/Bloomberg / Getty Images) David Paul Morris / TechCrunch

Tribunal paraliza acciones de NLRB contra SpaceX por inconstitucionalidad

Un tribunal federal de apelaciones paralizó las acciones de la NLRB contra SpaceX al considerar
Imagen sin título Alisha Jucevic/Bloomberg / Getty Images / TechCrunch

Databricks recauda 1000M para bases de datos de IA

La empresa de análisis de datos cierra una ronda de financiación de 1000 millones de
Imagen sin título Información de autor no disponible / TechCrunch

TechCrunch Disrupt 2025 analiza herramientas IA para startups

El evento reunirá a fundadores y expertos en San Francisco para debatir cómo las herramientas
Imagen sin título Kimberly White / Getty Images / TechCrunch

Google pagará 30 millones por demanda de datos de niños en YouTube

Google desembolsará 30 millones de dólares para resolver una demanda colectiva por presunta recogida ilegal
Imagen sin título Información de autor no disponible / TechCrunch

Meta reorganiza su división de IA en cuatro nuevos grupos

Meta crea los Meta Superintelligence Labs para impulsar su desarrollo en inteligencia artificial, reorganizando sus
Imagen sin título Getty Images / TechCrunch

Meta lanza traducciones con IA para creadores en redes sociales

Meta implementa traducciones automáticas con IA que mantienen la voz y tono original del creador
Interfaz de la función de traducción de voz de Meta AI Meta / TechCrunch

TechCrunch Disrupt 2025 reúne 10.000 líderes en San Francisco

El evento tecnológico más importante del año se celebrará del 27 al 29 de octubre
Vista del expositor de Google Cloud en TechCrunch Disrupt 2024 Slava Brazer Photography / TechCrunch Events

India propone prohibición total de juegos de dinero real online

El gobierno indio presenta un borrador de ley que prohibiría todas las apuestas con dinero
Imagen representativa de juegos de azar online triloks / Getty Images / TechCrunch

OpenAI busca valoración récord de 500.000 millones de dólares

La startup de inteligencia artificial podría convertirse en la empresa privada más valiosa del mundo,
Ilustración del artículo sobre la valoración de OpenAI WIRED Staff; Getty Images / WIRED

Aalo Atomics recauda 100M para microreactor nuclear

La startup anuncia financiación de 100 millones de dólares para construir su primer microreactor nuclear
Imagen sin título Información de autor no disponible / TechCrunch