OpenAI lanza dos modelos de IA de razonamiento de código abierto
Los modelos GPT-OSS-120B y GPT-OSS-20B están disponibles gratuitamente en Hugging Face. La compañía los presenta como «punteros» en su categoría, aunque generan más alucinaciones que sus versiones propietarias. El lanzamiento responde a la competencia de laboratorios chinos y presiones políticas.
«Un paso atrás para estar adelante»
OpenAI anunció este martes dos modelos de IA de pesos abiertos, los primeros desde GPT-2 en 2019. El CEO Sam Altman admitió que la empresa «estuvo en el lado equivocado de la historia» al priorizar el código cerrado. La decisión busca contrarrestar el dominio chino en IA abierta, con actores como DeepSeek o Alibaba.
Detalles técnicos
El modelo grande (GPT-OSS-120B) funciona en una GPU de Nvidia, mientras que el ligero (GPT-OSS-20B) corre en portátiles con 16GB de RAM. Ambos usan arquitectura Mixture-of-Experts (MoE) y aprendizaje por refuerzo, como los modelos O-Series. Sin embargo, solo procesan texto y no imágenes o audio.
Rendimiento y limitaciones
En pruebas como Codeforces o Humanity’s Last Exam (HLE), superan a modelos abiertos chinos pero no a los propietarios de OpenAI. El mayor problema son las alucinaciones: erran en el 49%-53% de respuestas sobre conocimiento humano, frente al 16% del modelo O1.
Bajo la lupa política
El lanzamiento coincide con presiones del gobierno de EE.UU. para promover IA «alineada con valores democráticos». OpenAI licencia los modelos bajo Apache 2.0, permitiendo su uso comercial, pero no liberará los datos de entrenamiento por disputas legales sobre copyright.
De código cerrado a abierto… con cautela
Tras años centrada en modelos propietarios, OpenAI retoma el código abierto en un mercado donde Meta perdió liderazgo. La competencia china y las demandas por uso de datos marcaron el cambio, aunque mantienen controles: evaluaron riesgos en ciberseguridad y armas biológicas antes del lanzamiento.
Un nuevo capítulo en la carrera de la IA
El movimiento acerca a OpenAI a su misión original de IA accesible, pero con limitaciones técnicas y legales. Su impacto dependerá de cómo los desarrolladores adopten estos modelos frente a alternativas como el próximo DeepSeek R2 o las propuestas de Meta.