DeepMind presenta Genie 3, un modelo clave para la inteligencia artificial general
El nuevo sistema genera mundos interactivos en 3D con coherencia física. Google DeepMind anunció hoy su modelo Genie 3, que permite entrenar agentes de IA para tareas generales. Aún en fase de investigación, supone un avance hacia la AGI.
«Un salto cualitativo en la simulación de entornos»
Genie 3 genera minutos de entornos 3D interactivos a 720p y 24 fps, superando los 10-20 segundos de su predecesor. Según Shlomi Fruchter, director de investigación de DeepMind, es «el primer modelo de mundo interactivo de propósito general en tiempo real». Combina capacidades de Genie 2 (generación de ambientes) y Veo 3 (comprensión de física).
Memoria y consistencia física
El modelo recuerda lo generado previamente, manteniendo coherencia en las simulaciones. Jack Parker-Holder, científico de DeepMind, destacó que «enseña por sí mismo cómo funciona el mundo», sin motores de física programados. Esto permite, por ejemplo, que un agente SIMA cumpla objetivos como «acercarse al compactador verde» en un almacén virtual.
Limitaciones y potencial
Aunque no simula con precisión interacciones complejas (como la nieve al esquiar) y solo soporta minutos de interacción, DeepMind afirma que facilita el aprendizaje autónomo de agentes. Parker-Holder lo comparó con el «Movimiento 37» de AlphaGo: «Podría inaugurar una nueva era» en IA.
De los videojuegos a la AGI
Genie 3 surge en un contexto donde laboratorios como DeepMind buscan entrenar agentes de IA en entornos simulados, un reto clave para alcanzar inteligencia general. Su arquitectura autoregresiva (genera fotogramas secuencialmente) imita procesos humanos de razonamiento.
Un paso más cerca, pero no la meta
Genie 3 representa un avance técnico en modelos de mundo, pero su aplicación práctica dependerá de superar limitaciones como la duración de las simulaciones. DeepMind insiste en que la capacidad de autoaprendizaje es crucial para el desarrollo de AGI.