DeepMind lanza Genie 3, avance clave para la inteligencia artificial general

Google DeepMind presenta Genie 3, un modelo que genera mundos 3D interactivos con coherencia física, marcando un hito en el camino hacia la AGI.
TechCrunch
Imagen conceptual de Genie 3 generando un entorno interactivo Google DeepMind / TechCrunch
Imagen conceptual de Genie 3 generando un entorno interactivo Google DeepMind / TechCrunch

DeepMind presenta Genie 3, un modelo clave para la inteligencia artificial general

El nuevo sistema genera mundos interactivos en 3D con coherencia física. Google DeepMind anunció hoy su modelo Genie 3, que permite entrenar agentes de IA para tareas generales. Aún en fase de investigación, supone un avance hacia la AGI.

«Un salto cualitativo en la simulación de entornos»

Genie 3 genera minutos de entornos 3D interactivos a 720p y 24 fps, superando los 10-20 segundos de su predecesor. Según Shlomi Fruchter, director de investigación de DeepMind, es «el primer modelo de mundo interactivo de propósito general en tiempo real». Combina capacidades de Genie 2 (generación de ambientes) y Veo 3 (comprensión de física).

Memoria y consistencia física

El modelo recuerda lo generado previamente, manteniendo coherencia en las simulaciones. Jack Parker-Holder, científico de DeepMind, destacó que «enseña por sí mismo cómo funciona el mundo», sin motores de física programados. Esto permite, por ejemplo, que un agente SIMA cumpla objetivos como «acercarse al compactador verde» en un almacén virtual.

Limitaciones y potencial

Aunque no simula con precisión interacciones complejas (como la nieve al esquiar) y solo soporta minutos de interacción, DeepMind afirma que facilita el aprendizaje autónomo de agentes. Parker-Holder lo comparó con el «Movimiento 37» de AlphaGo: «Podría inaugurar una nueva era» en IA.

De los videojuegos a la AGI

Genie 3 surge en un contexto donde laboratorios como DeepMind buscan entrenar agentes de IA en entornos simulados, un reto clave para alcanzar inteligencia general. Su arquitectura autoregresiva (genera fotogramas secuencialmente) imita procesos humanos de razonamiento.

Un paso más cerca, pero no la meta

Genie 3 representa un avance técnico en modelos de mundo, pero su aplicación práctica dependerá de superar limitaciones como la duración de las simulaciones. DeepMind insiste en que la capacidad de autoaprendizaje es crucial para el desarrollo de AGI.

Bradley Tusk lanza protocolo para impulsar el voto por móvil en EE.UU.

El consultor Bradley Tusk presenta VoteSecure, un protocolo criptográfico de código abierto para votar desde
Foto-Ilustración del personal de WIRED

OpenAI soluciona el problema del guion largo en ChatGPT tras criticas

OpenAI ha corregido la incidencia que asociaba el guion largo con textos de IA. Los
Imagen sin título

Spotify introduce nuevos planes Premium en cinco mercados

Spotify introduce nuevos planes de suscripción en cinco mercados, incluido un nivel Platinum con audio
Imagen sin título

Las grandes tecnológicas negocian el futuro de la compra automatizada con IA

Las compras navideñas realizadas por agentes de IA experimentan retrasos debido a complejas negociaciones entre
Ilustración conceptual de un agente de IA realizando compras online.

Inversores de capital riesgo cambian sus reglas para financiar startups de IA

Los fondos de capital riesgo modifican sus estrategias de inversión en inteligencia artificial ante startups
Imagen sin título

OpenAI prueba chats grupales en ChatGPT en Asia y Oceanía

OpenAI inicia una prueba piloto de chats grupales para ChatGPT en cuatro países asiáticos. La
Imagen sin título

Harvey, la startup legal de IA, alcanza una valoración de 8000 millones de dólares

La startup legal Harvey ha alcanzado una valoración de 8000 millones de dólares en octubre
Imagen sin título

Apple exige transparencia en apps que comparten datos con IA de terceros

Apple actualiza sus normas exigiendo que las aplicaciones revelen y obtengan consentimiento explícito antes de
Imagen sin título

Jack Dorsey financia diVine, una nueva app que recupera el archivo de Vine

Jack Dorsey respalda diVine, una nueva aplicación que recupera más de 100.000 vídeos del archivo
Captura de pantalla de la aplicación diVine

Teradar recauda 150 millones de dólares para un sensor que supera al lidar

La startup Teradar ha recaudado 150 millones de dólares en una ronda Serie B para
Matt Carey, cofundador y CEO de Teradar, demostrando el sensor.

Cursor recauda 2.300 millones de dólares en una nueva ronda de financiación

Cursor, la herramienta de IA para desarrolladores, ha recaudado 2300 millones de dólares, duplicando su
Imagen sin título

Google actualiza NotebookLM con Deep Research y más tipos de archivo

Google añade Deep Research a NotebookLM, una herramienta que automatiza investigaciones complejas. Genera informes detallados
Imagen sin título