DeepMind presenta SIMA 2, un agente de IA que razona con Gemini
SIMA 2 dobla el rendimiento de su predecesor. Google DeepMind ha mostrado una versión preliminar de su agente de IA generalista, que integra el modelo de lenguaje Gemini para entender y actuar en entornos virtuales.
Un salto en capacidades
La compañía afirma que SIMA 2 es un cambio radical respecto a la primera versión. Puede completar tareas complejas en entornos no vistos previamente y es un agente que se auto-mejora con su propia experiencia. Esta evolución se considera un paso hacia sistemas de Inteligencia Artificial General (IAG) y robots de propósito general.
Razonamiento y acción integrados
El agente utiliza Gemini para razonar internamente. En una demostración, interpretó que una casa «del color de un tomate maduro» era roja y se dirigió a ella. También responde a instrucciones basadas en emojis y puede navegar e interactuar en mundos fotorrealistas generados por Genie, otro modelo de DeepMind.
Hacia la auto-mejora
Un avance clave es la capacidad de aprender sin datos humanos. SIMA 2 usa un modelo Gemini para crear nuevas tareas y otro para puntuar sus intentos. Estas experiencias auto-generadas sirven como datos de entrenamiento, permitiendo al agente aprender de sus errores y mejorar su desempeño de forma autónoma.
El camino a la robótica
Los investigadores de DeepMind ven en SIMA 2 un componente fundamental para robots. El sistema se centra en el comportamiento de alto nivel, como la comprensión del mundo y el razonamiento necesario para realizar misiones complejas. Sin embargo, no hay un calendario definido para su implementación en sistemas robóticos físicos.