Atlas de Boston Dynamics usa un único modelo de IA para moverse y agarrar
El robot humanoide ejecuta tareas con un modelo de aprendizaje generalista. Desarrollado junto al Toyota Research Institute, el sistema muestra comportamientos emergentes no programados. Este avance supone un paso significativo hacia algoritmos robóticos de propósito general.
Un cerebro único para brazos y piernas
El robot Atlas aprende a controlar tanto sus extremidades superiores como inferiores a partir de un rango de acciones de ejemplo. El modelo se alimenta de imágenes de sus sensores visuales, datos de propiocepción y prompts de lenguaje. «Los pies son como manos adicionales para el modelo», afirma Russ Tedrake, del Toyota Research Institute y el MIT.
Habilidades que surgen de forma natural
El modelo exhibe comportamientos emergentes básicos, como recuperar un objeto que se le cae sin haber sido entrenado específicamente para ello. Esta capacidad instintiva de recuperación es un signo de un aprendizaje más generalizado y natural.
El camino hacia robots más versátiles
Este enfoque de modelo único representa un avance significativo respecto a la norma anterior, donde se usaban modelos separados para tareas de locomoción y manipulación. Ken Goldberg, roboticista de UC Berkeley, señala que «la coordinación de piernas y brazos es un gran avance». El progreso podría conducir a robots operando en entornos complejos con facilidad.
Inspirados en los modelos de lenguaje
La estrategia sigue un camino similar al utilizado en los Modelos de Lenguaje Grande (LLM), con la esperanza de que el aumento de datos de entrenamiento para robots produzca habilidades nuevas y sorprendentes. Los roboticistas creen que los enfoques que funcionaron para los LLM también son efectivos para la robótica, buscando un punto de inflexión similar al que llevó a ChatGPT.
Un futuro de aprendizaje acelerado
El avance acerca la posibilidad de robots humanoides capaces de operar en una amplia gama de entornos y de aprender nuevas habilidades rápidamente, desde soldar tuberías hasta preparar cafés, sin necesidad de un reentrenamiento extensivo. La eficacia final dependerá de la escalabilidad de este enfoque de aprendizaje unificado.