Google DeepMind y el Futuro de la Robótica con Gemini Robotics

Google DeepMind presenta Gemini Robotics, un avance en AI para robótica que combina lenguaje, visión y acción, mejorando tareas complejas.
WIRED
Google Deep Mind
Google Deep Mind

La inteligencia artificial ha avanzado enormemente en los últimos años, pero hasta ahora la robótica aún tenía ciertas limitaciones que la mantenían lejos de ser verdaderamente autónoma. Google DeepMind acaba de dar un gran paso en esta dirección con el lanzamiento de Gemini Robotics, un modelo que no solo permite llevar a cabo acciones físicas con un nivel de precisión nunca antes visto.

Esto significa que un robot ya puede entender su entorno, analizar lo que ve y actuar en consecuencia. Este tipo de innovación abre un sinfín de posibilidades, desde la automatización en fábricas hasta la asistencia en el hogar.

¿Quiénes están detrás de este avance?

El equipo de Google DeepMind ha estado trabajando durante años en mejorar la inteligencia artificial aplicada a la robótica. Entre los nombres clave en este desarrollo destacan Kanishka Rao y Carolina Parada, dos investigadores que han liderado el diseño y la implementación de Gemini Robotics.

El gran desafío ha sido crear un modelo que pueda operar en diferentes tipos de hardware, lo que significa que Gemini Robotics no solo es compatible con un tipo específico de robot, sino que puede adaptarse a diversas máquinas y escenarios.

¿Cómo Funciona Gemini Robotics?

Lo que hace especial a este modelo es su capacidad de combinar lenguaje, visión y acción física en un solo sistema. Por ejemplo, un brazo robótico equipado con Gemini Robotics puede manipular objetos con precisión simplemente al recibir instrucciones en lenguaje natural.

Para lograrlo, el modelo:
Interpreta el entorno visualmente (detectando formas, colores y posiciones de objetos).
Asocia estos datos con posibles acciones (por ejemplo, agarrar un vaso sin volcarlo).
Ejecuta la acción de forma segura y eficiente, ajustando su movimiento en tiempo real.

Dentro de Gemini Robotics, una variante llamada Gemini Robotics-ER se enfoca en razonamiento espacial, permitiendo a los robots entender mejor su relación con los objetos y mejorar la forma en que interactúan con su entorno.

Seguridad y Ética en la Robótica con AI

A medida que los robots se vuelven más autónomos e inteligentes, surgen preocupaciones sobre su seguridad y comportamiento en entornos reales. Google DeepMind ha desarrollado un estándar llamado ASIMOV, diseñado para identificar y prevenir riesgos potenciales en el comportamiento de los robots.

Esto es clave porque, aunque la inteligencia artificial puede traer enormes beneficios, también debe garantizarse que su uso sea seguro y ético. Con ASIMOV, se busca establecer regulaciones y protocolos que eviten posibles problemas en el uso de robots en la vida diaria.

¿Qué Significa Este Avance para el Futuro de la Robótica?

El desarrollo de Gemini Robotics representa un gran salto en la integración de la inteligencia artificial en la robótica. Aunque por ahora no hay planes inmediatos para su comercialización masiva, Google DeepMind ya está colaborando con varias empresas robóticas para probar y mejorar su implementación.

A largo plazo, esta tecnología podría revolucionar industrias enteras:
Automatización en fábricas y logística, con robots capaces de operar en entornos complejos sin intervención humana.
Asistencia en el hogar, con robots capaces de ayudar a personas con movilidad reducida o realizar tareas domésticas.
Medicina y salud, con robots capaces de manipular instrumental quirúrgico con una precisión extrema.

Conclusión

El desarrollo de Gemini Robotics marca un antes y un después en la robótica avanzada. Google DeepMind no solo está creando sistemas más inteligentes, sino que está diseñando herramientas que realmente pueden entender el mundo y actuar en él.

Si bien aún queda camino por recorrer, está claro que estamos cada vez más cerca de un futuro en el que robots inteligentes y autónomos formen parte de nuestra vida cotidiana, de una manera segura y eficiente.

TechCrunch Disrupt 2025 convoca eventos paralelos en San Francisco

Los organizadores de TechCrunch Disrupt 2025 buscan propuestas para eventos paralelos durante la semana del
Imagen sin título Información de autor no disponible / TechCrunch Events

Mastodon no puede cumplir ley de verificación edad Misisipi

La red social descentralizada alega carecer de medios técnicos para aplicar la normativa estatal que
Imagen sin título Información de autor no disponible / TechCrunch

Munify recauda 3M para neobanco de diáspora egipcia

Startup respaldada por Y Combinator ofrece transferencias más rápidas y económicas para la comunidad egipcia
Imagen sin título Información de autor no disponible / TechCrunch

Mukesh Ambani lanza nueva empresa de IA con Google y Meta

El magnate indio crea Reliance Intelligence para construir la infraestructura nacional de inteligencia artificial con
Mukesh Ambani, presidente de Reliance Industries Dhiraj Singh/Bloomberg via Getty Images / TechCrunch

Búsqueda del tesoro masiva reúne a 12.000 personas en San Francisco

Más de 12.000 participantes se unieron a Pursuit, una cacería urbana sin premio económico que
Jugadores de Pursuit reunidos en el vestíbulo del edificio Don Lee en San Francisco Boone Ashworth / WIRED

Vocal Image recauda 3,6 millones para entrenador vocal con IA

Startup estonia con 12M$ en ingresos recurrentes ofrece entrenamiento vocal mediante IA. La aplicación tiene
Imagen sin título Vanessa Buhrig / Vocal Image / TechCrunch

Will Smith publica vídeo polémico con fans de aspecto artificial

El actor Will Smith genera controversia al publicar un vídeo de su gira europea donde
Comparativa de imágenes del vídeo de Will Smith y publicaciones anteriores Andreas Rentz / Getty Images / TechCrunch

Anthropic obliga a usuarios a decidir sobre uso de chats para IA

Anthropic cambia su política de datos: usuarios deben optar por no compartir conversaciones antes del
Imagen sin título Información de autor no disponible / TechCrunch

Commonwealth Fusion Systems recauda 863 millones de Nvidia y Google

La startup de fusión nuclear obtiene financiación récord para acelerar el desarrollo de su reactor
Imagen sin título Información de autor no disponible / TechCrunch

Acuerdo Intel-EEUU impide venta de unidad de fundición

El pacto con el gobierno estadounidense incluye cláusulas que penalizan a Intel si se desprende
Imagen sin título Información de autor no disponible / TechCrunch

Inversiones en tecnología limpia en EE.UU. caen 15%

Las inversiones en manufactura de tecnología limpia en Estados Unidos registraron una caída del 15%
Imagen sin título Sean Gallup / Getty Images / TechCrunch

Threads prueba función para compartir textos largos

Meta testea nueva herramienta que permite adjuntar bloques de texto en publicaciones, compitiendo directamente con
Captura de pantalla de la nueva función de adjuntar texto en Threads Jaap Arriens/NurPhoto / Getty Images / TechCrunch