Runway lanza su primer modelo mundial GWM-1 y añade audio nativo a Gen 4.5
La empresa de IA Runway ha presentado su primer modelo mundial, GWM-1, un sistema que aprende una simulación interna del mundo para razonar y planificar. La compañía también ha actualizado su modelo de vídeo Gen 4.5 con capacidades de audio nativo y generación de vídeos largos con múltiples planos.
Un modelo para simular y entender el mundo
Runway se une así a la carrera por los modelos mundiales. GWM-1 funciona mediante predicción fotograma a fotograma, creando una simulación con comprensión de la física y el comportamiento del mundo. La empresa lo presenta como más «general» que competidores como el Genie-3 de Google. Su objetivo es crear simulaciones para entrenar agentes en robótica y ciencias de la vida.
Tres aplicaciones específicas del modelo
Runway ha lanzado tres versiones especializadas. GWM-Worlds permite crear proyectos interactivos a partir de un texto o imagen, generando un mundo con comprensión de geometría y física a 24 fps. GWM-Robotics busca generar datos sintéticos con parámetros como condiciones meteorológicas cambiantes para entrenar robots. GWM-Avatars se centra en construir avatares realistas para simular comportamiento humano. La empresa planea fusionar estos tres modelos en uno en el futuro.
La actualización paralela del modelo de vídeo
Paralelamente, Runway ha actualizado su modelo de vídeo Gen 4.5. Esta versión incorpora audio nativo y generación de vídeos largos de hasta un minuto con consistencia de personajes, diálogos y planos complejos. Los usuarios también pueden editar audio existente y vídeos de múltiples planos de cualquier duración. Esta actualización acerca a Runway a las capacidades de suites integrales como la de su competidor Kling.
Disponibilidad y aplicaciones empresariales
El modelo de vídeo Gen 4.5 actualizado ya está disponible para todos los usuarios de planes de pago. Para el modelo mundial, Runway hará disponible GWM-Robotics a través de un SDK y mantiene conversaciones con varias empresas de robótica y otros sectores para el uso de GWM-Robotics y GWM-Avatars.
Antecedentes: La base en la generación de vídeo
Runway indicó que para construir un modelo mundial primero necesitaban un gran modelo de vídeo. Su CTO, Anastasis Germanidis, afirmó que enseñar a los modelos a predecir píxeles directamente es el mejor camino para lograr una simulación de propósito general, lo que, a suficiente escala, permite construir un modelo que comprenda cómo funciona el mundo.
Cierre: Un paso hacia herramientas listas para producción
El lanzamiento de GWM-1 y la actualización de Gen 4.5 señalan que los modelos de generación de vídeo están pasando de ser prototipos a convertirse en herramientas listas para producción. Runway posiciona su tecnología no solo para la creación de contenido, sino como base para simulaciones avanzadas en diversos campos industriales y de investigación.