Durante años, buena parte de la robótica humanoide ha partido de una idea sencilla: para que un robot se mueva como una persona, primero hay que mostrarle cómo se mueve una persona. Esa lógica ha impulsado sistemas basados en teleoperación, captura de movimiento y adaptación de gestos humanos a cuerpos robóticos. Ha funcionado, pero tiene un límite evidente. No siempre hay una demostración humana disponible para cada situación real que puede encontrar una máquina.
MotionDisco propone una ruta distinta. El nuevo marco, desarrollado por investigadores de la Universidad Técnica de Múnich, la Universidad de Nueva York y la Universidad Carnegie Mellon, permite que un robot humanoide descubra movimientos complejos por sí mismo. No parte de vídeos humanos ni de sesiones de teleoperación. Parte de una descripción del entorno, de un objetivo y de un sistema capaz de explorar distintas formas de contacto con el mundo físico.
La diferencia no es menor. En lugar de imitar una coreografía ya conocida, el robot busca soluciones. Puede decidir dónde apoyar una mano, cuándo cambiar el peso del cuerpo o cómo colocar un pie para trepar sobre una superficie. El objetivo no es que el humanoide parezca humano, sino que encuentre una estrategia viable para cumplir la tarea.
El problema de enseñar con ejemplos humanos
El aprendizaje por imitación ha dado resultados importantes en robótica. Sistemas recientes han conseguido trasladar movimientos humanos a plataformas humanoides con un nivel de coordinación cada vez mayor. Aun así, esa vía tiene un coste difícil de escalar.
Recopilar demostraciones de calidad exige tiempo, equipamiento y escenarios controlados. También obliga a anticipar situaciones: pasillos estrechos, objetos mal colocados, superficies a distinta altura o tareas en las que el robot necesita usar todo el cuerpo para llegar a un objetivo. ¿Qué ocurre cuando aparece una combinación que nadie ha grabado antes?
MotionDisco intenta responder a esa pregunta. Su enfoque no elimina la dificultad física del problema, pero cambia el punto de partida. El robot no recibe una receta cerrada, sino un mecanismo para probar, descartar y mejorar planes de movimiento.
Cómo funciona MotionDisco
El sistema combina dos piezas principales. Por un lado, un modelo de lenguaje, Claude Opus 4.7, genera y modifica programas en Python que describen posibles secuencias de contacto. Por otro, un optimizador de trayectorias comprueba si esos planes pueden ejecutarse sin violar las restricciones físicas del robot.
La clave está en separar dos niveles de decisión. El modelo de lenguaje se ocupa de la parte estratégica: propone qué extremidades deberían tocar qué superficies y en qué orden. El optimizador se encarga de la parte física: analiza si el cuerpo puede adoptar esas posturas, si hay colisiones o si las fuerzas necesarias tienen sentido.
El ciclo funciona así:
- El modelo genera un plan de contacto a partir de la escena y del objetivo.
- Un filtro cinemático descarta propuestas imposibles por geometría, límites articulares o autocolisiones.
- Los planes viables pasan a una optimización más completa, que incorpora dinámica, fuerzas y controles.
- Cuando algo falla, el sistema devuelve una explicación estructurada para orientar el siguiente intento.
Ese último punto es importante. MotionDisco no se limita a probar planes al azar. Si una propuesta falla, el sistema identifica el motivo y lo transforma en retroalimentación útil para la siguiente iteración. El modelo actúa como un programador que corrige su propio código después de recibir errores concretos.
Del plátano suspendido al parkour humanoide
Los investigadores probaron MotionDisco en ocho tareas de largo recorrido, con interacción intensa entre robot, objetos y entorno. Una de las más llamativas es la tarea del “plátano”: el humanoide debe alcanzar un objetivo situado por encima de su rango normal. Para lograrlo, el sistema descubre una secuencia en la que el robot apila un objeto, trepa sobre él y usa su cuerpo completo para estabilizarse.
No se trata solo de caminar hacia un punto. El robot debe combinar locomoción y manipulación. Tiene que entender que una superficie puede servir como apoyo, que una mano puede estabilizar el cuerpo y que cambiar el contacto en el momento incorrecto puede arruinar toda la maniobra.
También se evaluaron escenarios con obstáculos, pasillos cargados y tareas tipo parkour. En algunos casos, una sola búsqueda produjo varias soluciones válidas para el mismo problema. Esto ocurre porque MotionDisco mantiene distintas poblaciones de candidatos, llamadas “islas”, que exploran alternativas sin converger demasiado pronto en una única estrategia.
El resultado es relevante para la robótica humanoide. Un mismo objetivo puede resolverse con diferentes patrones de apoyo, posiciones de manos o secuencias de pies. Esa diversidad aporta datos útiles para entrenar políticas de control y evita que el sistema dependa de una única trayectoria frágil.
Prueba en un robot real
Para validar que las trayectorias no eran solo simulaciones, el equipo entrenó políticas de seguimiento mediante aprendizaje por refuerzo y las desplegó en un robot humanoide Unitree G1. El paso al hardware es clave, porque muchas soluciones que parecen elegantes en simulación se vuelven inestables cuando aparecen fricción real, holguras mecánicas o pequeños errores de equilibrio.
En las pruebas físicas, el robot reprodujo maniobras de cuerpo completo descubiertas por el sistema. Usó brazos para estabilizarse, ajustó la postura en espacios reducidos y ejecutó movimientos que no procedían de una demostración humana directa. MotionDisco muestra así una vía para generar habilidades complejas sin depender siempre de bases de datos de movimiento humano.
Eso no significa que el método esté listo para cualquier entorno. El propio trabajo reconoce limitaciones. El sistema parte de una escena conocida y todavía no integra percepción visual para construir el entorno de forma autónoma. Además, su modelo de contacto se centra en superficies y objetos relativamente estructurados. Para operar en casas, fábricas o espacios públicos, necesitaría ampliar esa capacidad.
La paradoja del hardware humanoide
El proyecto también deja una lectura industrial. El marco de software nace de una colaboración académica entre instituciones de Alemania y Estados Unidos, pero su validación se apoya en una plataforma china: el Unitree G1. Este detalle llega en un momento en el que la robótica avanzada se está convirtiendo en un asunto tecnológico y político.
En Estados Unidos ya se ha presentado la GUARD Act, una propuesta legislativa bipartidista que busca someter a revisión robots fabricados por China y otros países considerados adversarios. El texto plantea prohibir la importación de aquellos modelos que sean considerados una amenaza para la seguridad nacional.
La consecuencia práctica podría ser compleja para universidades y laboratorios. Si ciertas plataformas quedan restringidas, parte de la investigación basada en hardware accesible y replicable podría verse afectada. La robótica humanoide no solo compite por mejores algoritmos, también por cadenas de suministro, acceso a máquinas y control tecnológico.
MotionDisco no resuelve esa tensión, pero la expone con claridad. Su aportación técnica está en demostrar que un humanoide puede descubrir formas de moverse sin copiar a una persona. Su lectura más amplia apunta a otra pregunta: quién tendrá acceso al hardware necesario para convertir esos avances en robots reales.
Por ahora, el trabajo marca un paso relevante. La robótica humanoide empieza a alejarse de la simple imitación y se acerca a sistemas que exploran, fallan, corrigen y encuentran soluciones propias. El reto ya no es solo enseñar a los robots a moverse como nosotros, sino permitirles descubrir movimientos que nosotros quizá no habríamos diseñado.
