LATENT es un sistema innovador que permite a robots humanoides aprender a jugar tenis, incluso con datos de entrenamiento incompletos y fragmentados. El problema que aborda es la dificultad de replicar las complejas habilidades de un jugador de tenis humano en un robot. Tradicionalmente, entrenar a un robot para realizar una tarea como jugar tenis requiere grandes cantidades de datos de movimiento precisos y completos, lo cual es costoso y difícil de obtener. LATENT se diferencia al utilizar 'datos de movimiento primitivos' – fragmentos de movimientos que representan habilidades básicas del tenis, en lugar de secuencias completas de partidos reales.
La clave de LATENT reside en la idea de que, aunque estos datos sean imperfectos, aún contienen información valiosa sobre cómo los humanos ejecutan movimientos básicos en el contexto del tenis. El sistema aprovecha esta información como una 'priorización' o guía inicial para el aprendizaje. Luego, el sistema corrige y combina estos fragmentos para generar una política de control (un conjunto de reglas que el robot sigue) que le permite golpear la pelota de manera consistente y devolverla a ubicaciones específicas, manteniendo al mismo tiempo un estilo de movimiento natural.
El equipo de investigación también desarrolló técnicas para facilitar la transferencia del aprendizaje desde un entorno simulado (virtual) al mundo real, un desafío común en la robótica conocido como 'sim-to-real'. Esto implica hacer que el robot aprenda a compensar las diferencias entre el entorno simulado y el mundo real, como la fricción, la gravedad y la precisión de los sensores. La política aprendida se implementó en un robot humanoide Unitree G1, logrando resultados sorprendentes: el robot puede mantener rallies (intercambios de golpes) estables con jugadores humanos reales.
En resumen, LATENT representa un avance significativo en la robótica atlética, demostrando que es posible entrenar a robots humanoides para realizar tareas complejas incluso con datos de entrenamiento limitados, abriendo la puerta a nuevas aplicaciones en áreas como la rehabilitación, el entrenamiento deportivo y el entretenimiento. El éxito del sistema también destaca la importancia de aprovechar la información disponible, incluso si es imperfecta, para guiar el aprendizaje de robots.
