Los robots humanoides y sus últimos avances

27 sep 2024
Las habilidades adquiridas en simulaciones se transfieren al robot humanoide con Sim2Real (Foto: Unitree)

INVESTIGACIÓN LOGÍSTICA
Por Jay Huang, Ph.D, Dien Wang, Ph.D y Weibin Liang, Ph.D

Foto: Unitree

Los robots humanoides, la forma autómata definitiva con la que la humanidad ha soñado durante mucho tiempo, parecen comenzar a convertirse en realidad. La presentación de Optimus ha aumentado el interés por parte del público y los gigantes tecnológicos, si bien la industria aún sigue en la fase de prototipado.

Inspirados por la anatomía humana, los tres elementos principales de los humanoides son el “cerebro”, destinado a la planificación de tareas y desplazamientos, el “cerebelo”, que les ayuda a mantener el equilibrio y a moverse de forma suave, y el “cuerpo”, que les proporciona la percepción y la capacidad de ejecutar acciones. Algunos de los desafíos principales a los que se enfrentan estos robots son prevenir las caídas y mejorar su inteligencia para completar distintos cometidos.

La inteligencia artificial (IA) ha cambiado las reglas del juego. Técnicas emergentes como el aprendizaje por refuerzo, por imitación o los modelos lingüísticos de gran tamaño (LLM) están dibujando un camino prometedor para los robots humanoides. Gracias a su “cerebelo”, pueden mantener el equilibrio, evitar interrupciones, ejecutar movimientos complejos en mundos virtuales y, después, migrar estas habilidades al mundo real. Los “cerebelos” mejorados con IA muestran avances notables en áreas como la estabilidad y la adaptabilidad de los robots, que en el pasado constituyeron enormes complicaciones. Y si esta región del encéfalo es vital, el “cerebro” de los humanoides posee una relevancia aún mayor. Los aprendizajes por refuerzo y por imitación son muy esperanzadores para aplicaciones entrenadas a corto plazo. El uso de grandes modelos de lenguaje es atractivo, pero en la práctica su implementación sigue resultando un reto. La teleoperación, en la que un robot remoto es controlado por un operador humano, sobresale en la recogida de datos de entrenamiento y puede servir como plan de contingencia si los “cerebros” robóticos no están bien preparados a medio plazo.

Antes de la incorporación de la IA en este terreno, los androides se caían fácilmente

En cuanto a las empresas que están desarrollando humanoides y a los últimos avances conseguidos, Unitree es la dominante en el campo del “cuerpo” y el “cerebelo”. Aunque inicialmente se centró en robots de cuatro patas, la compañía ha transicionado al reino de los bípedos y su humanoide posee una capacidad de movimiento excepcional. Por otra parte, Google DeepMind ha avanzado en el desarrollo del “cerebro” robótico. Está explorando la genAI y otras técnicas más allá de los grandes modelos tradicionales, y su investigación se basa en humanoides simplificados.

Los tres elementos cruciales para los humanoides son el “cerebro”, el “cerebelo” y el “cuerpo”, incluyendo sus “ojos”, “oídos”, “piel”, “músculos” y “huesos”. Eso sí, los principales aspectos a mejorar de los tres son relativamente independientes y pueden perfeccionarse en paralelo.

Los humanoides todavía necesitan de una mayor estabilidad antes de su despliegue (Foto: Unitree)
Foto: Unitree

El “cerebelo”

Tal y como ocurre con los humanos, el “cerebelo” de un humanoide desempeña un papel fundamental en la coordinación de sus articulaciones asegurando el equilibrio y la ejecución de movimientos suaves.

Que los robots caminaran con estabilidad supuso un reto. Antes de la incorporación de la IA en este terreno, los androides se caían fácilmente, por lo que incluso se hacía necesario utilizar cables de seguridad para proteger las máquinas más frágiles. Si bien algunas compañías implementaron métodos de control relativamente avanzados como el control total del cuerpo y el control predictivo por modelo (CPM) con resultados impresionantes, los humanoides siguen sin estar capacitados para defenderse de modo eficaz en escenarios impredecibles. Necesitan una optimización más eficiente para su locomoción o ejecutar tareas específicas, y el “cerebelo” todavía presenta escollos en este ámbito.

Por suerte, la IA —a saber, el aprendizaje por refuerzo— y las potentes técnicas de simulación disponibles hoy pueden cambiar las reglas del juego. El aprendizaje por refuerzo es un proceso de ensayo y error en el que los robots aprenden comportamientos a través de interacciones repetidas con su entorno. Los ingenieros programan a los humanoides con órdenes sobre “qué hacer”, pero no les indican “cómo hacerlo” para que los autómatas encuentren una solución por sí mismos.

La visión artificial o 3D a través escáneres LiDAR o cámaras de profundidad, las manos ágiles y los sensores táctiles y de presión son determinantes para el desempeño de los humanoides

Para perfeccionar estos movimientos se requiere el uso de simulaciones, es decir, entornos virtuales donde los robots pueden mejorar su locomoción y ejecución de tareas. Después, las habilidades y conocimientos adquiridos en la simulación virtual pueden transferirse a la realidad en infraestructuras conocidas como Sim2Real. Los fracasos son inevitables en las primeras fases, pero finalmente los robots encuentran la manera de superar estas dificultades.

Pese a que el futuro parece prometedor, los entornos de simulación y el Sim2Real también plantean ciertos obstáculos. Son plataformas complejas que replican fenómenos físicos, lo que implica manejar aspectos como la dinámica de cuerpos rígidos, las colisiones, las fricciones y las deformaciones a fin de crear mundos virtuales lo más realistas posibles.

Boston Dynamics ha disminuido la frecuencia de caída de su robot de cuatro patas a una vez cada 50 kilómetros. Esta cifra es superior entre los bípedos por lo que, pese a haber logrado grandes avances, los humanoides todavía necesitan de una mayor estabilidad antes de protagonizar un despliegue generalizado en la industria.

Robot humanoide Optimus Gen-2 de Tesla (publicado con licencia CC BY 3.0 Unported)
Robot humanoide Optimus Gen-2 de Tesla
Publicado con licencia CC BY 3.0 Unported

El “cerebro”

Los investigadores aún están explorando cómo hacer que los robots sean lo suficientemente inteligentes como para desarrollar distintos tipos de tareas. A corto plazo, el problema se está abordando mediante aprendizajes por refuerzo y por imitación y se espera implementar modelos lingüísticos de gran tamaño y modelos end-to-end a largo plazo.

Además de mejorar el movimiento de los robots, el aprendizaje por refuerzo es útil para entrenarlos para tareas específicas. Sin embargo, emplearlo para lograr su autonomía en acciones más generales puede llevar demasiado tiempo. Es por ello que un enfoque más práctico es el aprendizaje por imitación, en el que una persona muestra al humanoide cómo actuar a través de sistemas de teleoperación.

El equipo de Google DeepMind propuso adoptar múltiples grandes modelos para manejar las funciones de percepción, planificación y ejecución. A fin de lograrlo, introdujo un modelo integrado de visión-lenguaje-acción (VLA) llamado Robotic Transformer 2 (RT-2) para acometer estas tres funciones principales. Demostraron que RT-2 puede completar tareas que requieren aplicar el razonamiento, la comprensión de símbolos y el reconocimiento propios de los humanos. Por ejemplo, la orden “pon la fresa en el tazón correcto” requiere que el robot entienda qué es un bol y qué es un cuenco, pero también que sea capaz de agrupar este fruto con otros similares.

El “cuerpo”

Más allá de componentes principales como motores y reductores, consideramos que elementos como la visión artificial o 3D a través escáneres LiDAR o cámaras de profundidad, las manos ágiles y los sensores táctiles y de presión son determinantes para el desempeño de los humanoides. Es por ello que creemos que resultarán indispensables para lograr robots avanzados con una funcionalidad óptima.

Tendencias emergentes y desafíos de los robots humanoides

Principales módulos de los robots humanoides Tendencias tecnológicas Retos
“Cerebro”
Planificación de tareas y movimientos
  • Presente: aprendizaje por refuerzo + aprendizaje por imitación
  • Futuro: modelos lingüísticos de gran tamaño (LLM)
  • Futuro a largo plazo: grandes modelos end-to-end
  • Falta de datos para su entrenamiento
  • Incapacidad de asumir ciertas tareas
  • Fiabilidad por verificar
“Cerebelo”
Coordinación de las articulaciones
  • Pasado: control total del cuerpo + control predictivo por modelo (CPM)
  • Presente: aprendizaje por refuerzo + Sim2Real*
  • Calidad de la transferencia de la simulación al mundo real
  • Adaptabilidad a distintos entornos
“Cuerpo”
Percepción del entorno y ejecución del movimiento
  • Motores de alta densidad de potencia
  • Manos robóticas flexibles
  • Sensores táctiles y de presión
  • Reducción de costos
  • Mejora del rendimiento del hardware (alta densidad de potencia, dinámica, disminución del peso, etc.)

 

Fuentes: Academia china de las Ciencias, Centro de innovación de robots humanoides de Pekín, Universidad Tsinghua y análisis de Bernstein.
*Sim2Real, la abreviatura de “simulación de la realidad”, se refiere a transferir movimientos, habilidades o conocimientos desde una simulación virtual al mundo real.

Implicaciones en la industria

En esta era del “renacimiento de los robots”, la IA suele incorporar recursos para tareas de localización, identificación e inspección, pero los robots industriales aún carecen de inteligencia avanzada. Las tecnologías emergentes como el aprendizaje por refuerzo, por imitación o los grandes modelos de lenguaje pueden revolucionar este área.

Los científicos ya han demostrado la viabilidad de utilizar robots e inteligencia artificial de forma conjunta en aspectos como la optimización de sus trayectorias y tiempos de ejecución, la generación de estrategias para desenvolverse en escenarios complejos y la simplificación de procesos de programación. Con un ecosistema de robots industriales ya consolidado, esperamos que la IA impulse su adopción en un futuro próximo.

 


 

AUTORES DE LA INVESTIGACIÓN:

Jay Huang, Ph.D, Dien Wang, Ph.D y Weibin Liang, Ph.D, analistas de investigación de Sanford C. Bernstein (Hong Kong) Limited, parte del Société Générale Groupe.

 


 

Publicación original:

Huang, Jay, Wang, Dien, Liang, Weibin. 2024. “Global Automation: The Humanoid Primer”. Bernstein Société Générale Group.

Este artículo ha sido preparado únicamente para inversionistas institucionales y profesionales, y no está destinado para inversionistas minoristas o particulares. Visite www.bernsteinresearch.com para estar al día de avances importantes.