Recientemente, el Toyota Research Institute (TRI) anunció un innovador enfoque de Inteligencia Artificial (IA), generativa basado en la política de difusión para enseñar a los robots habilidades y destrezas nuevas de forma rápida y segura. Este avance mejora significativamente la utilidad de los robots y es un paso hacia la construcción de “grandes modelos de comportamiento (LBM)” para robots, análogos a los grandes modelos de lenguaje (LLM) que recientemente han revolucionado la IA conversacional.
“Nuestra investigación en robótica tiene como objetivo amplificar a las personas en lugar de reemplazarlas”, dijo Gill Pratt, director ejecutivo de TRI y científico jefe de Toyota Motor Corporation. “Esta nueva técnica de enseñanza es muy eficiente y produce comportamientos de muy alto rendimiento, lo que permite a los robots amplificar a las personas de muchas maneras y mucho más efectivas”.
Las técnicas de vanguardia anteriores para enseñar a los robots nuevos comportamientos eran lentas, inconsistentes, ineficientes y, a menudo, se limitaban a tareas estrechamente definidas, realizadas en entornos muy restringidos. Los especialistas en robótica necesitaban pasar muchas horas escribiendo código sofisticado y/o utilizando numerosos ciclos de prueba y error para programar comportamientos.
El TRI ya ha enseñado a los robots más de 60 habilidades difíciles y diestras utilizando el nuevo enfoque, incluido verter líquidos, usar herramientas y manipular objetos deformables. Estos logros se lograron sin escribir una sola línea de código nuevo; el único cambio fue proporcionar nuevos datos al robot. Aprovechando este éxito, el TRI se ha fijado el ambicioso objetivo de enseñar cientos de nuevas habilidades para finales de año y mil para finales de 2024.
Esta nueva técnica de Toyota permite enseñar a los robots a funcionar en nuevos escenarios y realizar una amplia variedad de comportamientos. Estas habilidades no se limitan simplemente a “elegir y colocar” o simplemente recoger objetos y colocarlos en nuevas ubicaciones. Los robots del Toyota Research Institute ahora pueden interactuar con el mundo de maneras variadas y ricas, lo que algún día permitirá que los robots apoyen a las personas en situaciones cotidianas y en entornos impredecibles y en constante cambio.
“Las tareas que estoy viendo realizar a estos robots son simplemente asombrosas; incluso hace un año, no habría predicho que estaríamos cerca de este nivel de destreza diversa”, comentó Russ Tedrake, vicepresidente de Investigación en Robótica del TRI. “Lo que resulta tan emocionante de este nuevo enfoque es la velocidad y la confiabilidad con la que podemos agregar nuevas habilidades. Debido a que estas habilidades funcionan directamente a partir de imágenes de cámaras y sensores táctiles, utilizando solo representaciones aprendidas, pueden desempeñarse bien incluso en tareas que involucran objetos, telas y líquidos deformables, todo lo cual tradicionalmente ha sido extremadamente difícil para los robots”.
El modelo de comportamiento del robot del TRI aprende de demostraciones hápticas de un maestro, combinadas con una descripción lingüística del objetivo. La aplicación principal de la tecnología háptica es la recreación del sentido del tacto a través del empleo de un conjunto de fuerzas, vibraciones y movimientos a la persona con el objetivo de hacer que su experiencia sea lo más realista posible. Luego utiliza una política de difusión basada en IA para aprender la habilidad demostrada. Este proceso permite desplegar un nuevo comportamiento de forma autónoma a partir de decenas de manifestaciones. Este enfoque no sólo produce resultados consistentes, repetibles y de alto rendimiento, sino que lo hace a una velocidad tremenda.
“La plataforma de robot de TRI está diseñada a medida para realizar tareas diestras de manipulación con dos brazos con un enfoque especial en permitir la retroalimentación háptica y la detección táctil. La seguridad del proceso ha sido clave y es fundamental para los esfuerzos en robótica en TRI. En Toyota se ha diseñado el sistema con sólidas salvaguardias para garantizar que nuestros robots respeten las garantías de seguridad, como no chocar consigo mismos ni con su entorno”, puntualizó Tedrake.