top of page

Robot de MIT juega Jenga, combinando visión y tacto.

  • Foto del escritor: Autor de Blazel
    Autor de Blazel
  • 26 abr 2019
  • 5 Min. de lectura

Actualizado: 4 may 2019

El enfoque “machine-learning” podría ayudar robots a ensamblar teléfonos celulares y otras partes pequeñas en una línea de producción.

ree

En el sótano del Edificio 3 del MIT, un robot está contemplando cuidadosamente su próximo movimiento. Golpea suavemente en una torre de bloques, buscando el mejor bloque para extraer sin derribar la torre, en un juego solitario, lento pero sorprendentemente ágil de Jenga.


El robot, desarrollado por los ingenieros del MIT, está equipado con una pinza suave, un brazalete con sensor de fuerza y ​​una cámara externa, todo lo cual utiliza para ver y sentir la torre y sus bloques individuales.


A medida que el robot empuja con cuidado contra un bloque, una computadora toma retroalimentación visual y táctil de su cámara y brazalete, y compara estas medidas con los movimientos que el robot realizó anteriormente. También considera los resultados de esos movimientos, específicamente, si un bloque, en una configuración determinada y empujado con una cierta cantidad de fuerza, se extrajo con éxito o no. En tiempo real, el robot "aprende" si debe seguir empujando o moverse hacia un nuevo bloque para evitar que la torre se caiga.


Los detalles del robot Jenga se publicaron en la revista Science Robotics. Alberto Rodríguez, profesor asistente de desarrollo de carrera de Walter Henry Gale en el Departamento de Ingeniería Mecánica del MIT, dijo que el robot demuestra algo que ha sido difícil de lograr en sistemas anteriores: la capacidad de aprender rápidamente la mejor manera de realizar una tarea, no solo a partir de señales visuales, como se estudia comúnmente en la actualidad, sino también de interacciones físicas y táctiles.


“A diferencia de las tareas o juegos más puramente cognitivos, como el Ajedrez o el Go, jugar el juego de Jenga también requiere dominar las habilidades físicas, como sondear, empujar, jalar, colocar y alinear piezas. Requiere percepción y manipulación interactivas, donde tienes que ir y tocar la torre para aprender cómo y cuándo mover bloques”, dijo Rodríguez. “Esto es muy difícil de simular, por lo que el robot tiene que aprender en el mundo real, interactuando con la verdadera torre Jenga. El desafío clave es aprender de un número relativamente pequeño de experimentos explotando el sentido común sobre los objetos y la física".


Él explicó que el sistema de aprendizaje táctil que los investigadores han desarrollado se puede usar en aplicaciones más allá de Jenga, especialmente en tareas que requieren una interacción física cuidadosa, que incluye la separación de objetos reciclables de la basura y el ensamblaje de productos de consumo.


"En una línea de ensamblaje de teléfonos celulares, en casi cada paso, la sensación de un ajuste a presión, o un tornillo roscado, viene de la fuerza y ​​el tacto en lugar de la visión", dice Rodríguez. "Los modelos de aprendizaje para esas acciones son los recursos principales para este tipo de tecnología".

El autor principal del artículo es el estudiante graduado del MIT Nima Fazeli. El equipo también incluye a Miquel Oller, Jiajun Wu, Zheng Wu y Joshua Tenenbaum, profesor de ciencias cerebrales y cognitivas en el MIT.




Hale y empuje

En el juego de Jenga – "construir" en Swahili - 54 bloques rectangulares se apilan en 18 capas de tres bloques cada una, con los bloques en cada capa orientados perpendicularmente a los bloques de abajo. El objetivo del juego es extraer cuidadosamente un bloque y colocarlo en la parte superior de la torre, construyendo así un nuevo nivel, sin derribar toda la estructura.


Para programar un robot para jugar con Jenga, los esquemas tradicionales de aprendizaje automático pueden requerir capturar todo lo que pueda ocurrir entre un bloque, el robot y la torre, una tarea computacional costosa que requiere datos de miles, si no decenas de miles de intentos de extracción de bloques.


En cambio, Rodríguez y sus colegas buscaron una forma más eficiente de datos para que un robot aprendiera a jugar a Jenga, inspirado en la cognición humana y en la forma en que nosotros mismos podríamos abordar el juego.


El equipo personalizó un brazo robótico ABB IRB 120 estándar de la industria, luego instaló una torre Jenga al alcance del robot y comenzó un período de entrenamiento en el que el robot eligió primero un bloque aleatorio y una ubicación en el bloque contra el cual empujar. Luego ejerció una pequeña cantidad de fuerza en un intento de empujar el bloque fuera de la torre.

Para cada intento de bloque, una computadora registró las mediciones visuales y de fuerza asociadas, y etiquetó si cada intento fue un éxito.


En lugar de realizar decenas de miles de intentos (lo que implicaría reconstruir la torre casi tantas veces), el robot se entrenó en aproximadamente 300, con intentos de mediciones y resultados similares agrupados en grupos que representan ciertos comportamientos de bloque. Por ejemplo, un grupo de datos puede representar intentos en un bloque que fue difícil de mover, en lugar de uno que fue más fácil de mover, o que derribó la torre cuando se movió. Para cada grupo de datos, el robot desarrolló un modelo simple para predecir el comportamiento de un bloque, dadas sus actuales medidas visuales y táctiles.


Fazeli dice que esta técnica de agrupación aumenta dramáticamente la eficiencia con la que el robot puede aprender a jugar, y se inspira en la forma natural en que los humanos agrupan comportamientos similares: "El robot construye grupos y luego aprende modelos para cada uno de estos grupos, en lugar de aprender un modelo que capture absolutamente todo lo que podría suceder".



Apilar


Los investigadores probaron su enfoque contra otros algoritmos de aprendizaje automático de última generación, en una simulación por computadora del juego utilizando el simulador MuJoCo. Las lecciones aprendidas en el simulador informaron a los investigadores sobre la forma en que el robot aprendería en el mundo real.


"Proporcionamos a estos algoritmos la misma información que obtiene nuestro sistema, para ver cómo ellos aprenden a jugar a Jenga a un nivel similar", dice Oller. "En comparación con nuestro enfoque, estos algoritmos necesitan explorar órdenes de magnitud más elevadas para aprender el juego".


Curiosos por saber cómo su enfoque de "machine-learning" se compara con jugadores humanos reales, el equipo llevó a cabo algunas pruebas informales con varios voluntarios.

"Vimos la cantidad de bloques que un humano pudo extraer antes de que cayera la torre, y la diferencia no fue tan grande", dice Oller.

Pero todavía hay mucho camino por recorrer si los investigadores quieren enfrentar a su robot de manera competitiva contra un jugador humano. Además de las interacciones físicas, Jenga requiere una estrategia, como extraer el bloque correcto que dificultará que un oponente saque el siguiente bloque sin derribar la torre.

Por ahora, el equipo está menos interesado en desarrollar un campeón robótico de Jenga y más enfocado en aplicar las nuevas habilidades del robot en otras áreas.


"Hay muchas tareas que hacemos con nuestras manos donde la sensación de hacerlo" de la manera correcta "se produce en el lenguaje de las fuerzas y las señales táctiles", dice Rodríguez. "Para tareas como estas, un enfoque similar al nuestro podría resolverlo".


Esta investigación fue apoyada, en parte, por la National Science Foundation a través de la National Robotics Initiative.


Escrito por: Jennifer Chu | Traducido por: Joel Blanco

 
 
 

Comentarios


BLAZEL

BLAZEL© 2019

Logo Blaziel-02.png

EQUIPO BLAZEL 

Social wiz in the media biz 

  • Blanco Icono de Instagram

BOLETÍN SEMANAL 

bottom of page