los investigadores del MIT han inventado una forma de optimizar de manera eficiente el control y el diseño de robots blandos para tareas objetivo, que tradicionalmente ha sido una tarea monumental en la computación.
Los robots blandos tienen cuerpos elásticos, flexibles y elásticos que pueden moverse esencialmente un número infinito de formas en cualquier momento dado. Computacionalmente, esto representa una "representación de estado" altamente compleja, que describe cómo se mueve cada parte del robot. Representaciones de estadolos robots blandos pueden tener potencialmente millones de dimensiones, lo que dificulta calcular la forma óptima de hacer que un robot complete tareas complejas.
En la Conferencia sobre Sistemas de Procesamiento de Información Neural el próximo mes, los investigadores del MIT presentarán un modelo que aprende una representación de estado compacta o "de baja dimensión" pero detallada, basada en la física subyacente del robot y su entorno, entreotros factores. Esto ayuda al modelo a co-optimizar iterativamente el control de movimiento y los parámetros de diseño de material para tareas específicas.
"Los robots blandos son criaturas de dimensiones infinitas que se doblan de mil millones de maneras diferentes en un momento dado", dice el primer autor Andrew Spielberg, un estudiante graduado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial CSAIL. "Pero, en verdad,existen formas naturales en las que es probable que los objetos blandos se doblen. Encontramos que los estados naturales de los robots blandos se pueden describir de manera muy compacta en una descripción de baja dimensión. Optimizamos el control y el diseño de los robots blandos aprendiendo una buena descripción de los estados probables ".
En las simulaciones, el modelo permitió que los robots blandos 2D y 3D completaran tareas, como moverse ciertas distancias o alcanzar un punto objetivo, más rápidamente y con mayor precisión que los métodos actuales de vanguardia. Los investigadores planean luegoimplementar el modelo en robots blandos reales.
Junto a Spielberg en el papel están los estudiantes graduados de CSAIL, Allan Zhao, Tao Du y Yuanming Hu; Daniela Rus, directora de CSAIL y el profesor de Ingeniería Eléctrica e Informática Andrew y Erna Viterbi; y Wojciech Matusik, profesor asociado del MIT enIngeniería eléctrica e informática y jefe del Grupo de Fabricación Computacional.
"Aprendizaje en el bucle"
La robótica suave es un campo de investigación relativamente nuevo, pero es prometedor para la robótica avanzada. Por ejemplo, los cuerpos flexibles podrían ofrecer una interacción más segura con los humanos, una mejor manipulación de objetos y más maniobrabilidad, entre otros beneficios.
El control de robots en simulaciones se basa en un "observador", un programa que calcula variables que ven cómo se mueve el robot blando para completar una tarea. En trabajos anteriores, los investigadores descompusieron el robot blando en grupos de partículas simuladas diseñados a manoLas partículas contienen información importante que ayuda a reducir los posibles movimientos del robot. Si un robot intenta doblarse de cierta manera, por ejemplo, los actuadores pueden resistir ese movimiento lo suficiente como para que pueda ser ignorado. Pero, para robots tan complejos, elegir manualmente qué gruposrealizar un seguimiento durante las simulaciones puede ser complicado.
A partir de ese trabajo, los investigadores diseñaron un método de "optimización de aprendizaje en el bucle", donde todos los parámetros optimizados se aprenden durante un solo ciclo de retroalimentación en muchas simulaciones. Y, al mismo tiempo que la optimización del aprendizaje, o"en el bucle": el método también aprende la representación del estado.
El modelo emplea una técnica llamada método de punto de material MPM, que simula el comportamiento de partículas de materiales continuos, como espumas y líquidos, rodeadas por una cuadrícula de fondo. Al hacerlo, captura las partículas del robot ysu entorno observable en píxeles o píxeles 3D, conocidos como vóxeles, sin la necesidad de ningún cálculo adicional.
En una fase de aprendizaje, esta información de cuadrícula de partículas sin procesar se alimenta a un componente de aprendizaje automático que aprende a ingresar una imagen, comprimirla en una representación de baja dimensión y descomprimir la representación nuevamente en la imagen de entrada. Si este "autoencoder"retiene suficientes detalles al comprimir la imagen de entrada, puede recrear con precisión la imagen de entrada de la compresión.
En el trabajo de los investigadores, las representaciones comprimidas aprendidas del autoencoder sirven como representación de estado de baja dimensión del robot. En una fase de optimización, esa representación comprimida vuelve al controlador, lo que genera una actuación calculada de cómo cada partícula del robot deberíamoverse en el siguiente paso simulado MPM.
Simultáneamente, el controlador usa esa información para ajustar la rigidez óptima para que cada partícula logre el movimiento deseado. En el futuro, esa información de material puede ser útil para robots blandos de impresión 3D, donde cada punto de partícula puede imprimirse con un poco diferente"Esto permite crear diseños de robots adaptados a los movimientos del robot que serán relevantes para tareas específicas", dice Spielberg. "Al aprender estos parámetros juntos, mantiene todo lo más sincronizado posible para facilitar el proceso de diseño".
optimización más rápida
Toda la información de optimización es, a su vez, retroalimentada al inicio del ciclo para entrenar al autoencoder. Durante muchas simulaciones, el controlador aprende el movimiento óptimo y el diseño del material, mientras que el autoencoder aprende la representación de estado cada vez más detallada ".la clave es que queremos que ese estado de baja dimensión sea muy descriptivo ", dice Spielberg.
Después de que el robot llega a su estado final simulado durante un período de tiempo establecido, por ejemplo, lo más cerca posible del destino objetivo, actualiza una "función de pérdida". Ese es un componente crítico del aprendizaje automático, que intentaminimizar algún error. En este caso, minimiza, digamos, qué tan lejos se detuvo el robot del objetivo. Esa función de pérdida fluye de regreso al controlador, que utiliza la señal de error para ajustar todos los parámetros optimizados para completar mejor la tarea.
Si los investigadores intentaran alimentar directamente todas las partículas en bruto de la simulación al controlador, sin el paso de compresión, "el tiempo de ejecución y optimización explotaría", dice Spielberg. Usando la representación comprimida, los investigadores podrían disminuir la ejecucióntiempo para cada iteración de optimización desde varios minutos hasta aproximadamente 10 segundos.
Los investigadores validaron su modelo en simulaciones de varios robots bi y cuadrúpedos 2D y 3D. También encontraron que, si bien los robots que utilizan métodos tradicionales pueden tomar hasta 30,000 simulaciones para optimizar estos parámetros, los robots entrenados en su modelo solo tomaron alrededor de 400simulaciones
Implementar el modelo en robots blandos reales significa abordar los problemas con el ruido y la incertidumbre del mundo real que pueden disminuir la eficiencia y precisión del modelo. Pero, en el futuro, los investigadores esperan diseñar una tubería completa, desde la simulación hasta la fabricación, para el software blandorobots.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :