La práctica hace la perfección: es un adagio que ha ayudado a los humanos a volverse muy diestros y ahora es un enfoque que se está aplicando a los robots.
Los científicos informáticos de la Universidad de Leeds están utilizando las técnicas de inteligencia artificial IA de planificación automatizada y aprendizaje por refuerzo para "entrenar" a un robot para que encuentre un objeto en un espacio desordenado, como un estante de un almacén o una nevera.y muévelo.
El objetivo es desarrollar la autonomía robótica, para que la máquina pueda evaluar las circunstancias únicas que se presentan en una tarea y encontrar una solución, similar a un robot que transfiere habilidades y conocimientos a un nuevo problema.
Los investigadores de Leeds presentan sus hallazgos hoy lunes 4 de noviembre en la Conferencia Internacional sobre Robótica y Sistemas Inteligentes en Macao, China.
El gran desafío es que en un área confinada, es posible que un brazo robótico no pueda agarrar un objeto desde arriba. En cambio, tiene que planificar una secuencia de movimientos para alcanzar el objeto objetivo, tal vez manipulando otros elementos fuera del camino. La potencia de la computadora necesaria para planificar una tarea de este tipo es tan grande que el robot a menudo se detiene durante varios minutos. Y cuando ejecuta el movimiento, a menudo falla.
Desarrollando la idea de que la práctica hace la perfección, los informáticos de Leeds están reuniendo dos ideas de la IA.
Uno es la planificación automatizada. El robot es capaz de "ver" el problema a través de un sistema de visión, de hecho una imagen. El software en el sistema operativo del robot simula la posible secuencia de movimientos que podría hacer para alcanzar el objeto objetivo.
Pero las simulaciones que han sido "ensayadas" por el robot no logran capturar la complejidad del mundo real y cuando se implementan, el robot no ejecuta la tarea. Por ejemplo, puede tirar objetos del estante.
Entonces, el equipo de Leeds combinó la planificación con otra técnica de inteligencia artificial llamada aprendizaje por refuerzo.
El aprendizaje por refuerzo involucra a la computadora en una secuencia de intentos de prueba y error, alrededor de 10,000 en total, para alcanzar y mover objetos. A través de estos intentos de prueba y error, el robot "aprende" qué acciones ha planificado es más probable queterminar con éxito.
La computadora asume el aprendizaje por sí misma, comenzando seleccionando al azar un movimiento planificado que podría funcionar. Pero a medida que el robot aprende de prueba y error, se vuelve más hábil para seleccionar aquellos movimientos planificados que tienen una mayor probabilidad de tener éxito.
El Dr. Matteo Leonetti, de la Escuela de Computación, dijo: "La inteligencia artificial es buena para permitir que los robots razonen; por ejemplo, hemos visto robots involucrados en juegos de ajedrez con grandes maestros.
"Pero los robots no son muy buenos en lo que los humanos hacen muy bien: ser altamente móviles y diestros. Esas habilidades físicas han sido integradas en el cerebro humano, el resultado de la evolución y la forma en que practicamos y practicamos y practicamos.
"Y esa es una idea que estamos aplicando a la próxima generación de robots".
Según Wissam Bejjani, un estudiante de doctorado que escribió el trabajo de investigación, el robot desarrolla la capacidad de generalizar, de aplicar lo que ha planeado a un conjunto único de circunstancias.
Dijo: "Nuestro trabajo es importante porque combina la planificación con el aprendizaje por refuerzo. Mucha de la investigación para probar y desarrollar esta tecnología se centra en solo uno de esos enfoques.
"Nuestro enfoque ha sido validado por los resultados que hemos visto en el laboratorio de robótica de la Universidad.
"Con un problema, donde el robot tuvo que mover una manzana grande, primero fue al lado izquierdo de la manzana para alejar el desorden, antes de manipular la manzana.
"Hizo esto sin que el desorden cayera fuera del límite del estante".
El Dr. Mehmet Dogar, profesor asociado de la Facultad de Computación, también participó en el estudio. Dijo que el enfoque había acelerado el tiempo de "pensamiento" del robot en un factor de diez; las decisiones que tomaban 50 segundos ahora toman 5 segundos..
La investigación recibió financiación del Consejo de Investigación de Ingeniería y Ciencias Físicas del Reino Unido en un proyecto para investigar la 'física similar a la humana' en robótica.
Fuente de la historia :
Materiales proporcionado por Universidad de Leeds . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :