Noticias científicas

de organizaciones de investigación

1

2

Robots trabajadores que aprenden de los errores

Fecha :: 4 de noviembre de 2019
Fuente :: Universidad de Leeds
Resumen :: La práctica hace la perfección: es un adagio que ha ayudado a los humanos a volverse muy diestros y ahora es un enfoque que se está aplicando a los robots.
Compartir :

HISTORIA COMPLETA

La práctica hace la perfección: es un adagio que ha ayudado a los humanos a volverse muy diestros y ahora es un enfoque que se está aplicando a los robots.

Los científicos informáticos de la Universidad de Leeds están utilizando las técnicas de inteligencia artificial IA de planificación automatizada y aprendizaje por refuerzo para "entrenar" a un robot para que encuentre un objeto en un espacio desordenado, como un estante de un almacén o una nevera.y muévelo.

El objetivo es desarrollar la autonomía robótica, para que la máquina pueda evaluar las circunstancias únicas que se presentan en una tarea y encontrar una solución, similar a un robot que transfiere habilidades y conocimientos a un nuevo problema.

Los investigadores de Leeds presentan sus hallazgos hoy lunes 4 de noviembre en la Conferencia Internacional sobre Robótica y Sistemas Inteligentes en Macao, China.

El gran desafío es que en un área confinada, es posible que un brazo robótico no pueda agarrar un objeto desde arriba. En cambio, tiene que planificar una secuencia de movimientos para alcanzar el objeto objetivo, tal vez manipulando otros elementos fuera del camino. La potencia de la computadora necesaria para planificar una tarea de este tipo es tan grande que el robot a menudo se detiene durante varios minutos. Y cuando ejecuta el movimiento, a menudo falla.

Desarrollando la idea de que la práctica hace la perfección, los informáticos de Leeds están reuniendo dos ideas de la IA.

Uno es la planificación automatizada. El robot es capaz de "ver" el problema a través de un sistema de visión, de hecho una imagen. El software en el sistema operativo del robot simula la posible secuencia de movimientos que podría hacer para alcanzar el objeto objetivo.

Pero las simulaciones que han sido "ensayadas" por el robot no logran capturar la complejidad del mundo real y cuando se implementan, el robot no ejecuta la tarea. Por ejemplo, puede tirar objetos del estante.

Entonces, el equipo de Leeds combinó la planificación con otra técnica de inteligencia artificial llamada aprendizaje por refuerzo.

El aprendizaje por refuerzo involucra a la computadora en una secuencia de intentos de prueba y error, alrededor de 10,000 en total, para alcanzar y mover objetos. A través de estos intentos de prueba y error, el robot "aprende" qué acciones ha planificado es más probable queterminar con éxito.

La computadora asume el aprendizaje por sí misma, comenzando seleccionando al azar un movimiento planificado que podría funcionar. Pero a medida que el robot aprende de prueba y error, se vuelve más hábil para seleccionar aquellos movimientos planificados que tienen una mayor probabilidad de tener éxito.

El Dr. Matteo Leonetti, de la Escuela de Computación, dijo: "La inteligencia artificial es buena para permitir que los robots razonen; por ejemplo, hemos visto robots involucrados en juegos de ajedrez con grandes maestros.

"Pero los robots no son muy buenos en lo que los humanos hacen muy bien: ser altamente móviles y diestros. Esas habilidades físicas han sido integradas en el cerebro humano, el resultado de la evolución y la forma en que practicamos y practicamos y practicamos.

"Y esa es una idea que estamos aplicando a la próxima generación de robots".

Según Wissam Bejjani, un estudiante de doctorado que escribió el trabajo de investigación, el robot desarrolla la capacidad de generalizar, de aplicar lo que ha planeado a un conjunto único de circunstancias.

Dijo: "Nuestro trabajo es importante porque combina la planificación con el aprendizaje por refuerzo. Mucha de la investigación para probar y desarrollar esta tecnología se centra en solo uno de esos enfoques.

"Nuestro enfoque ha sido validado por los resultados que hemos visto en el laboratorio de robótica de la Universidad.

"Con un problema, donde el robot tuvo que mover una manzana grande, primero fue al lado izquierdo de la manzana para alejar el desorden, antes de manipular la manzana.

"Hizo esto sin que el desorden cayera fuera del límite del estante".

El Dr. Mehmet Dogar, profesor asociado de la Facultad de Computación, también participó en el estudio. Dijo que el enfoque había acelerado el tiempo de "pensamiento" del robot en un factor de diez; las decisiones que tomaban 50 segundos ahora toman 5 segundos..

La investigación recibió financiación del Consejo de Investigación de Ingeniería y Ciencias Físicas del Reino Unido en un proyecto para investigar la 'física similar a la humana' en robótica.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad de Leeds . Nota: el contenido se puede editar por estilo y longitud.

Referencia de la revista :

Wissam Bejjani, Mehmet R. Dogar, Matteo Leonetti. Aprendizaje de la manipulación basada en la física en desorden: combinación de la generalización basada en imágenes y la planificación anticipada . enviado a arXiv , 2019 [ resumen ]

cite esta página :

Universidad de Leeds. "Robots trabajadores que aprenden de los errores". ScienceDaily. ScienceDaily, 4 de noviembre de 2019. .

Universidad de Leeds. 2019, 4 de noviembre. Robots de trabajo que aprenden de los errores. ScienceDaily . Obtenido el 23 de enero de 2021 de www.science-things.com/releases/2019/11/191104083224.htm

Universidad de Leeds. "Robots trabajadores que aprenden de los errores". ScienceDaily. Www.science-things.com/releases/2019/11/191104083224.htm consultado el 23 de enero de 2021.

1

2

3

4

5

HISTORIAS RELACIONADAS

DESDE LA WEB

ScienceDaily comparte enlaces con sitios en red TrendMD y obtiene ingresos de anunciantes externos, cuando se indique.

1

2

Robots trabajadores que aprenden de los errores

1

2

3

4

5

1

2

3

4

5

El observatorio 'del tamaño de una galaxia' detecta posibles indicios de ondas gravitacionales

Un planeta 'Super-Puff' como ningún otro

Agujeros negros primordiales y la búsqueda de materia oscura del multiverso

Apague esa cámara durante las reuniones virtuales, dice el estudio ambiental

La batería económica se carga rápidamente para vehículos eléctricos, reduce la ansiedad por la autonomía

El descubrimiento impulsa la teoría de que la vida en la Tierra surgió de la mezcla de ARN-ADN

Tres razones por las que COVID-19 puede causar hipoxia silenciosa

Los videojuegos pueden cambiar tu cerebro

El modelo analiza cómo los virus escapan del sistema inmunológico

Los astrónomos descubren el primer planeta sin nubes similar a Júpiter

Inclinación de Saturno causada por sus lunas, dicen los investigadores

Carbonatos más antiguos del Sistema Solar: Meteorito de Flensburg

Uso del entrenamiento de realidad virtual para impulsar nuestro sentido de agencia y mejorar el control del motor

Los láseres crean robots en miniatura a partir de burbujas

El nuevo metamaterial ofrece propiedades reprogramables

Modos Higgs controlados por luz que se encuentran en superconductores; sensor de potencial, usos informáticos

Contando elefantes desde el espacio

apreciar la textura, el color y la forma de una flor conduce a mejores aterrizajes de drones