En un futuro no muy lejano, los robots pueden ser enviados como vehículos de entrega de última milla para dejar su pedido de comida para llevar, paquete o suscripción de kit de comida en su puerta, si pueden encontrar la puerta.
Los enfoques estándar para la navegación robótica implican mapear un área antes de tiempo, luego usar algoritmos para guiar a un robot hacia un objetivo específico o una coordenada GPS en el mapa. Si bien este enfoque podría tener sentido para explorar entornos específicos, como el diseño de unedificio particular o carrera de obstáculos planificada, puede volverse difícil de manejar en el contexto de la entrega de última milla.
Imagine, por ejemplo, tener que mapear por adelantado cada vecindario dentro de la zona de entrega de un robot, incluida la configuración de cada casa dentro de ese vecindario junto con las coordenadas específicas de la puerta de entrada de cada casa. Tal tarea puede ser difícil de escalar auna ciudad entera, particularmente porque los exteriores de las casas a menudo cambian con las estaciones. El mapeo de cada casa también podría tener problemas de seguridad y privacidad.
Ahora los ingenieros del MIT han desarrollado un método de navegación que no requiere mapear un área de antemano. En cambio, su enfoque permite que un robot use pistas en su entorno para planificar una ruta a su destino, que puede describirse en términos semánticos generalestérminos, como "puerta de entrada" o "garaje", en lugar de como coordenadas en un mapa. Por ejemplo, si un robot recibe instrucciones de entregar un paquete a la puerta de entrada de alguien, podría comenzar en la carretera y ver un camino de entrada, queha sido entrenado para reconocer que es probable que conduzca hacia una acera, que a su vez es probable que conduzca a la puerta principal.
La nueva técnica puede reducir en gran medida el tiempo que un robot pasa explorando una propiedad antes de identificar su objetivo, y no se basa en mapas de residencias específicas.
"No nos gustaría tener que hacer un mapa de cada edificio que tendríamos que visitar", dice Michael Everett, un estudiante graduado en el Departamento de Ingeniería Mecánica del MIT. "Con esta técnica, esperamos dejar caer unrobot al final de cualquier camino de entrada y haga que encuentre una puerta "
Everett presentará los resultados del grupo esta semana en la Conferencia Internacional sobre Robots y Sistemas Inteligentes. El documento, en coautoría de Jonathan How, profesor de aeronáutica y astronáutica en el MIT, y Justin Miller de la Ford Motor Company, esfinalista al "Mejor artículo para robots cognitivos"
"Un sentido de lo que son las cosas"
En los últimos años, los investigadores han trabajado en la introducción del lenguaje semántico natural a los sistemas robóticos, entrenando a los robots para que reconozcan los objetos por sus etiquetas semánticas, para que puedan procesar visualmente una puerta como una puerta, por ejemplo, y no simplemente como un sólido,obstáculo rectangular.
"Ahora tenemos la capacidad de dar a los robots una idea de lo que son las cosas, en tiempo real", dice Everett.
Everett, How y Miller están utilizando técnicas semánticas similares como trampolín para su nuevo enfoque de navegación, que aprovecha los algoritmos preexistentes que extraen características de los datos visuales para generar un nuevo mapa de la misma escena, representado como pistas semánticas, ocontexto.
En su caso, los investigadores usaron un algoritmo para construir un mapa del entorno a medida que el robot se movía, usando las etiquetas semánticas de cada objeto y una imagen de profundidad. Este algoritmo se llama SLAM semántico localización y mapeo simultáneo.
Si bien otros algoritmos semánticos han permitido que los robots reconozcan y mapeen objetos en su entorno por lo que son, no han permitido que un robot tome decisiones en el momento mientras navega por un nuevo entorno, en el camino más eficiente para llegar a undestino semántico como una "puerta de entrada"
"Antes, explorar era justo, dejar caer un robot y decir 'vete', y se moverá y eventualmente llegará allí, pero será lento", dice How.
El costo para ir
Los investigadores buscaron acelerar la planificación de la ruta de un robot a través de un mundo semántico y de color contextual. Desarrollaron un nuevo "estimador de costos para llevar", un algoritmo que convierte un mapa semántico creado por algoritmos SLAM preexistentes en un segundomapa, que representa la probabilidad de que cualquier ubicación esté cerca de la meta.
"Esto se inspiró en la traducción de imagen a imagen, donde tomas una foto de un gato y haces que se vea como un perro", dice Everett. "El mismo tipo de idea sucede aquí cuando tomas una imagen que se pareceun mapa del mundo y conviértalo en esta otra imagen que se parece al mapa del mundo pero que ahora está coloreada en función de lo cerca que están los diferentes puntos del mapa del objetivo final ".
Este mapa de costo para llevar está coloreado, en escala de grises, para representar regiones más oscuras como ubicaciones alejadas de una meta y regiones más claras como áreas cercanas a la meta. Por ejemplo, la acera, codificada en amarillo enun mapa semántico, podría traducirse por el algoritmo de costo por uso como una región más oscura en el nuevo mapa, en comparación con un camino de entrada, que es progresivamente más claro a medida que se acerca a la puerta principal, la región más clara en el nuevo mapa.
Los investigadores entrenaron este nuevo algoritmo en imágenes satelitales de Bing Maps que contienen 77 casas de un vecindario urbano y tres suburbios. El sistema convirtió un mapa semántico en un mapa de costo por recorrido, y trazó el camino más eficiente, siguiendo un encendedorregiones en el mapa, hasta el objetivo final. Para cada imagen de satélite, Everett asignó etiquetas y colores semánticos a las características de contexto en un patio delantero típico, como gris para una puerta de entrada, azul para una entrada de auto y verde para un seto.
Durante este proceso de capacitación, el equipo también aplicó máscaras a cada imagen para imitar la vista parcial que probablemente tendría la cámara de un robot cuando atraviesa un patio.
"Parte del truco de nuestro enfoque fue [dar al sistema] muchas imágenes parciales", explica How. "Así que realmente tenía que descubrir cómo todo esto estaba interrelacionado. Eso es parte de lo que hace que esto funcione de manera sólida".
Luego, los investigadores probaron su enfoque en una simulación de una imagen de una casa completamente nueva, fuera del conjunto de datos de entrenamiento, primero usando el algoritmo SLAM preexistente para generar un mapa semántico, luego aplicando su nuevo estimador de costos para generarun segundo mapa y el camino hacia una meta, en este caso, la puerta de entrada.
La nueva técnica de costo para llevar del grupo encontró que la puerta de entrada es 189 por ciento más rápida que los algoritmos de navegación clásicos, que no tienen en cuenta el contexto o la semántica, y en su lugar dedican pasos excesivos a explorar áreas que es poco probable que estén cerca de su objetivo.
Everett dice que los resultados ilustran cómo los robots pueden usar el contexto para localizar eficientemente un objetivo, incluso en entornos desconocidos y no mapeados.
"Incluso si un robot está entregando un paquete a un entorno en el que nunca ha estado, puede haber pistas que serán las mismas que en otros lugares donde se ve", dice Everett. "Por lo tanto, el mundo puede estar un poco diferente,pero probablemente hay algunas cosas en común "
Esta investigación es apoyada, en parte, por la Ford Motor Company.
Enlaces relacionados
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Jennifer Chu. Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :