Investigadores de la Escuela de Ingeniería Samueli de UCLA y Stanford han demostrado un sistema informático que puede descubrir e identificar los objetos del mundo real que "ve" basándose en el mismo método de aprendizaje visual que utilizan los humanos.
El sistema es un avance en un tipo de tecnología llamada "visión por computadora", que permite a las computadoras leer e identificar imágenes visuales. Es un paso importante hacia los sistemas generales de inteligencia artificial: las computadoras que aprenden por sí mismas, son intuitivas,tome decisiones basadas en el razonamiento e interactúe con los humanos de una manera más parecida a la humana. Aunque los sistemas actuales de visión artificial con IA son cada vez más potentes y capaces, son específicos de la tarea, lo que significa que su capacidad para identificar lo que ven está limitada por cuántosido entrenado y programado por humanos.
Incluso los mejores sistemas de visión por computadora de hoy en día no pueden crear una imagen completa de un objeto después de ver solo ciertas partes del mismo, y los sistemas pueden ser engañados al ver el objeto en un entorno desconocido. Los ingenieros tienen como objetivo hacer sistemas informáticos con esas habilidades- al igual que los humanos pueden entender que están mirando a un perro, incluso si el animal se esconde detrás de una silla y solo las patas y la cola son visibles. Los humanos, por supuesto, también pueden intuir fácilmente dónde está la cabeza del perro y el resto del perro.su cuerpo lo es, pero esa capacidad aún escapa a la mayoría de los sistemas de inteligencia artificial.
Los sistemas actuales de visión por computadora no están diseñados para aprender por sí mismos. Deben estar capacitados sobre exactamente qué aprender, generalmente revisando miles de imágenes en las que los objetos que intentan identificar están etiquetados para ellos.
Las computadoras, por supuesto, tampoco pueden explicar su lógica para determinar lo que representa el objeto en una foto: los sistemas basados en IA no construyen una imagen interna o un modelo de sentido común de los objetos aprendidos como lo hacen los humanos.
El nuevo método de los ingenieros, descrito en el Actas de la Academia Nacional de Ciencias , muestra una forma de evitar estas deficiencias.
El enfoque se compone de tres amplios pasos. Primero, el sistema divide una imagen en pequeños trozos, que los investigadores llaman "viewlets". Segundo, la computadora aprende cómo estos viewlets se unen para formar el objeto en cuestión. Yfinalmente, analiza qué otros objetos hay en el área circundante y si la información sobre esos objetos es relevante para describir e identificar el objeto primario.
Para ayudar al nuevo sistema a "aprender" más como los humanos, los ingenieros decidieron sumergirlo en una réplica de Internet del entorno en el que viven los humanos.
"Afortunadamente, Internet ofrece dos cosas que ayudan a un sistema de visión por computadora inspirado en el cerebro a aprender de la misma manera que lo hacen los humanos", dijo Vwani Roychowdhury, profesor de ingeniería eléctrica y de computadoras de la UCLA e investigador principal del estudio. "Una es una riqueza".de imágenes y videos que representan los mismos tipos de objetos. El segundo es que estos objetos se muestran desde muchas perspectivas: oscurecidos, a vista de pájaro, de cerca, y se colocan en diferentes tipos de entornos ".
Para desarrollar el marco, los investigadores extrajeron ideas de la psicología cognitiva y la neurociencia.
"Comenzando como bebés, aprendemos qué es algo porque vemos muchos ejemplos de ello, en muchos contextos", dijo Roychowdhury. "Ese aprendizaje contextual es una característica clave de nuestro cerebro y nos ayuda a construir modelos robustos de objetos queson parte de una visión del mundo integrada donde todo está funcionalmente conectado "
Los investigadores probaron el sistema con aproximadamente 9,000 imágenes, cada una mostrando personas y otros objetos. La plataforma pudo construir un modelo detallado del cuerpo humano sin orientación externa y sin que las imágenes fueran etiquetadas.
Los ingenieros realizaron pruebas similares utilizando imágenes de motocicletas, automóviles y aviones. En todos los casos, su sistema funcionó mejor o al menos tan bien como los sistemas tradicionales de visión por computadora que se han desarrollado con muchos años de capacitación.
Fuente de la historia :
Materiales proporcionado por Escuela de Ingeniería de UCLA Samueli . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :