No solo reconocemos objetos: nuestro cerebro es tan bueno en esta tarea que podemos proporcionar automáticamente el concepto de una taza cuando se nos muestra una foto de un mango curvo o identificar una cara con solo una oreja o nariz. Neurobiólogos, computadoraLos científicos y los ingenieros de robótica están interesados en comprender cómo funciona dicho reconocimiento, tanto en sistemas de visión humana como de computadora. Una nueva investigación realizada por científicos del Instituto de Ciencia Weizmann y el Instituto de Tecnología de Massachusetts MIT sugiere que existe un "sistema atómico"unidad de reconocimiento: una cantidad mínima de información que debe contener una imagen para que se produzca el reconocimiento. Los resultados del estudio, que aparecieron recientemente en el Actas de la Academia Nacional de Ciencias PNAS, implica que los modelos actuales necesitan ser ajustados, y tienen implicaciones para el diseño de la visión por computadora y robot.
En el campo de la visión por computadora, por ejemplo, la capacidad de reconocer un objeto en una imagen ha sido un desafío para los investigadores de computadoras e inteligencia artificial. El profesor Shimon Ullman y el Dr. Daniel Harari, junto con Liav Assif y Ethan Fetaya,Querían saber qué tan bien los modelos actuales de visión por computadora son capaces de reproducir las capacidades del cerebro humano. Con este fin, reclutaron a miles de participantes del Mechanical Turk de Amazon y les pidieron que identificaran series de imágenes. Las imágenes llegaron en varios formatos: algunos fueroncortó sucesivamente de imágenes más grandes, revelando cada vez menos del original. Otros tuvieron reducciones sucesivas en la resolución, con las correspondientes reducciones en detalle.
Cuando los científicos compararon los puntajes de los sujetos humanos con los de los modelos de computadora, descubrieron que los humanos eran mucho mejores para identificar imágenes de resolución parcial o baja. La comparación sugirió que las diferencias también eran cualitativas: casi todos los humanoslos participantes lograron identificar los objetos en las diversas imágenes, hasta una pérdida de detalles bastante alta, después de lo cual, casi todos tropezaron exactamente en el mismo punto. La división fue tan aguda que los científicos la llamaron una "transición de fase"."Si una imagen ya mínima pierde solo una pequeña cantidad de detalles, todos de repente pierden la capacidad de identificar el objeto", dice Ullman. "Eso sugiere que no importa cuál sea nuestra experiencia de vida o entrenamiento, el reconocimiento de objetos está conectado y funciona igual entodos nosotros."
Los investigadores sugieren que las diferencias entre las capacidades de la computadora y las humanas residen en el hecho de que los algoritmos informáticos adoptan un enfoque "de abajo hacia arriba" que se mueve de características simples a características complejas. Los cerebros humanos, por otro lado, trabajan en "modos "arriba" y "arriba-abajo" simultáneamente, comparando los elementos de una imagen con una especie de modelo almacenado en sus bancos de memoria.
Los hallazgos también sugieren que puede haber algo elemental en nuestros cerebros que está sintonizado para funcionar con una cantidad mínima, un "átomo" básico de información. Esa cantidad elemental puede ser crucial para nuestras habilidades de reconocimiento e incorporarla alos modelos actuales podrían mejorar su sensibilidad. Estos "átomos de reconocimiento" podrían ser herramientas valiosas para futuras investigaciones sobre el funcionamiento del cerebro humano y para desarrollar nuevos sistemas informáticos y de visión robótica. Para más información sobre "átomos de reconocimiento", visite el sitio web.
El profesor Shimon Ullman es el titular de la Cátedra Profesora de Ciencias de la Computación de Ruth y Samy Cohn.
Fuente de la historia :
Materiales proporcionado por Instituto de Ciencias Weizmann . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :