Los neurocientíficos y los científicos de la visión por computadora dicen que un nuevo conjunto de datos de tamaño sin precedentes, que comprende escáneres cerebrales de cuatro voluntarios que vieron 5.000 imágenes cada uno, ayudará a los investigadores a comprender mejor cómo procesa las imágenes el cerebro.
Investigadores de la Universidad Carnegie Mellon y la Universidad Fordham, informando hoy en la revista Datos científicos , dicha adquisición de imágenes de resonancia magnética funcional fMRI en esta escala presentó desafíos únicos.
Cada voluntario participó en 20 o más horas de exploración por resonancia magnética, desafiando tanto su perseverancia como la capacidad de los experimentadores para coordinar las sesiones de exploración. La decisión extrema de diseño de ejecutar a los mismos individuos durante tantas sesiones fue necesaria para desenredar las respuestas neuronales asociadascon imágenes individuales.
El conjunto de datos resultante, denominado BOLD5000, permite a los neurocientíficos cognitivos aprovechar mejor los modelos de aprendizaje profundo que han mejorado drásticamente los sistemas de visión artificial. Originalmente inspirado en la arquitectura del sistema visual humano, el aprendizaje profundo puede mejorarse aún más mediante la búsqueda de nuevos conocimientos sobre cómola visión humana funciona y al hacer que los estudios de la visión humana reflejen mejor los métodos modernos de visión por computadora. Con ese fin, BOLD5000 midió la actividad neuronal que surge de la visualización de imágenes tomadas de dos conjuntos de datos de visión por computadora populares: ImageNet y COCO.
"El entrelazamiento de la ciencia del cerebro y la informática significa que los descubrimientos científicos pueden fluir en ambas direcciones", dijo el coautor Michael J. Tarr, Kav? I? -Moura Profesor de Ciencia Cognitiva y Cerebral y jefe del Departamento de CMUPsicología ". Los estudios futuros de la visión que empleen el conjunto de datos BOLD5000 deberían ayudar a los neurocientíficos a comprender mejor la organización del conocimiento en el cerebro humano. A medida que aprendamos más sobre las bases neuronales del reconocimiento visual, también estaremos mejor posicionados para contribuir a los avances en artificialvisión."
La autora principal Nadine Chang, estudiante de doctorado en el Instituto de Robótica de CMU que se especializa en visión por computadora, sugirió que los científicos de la visión por computadora están buscando la neurociencia para ayudar a innovar en el área de visión artificial que avanza rápidamente - reforzando la doble víanaturaleza de esta investigación.
"Los científicos de la visión artificial y los neurocientíficos visuales tienen esencialmente el mismo objetivo final: comprender cómo procesar e interpretar la información visual", dijo Chang.
Mejorar la visión por computadora fue una parte importante del proyecto BOLD5000 desde su inicio. La autora principal Elissa Aminoff, luego becaria postdoctoral en el Departamento de Psicología de CMU y ahora profesora asistente de psicología en Fordham, inició esta dirección de investigación con el coautorAbhinav Gupta, profesor asociado en el Instituto de Robótica.
Entre los desafíos que enfrenta la conexión de la visión biológica y la informática es que la mayoría de los estudios de neuroimagen humana incluyen muy pocas imágenes de estímulo, a menudo 100 o menos, que generalmente se simplifican para representar solo objetos individuales en un fondo neutro. En contraste,BOLD5000 incluye más de 5,000 imágenes complejas del mundo real de escenas, objetos individuales y objetos interactivos.
El grupo ve a BOLD5000 como solo el primer paso para aprovechar los modelos modernos de visión por computadora para estudiar la visión biológica.
"Francamente, el conjunto de datos BOLD5000 todavía es demasiado pequeño", dijo Tarr, sugiriendo que un conjunto de datos razonable de fMRI requeriría al menos 50,000 imágenes de estímulo y muchos más voluntarios para avanzar a la luz del hecho de que la clase de redes neuronales profundasutilizados para analizar imágenes visuales están capacitados en millones de imágenes. Con este fin, el equipo de investigación espera que su capacidad para generar un conjunto de datos de 5,000 escáneres cerebrales allane el camino para mayores esfuerzos de colaboración entre la visión humana y los científicos de la visión por computadora.
Hasta ahora, la respuesta del campo ha sido positiva. El conjunto de datos BOLD5000 disponible públicamente ya se ha descargado más de 2,500 veces.
Fuente de la historia :
Materiales proporcionado por Universidad Carnegie Mellon . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :