El registro de imágenes médicas es una técnica común que consiste en superponer dos imágenes, como las imágenes por resonancia magnética MRI, para comparar y analizar las diferencias anatómicas con gran detalle. Si un paciente tiene un tumor cerebral, por ejemplo, los médicos pueden superponer unexploración cerebral de hace varios meses en una exploración más reciente para analizar pequeños cambios en el progreso del tumor.
Sin embargo, este proceso a menudo puede tomar dos horas o más, ya que los sistemas tradicionales alinean meticulosamente cada uno de potencialmente un millón de píxeles en los escaneos combinados. En un par de próximos documentos de la conferencia, los investigadores del MIT describen un algoritmo de aprendizaje automático que puede registrarseescáneres cerebrales y otras imágenes tridimensionales más de 1,000 veces más rápido utilizando nuevas técnicas de aprendizaje.
El algoritmo funciona "aprendiendo" mientras registra miles de pares de imágenes. Al hacerlo, adquiere información sobre cómo alinear imágenes y estima algunos parámetros de alineación óptimos. Después del entrenamiento, usa esos parámetros para mapear todos los píxeles de una imagena otro, todo a la vez. Esto reduce el tiempo de registro a uno o dos minutos con una computadora normal, o menos de un segundo con una GPU con una precisión comparable a los sistemas de vanguardia.
"Las tareas de alinear una resonancia magnética cerebral no deberían ser tan diferentes cuando se alinean un par de resonancias magnéticas cerebrales u otra", dice la coautora de ambos artículos, Guha Balakrishnan, estudiante graduada en Ciencias de la Computación e Inteligencia Artificial del MITLaboratorio CSAIL y Departamento de Ingeniería y Ciencias de la Computación EECS. "Hay información que debería poder transmitir sobre cómo hacer la alineación. Si puede aprender algo del registro de imágenes anterior, puede hacer unanueva tarea mucho más rápido y con la misma precisión "
Los documentos se presentan en la Conferencia sobre Reconocimiento de Visión y Patrón de Computadora CVPR, celebrada esta semana, y en la Conferencia de Intervención Médica de Computación e Imagen MICCAI, celebrada en septiembre. Los coautores son: Adrian Dalca, un postdoc en el Hospital General de Massachusetts y CSAIL; Amy Zhao, una estudiante graduada en CSAIL; Mert R. Sabuncu, un ex postdoc CSAIL y ahora profesor en la Universidad de Cornell; y John Guttag, el profesor Dugald C. Jackson en Ingeniería Eléctrica enMIT.
Retención de información
Las imágenes de resonancia magnética son básicamente cientos de imágenes 2D apiladas que forman imágenes 3D masivas, llamadas "volúmenes", que contienen un millón o más de píxeles 3D, llamados "voxels". Por lo tanto, es muy lento alineartodos los vóxeles en el primer volumen con los del segundo. Además, los escaneos pueden provenir de diferentes máquinas y tener diferentes orientaciones espaciales, lo que significa que los vóxeles coincidentes son aún más complejos desde el punto de vista computacional.
"Tiene dos imágenes diferentes de dos cerebros diferentes, póngalas una encima de la otra y comience a mover una hasta que se ajuste a la otra. Matemáticamente, este procedimiento de optimización lleva mucho tiempo", dice Dalca, autor principal delDocumento CVPR y autor principal del documento MICCAI.
Este proceso se vuelve particularmente lento cuando se analizan escaneos de grandes poblaciones. Los neurocientíficos que analizan las variaciones en las estructuras cerebrales en cientos de pacientes con una enfermedad o afección en particular, por ejemplo, podrían tomar cientos de horas.
Eso se debe a que esos algoritmos tienen una falla importante: nunca aprenden. Después de cada registro, descartan todos los datos relacionados con la ubicación del vóxel. "Esencialmente, comienzan desde cero dado un nuevo par de imágenes", dice Balakrishnan ". Después de 100 registros, deberías haber aprendido algo de la alineación. Eso es lo que aprovechamos "
El algoritmo de los investigadores, llamado "VoxelMorph", funciona con una red neuronal convolucional CNN, un enfoque de aprendizaje automático que se usa comúnmente para el procesamiento de imágenes. Estas redes consisten en muchos nodos que procesan imágenes y otra información en varias capas decálculo.
En el documento CVPR, los investigadores entrenaron su algoritmo en 7,000 escáneres cerebrales MRI disponibles públicamente y luego lo probaron en 250 escáneres adicionales.
Durante el entrenamiento, los escáneres cerebrales se introdujeron en el algoritmo en pares. Usando una CNN y una capa de cómputo modificada llamada transformador espacial, el método captura similitudes de vóxeles en una resonancia magnética con vóxeles en la otra exploración. Al hacerlo, el algoritmoaprende información sobre grupos de vóxeles, como las formas anatómicas comunes a ambos escaneos, que utiliza para calcular los parámetros optimizados que se pueden aplicar a cualquier par de escaneos.
Cuando se alimentan dos escaneos nuevos, una "función" matemática simple usa esos parámetros optimizados para calcular rápidamente la alineación exacta de cada vóxel en ambos escaneos. En resumen, el componente CNN del algoritmo obtiene toda la información necesaria durante el entrenamiento para que, durante cada nuevoregistro, todo el registro se puede ejecutar utilizando una evaluación de función fácilmente computable.
Los investigadores encontraron que su algoritmo podía registrar con precisión todos sus 250 escáneres cerebrales de prueba, aquellos registrados después del conjunto de entrenamiento, en dos minutos usando una unidad de procesamiento central tradicional, y en menos de un segundo usando una unidad de procesamiento de gráficos.
Es importante destacar que el algoritmo está "sin supervisión", lo que significa que no requiere información adicional más allá de los datos de la imagen. Algunos algoritmos de registro incorporan modelos CNN pero requieren una "verdad fundamental", lo que significa que otro algoritmo tradicional se ejecuta primero para calcular registros precisos.El algoritmo de los investigadores mantiene su precisión sin esos datos.
El documento MICCAI desarrolla un algoritmo refinado VoxelMorph que "dice cuán seguros estamos de cada registro", dice Balakrishnan. También garantiza la "suavidad" del registro, lo que significa que no produce pliegues, agujeros o distorsiones generales en el compuestoimagen. El artículo presenta un modelo matemático que valida la precisión del algoritmo usando algo llamado puntaje Dice, una métrica estándar para evaluar la precisión de las imágenes superpuestas. En 17 regiones cerebrales, el algoritmo refinado VoxelMorph obtuvo la misma precisión que un estado de uso comúnalgoritmo de registro de última generación, al tiempo que proporciona mejoras de tiempo de ejecución y metodológicas.
más allá de los escáneres cerebrales
Según los investigadores, el algoritmo rápido tiene una amplia gama de aplicaciones potenciales además de analizar escáneres cerebrales. Los colegas del MIT, por ejemplo, actualmente están ejecutando el algoritmo en imágenes pulmonares.
El algoritmo también podría allanar el camino para el registro de imágenes durante las operaciones. Actualmente se utilizan varios escaneos de diferentes calidades y velocidades antes o durante algunas cirugías. Pero esas imágenes no se registran hasta después de la operación. Al resecar un tumor cerebral, por ejemplo, los cirujanos a veces escanean el cerebro de un paciente antes y después de la cirugía para ver si han extirpado todo el tumor. Si queda algo, están de vuelta en la sala de operaciones.
Con el nuevo algoritmo, dice Dalca, los cirujanos podrían registrar escaneos en tiempo casi real, obteniendo una imagen mucho más clara de su progreso. "Hoy en día, no pueden superponer las imágenes durante la cirugía, porque tomará dos horas, y la cirugía está en curso ", dice." Sin embargo, si solo toma un segundo, se puede imaginar que podría ser factible ".
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :