La comprensión de la estructura molecular 3D de nanoobjetos importantes como proteínas y virus es crucial en biología y medicina. Con los recientes avances en la tecnología de rayos X, los científicos ahora pueden recolectar imágenes de difracción de partículas individuales, lo que finalmente permite a los investigadores visualizar moléculas a temperatura ambiente.
Sin embargo, determinar la estructura 3D a partir de estos experimentos de difracción de una sola partícula es un obstáculo significativo. Por ejemplo, las tasas de adquisición de datos actuales son muy limitantes, por lo general resultan en menos de 10 instantáneas útiles por minuto, lo que limita la cantidad de características que se pueden resolverAdemás, las imágenes a menudo están muy corrompidas por el ruido y otros artefactos experimentales, lo que dificulta la interpretación adecuada de los datos.
Para enfrentar estos desafíos, un equipo de investigadores del Laboratorio Nacional Lawrence Berkeley Laboratorio de Berkeley ha desarrollado un nuevo marco algorítmico llamado fase progresiva iterativa de múltiples niveles M-TIP que utiliza técnicas matemáticas avanzadas para determinar la estructura molecular 3D desde muyconjuntos dispersos de datos ruidosos de una sola partícula. Este enfoque esencialmente permite a los investigadores extraer más información de experimentos con datos limitados. Los matemáticos aplicados Jeffrey Donatelli y James Sethian, y el biocientífico físico Peter Zwart introdujeron este marco al expandir un algoritmo que desarrollaron originalmentepara resolver la reconstrucción a partir de un experimento de dispersión de rayos X relacionado, llamado dispersión de rayos X por fluctuación. Un artículo que describe el marco M-TIP se publicó el 26 de junio en el Actas de la Academia Nacional de Ciencias .
"Este enfoque tiene el potencial de revolucionar el campo", dice Zwart. "Dado que es difícil obtener una gran cantidad de datos buenos, es probable que los enfoques que reducen la cantidad de datos necesarios para obtener imágenes de nanoobjetos 3D con éxito reciban un efecto cálidobienvenidos."
Donatelli, Sethian y Zwart son parte de CAMERA El Centro de Matemáticas Avanzadas para Aplicaciones de Investigación de Energía, cuya misión es crear las matemáticas de vanguardia necesarias para manejar datos de muchas de las instalaciones científicas más avanzadas del DOECÁMARA está financiada conjuntamente por los programas de Investigación de Computación Científica Avanzada y Ciencias Básicas de Energía en la Oficina de Ciencia del DOE.
Difracción de partículas individuales
El reciente advenimiento de los láseres de electrones libres de rayos X XFEL ha permitido varias técnicas experimentales nuevas para estudiar biomoléculas que no eran factibles con las fuentes de luz tradicionales. Una de esas técnicas es la difracción de partículas individuales, que recoge una gran cantidad de X-instantáneas de difracción de rayos con una sola partícula en el haz. Al aprovechar la potencia extrema de los XFEL, los investigadores pueden recolectar señales medibles incluso de las partículas más pequeñas.
Una gran ventaja que ofrece esta técnica de difracción de una sola partícula es la capacidad de estudiar cómo las diferentes copias de una molécula varían o cambian de forma. Dado que cada imagen proviene de una sola partícula, estas variaciones pueden capturarse en el experimento, en contrastea los métodos de imagen tradicionales como la cristalografía o la dispersión de rayos X de ángulo pequeño, donde los investigadores solo pueden medir un promedio en todos los diferentes estados de la muestra molecular.
Sin embargo, determinar la estructura 3D a partir de datos de difracción de una sola partícula es un desafío. Para comenzar, cuando se toma una imagen de cada partícula, su orientación es desconocida y debe recuperarse para combinar adecuadamente los datos en un volumen de difracción 3D. Este problemase agrava si la molécula puede adoptar diferentes formas, lo que requiere una clasificación adicional de las imágenes. Además, la información de fase no se registra en imágenes de difracción y debe recuperarse para completar la reconstrucción. Finalmente, incluso con XFEL potentes, el número delos fotones dispersos son muy pequeños, lo que resulta en imágenes extremadamente ruidosas, que pueden contaminarse aún más por problemas sistemáticos de fondo y de lectura del detector.
Los enfoques anteriores se basan en resolver el problema de reconstrucción en pasos separados, donde cada problema individual se aborda por separado. Desafortunadamente, un inconveniente de estos enfoques en serie es que no aprovechan fácilmente las características conocidas anteriores sobre el aspecto de la molécula. Además, cualquier error cometido en un paso se propaga al siguiente, lo que resulta en un aumento adicional del error. Esta "bola de nieve de error" finalmente degrada la calidad de la reconstrucción obtenida en el paso final.
Lo mejor de ambos mundos
En lugar de resolver los problemas computacionales en pasos separados, el algoritmo M-TIP del equipo resuelve todas las partes del problema al mismo tiempo. Este enfoque aprovecha la información previa sobre la estructura para reducir en gran medida los grados de libertad del problema en todos los pasos y, en consecuenciareducir la información requerida para lograr una reconstrucción en 3D.
"Las técnicas estándar de optimización de recuadro negro pueden incorporar conocimientos previos en la reconstrucción pero tirar toda la estructura del problema, mientras que resolverlo en subpasos seriales completamente separados explota la estructura del problema pero arroja casi toda la información previa sobre quéla solución podría verse ", dijo Donatelli." M-TIP aprovecha lo mejor de ambos mundos explotando la estructura del problema para dividir el cálculo en varios fragmentos manejables y luego refinando iterativamente todos estos fragmentos para llegar a una soluciónque es consistente tanto con los datos como con cualquier restricción estructural "
Utilizando esta técnica, el equipo pudo determinar la estructura 3D a partir de recuentos de imágenes extremadamente bajos a partir de datos simulados, tan bajos como 6 a 24 imágenes para datos sin ruido y 192 imágenes a partir de datos altamente contaminados.
abriendo nuevos caminos
Este trabajo es parte de una nueva iniciativa de colaboración entre SLAC National Accelerator Laboratory, CAMERA, el Centro Nacional de Investigación Científica de Energía Energética NERSC y el Laboratorio Nacional de Los Alamos como parte del Proyecto de Computación Exascale ECP del DOE. El objetivo del proyectoes desarrollar las herramientas computacionales necesarias para realizar análisis de datos en tiempo real a partir de experimentos realizados en la fuente de luz coherente Linac LCLS de SLAC. Con las actualizaciones a la línea de luz, LCLS-II planea generar varios terabytes de datos por segundo, que, paraPor ejemplo, permitirá a los científicos ampliar en gran medida los experimentos actuales de una sola partícula. Analizar todos estos datos en tiempo real requerirá nuevos algoritmos y grandes máquinas informáticas. El algoritmo M-TIP servirá como parte de este proceso.
"Estos son algunos de los problemas más desafiantes en la ciencia de datos computacionales", dice Sethian. "Para abordarlos, necesitamos explotar una gama de tecnologías, incluidas las arquitecturas informáticas emergentes a escala exascala, las redes sofisticadas de alta velocidad y las matemáticas más avanzadasalgoritmos disponibles. Al reunir a los científicos de CAMERA con proyectos de aplicación de exascale, se ha abierto la puerta a la construcción de herramientas para abordar algunos problemas apremiantes en biología y ciencias de los materiales ".
Los investigadores señalan que estos son solo los primeros pasos. Para que el método esté listo para implementarse, se deben superar otros obstáculos.
"La ciencia experimental es desordenada", dice Zwart. "Hay efectos experimentales adicionales que deben tenerse en cuenta para que podamos obtener los mejores resultados posibles".
"Afortunadamente, M-TIP es una técnica muy modular", agrega Donatelli, "por lo tanto, es muy adecuado para modelar muchos de estos efectos adicionales sin necesidad de cambiar el marco algorítmico central".
El equipo está trabajando actualmente en el estudio de estos efectos como parte de Single Particle Initiative, una gran colaboración multiinstitucional dedicada a abordar problemas teóricos y prácticos en imágenes de moléculas individuales basadas en X-FEL, que en última instancia conducen a proporcionar a la comunidad científicacon las herramientas necesarias para abrir nuevos caminos en biología, medicina y ciencias de la energía.
Fuente de la historia :
Materiales proporcionado por DOE / Laboratorio Nacional Lawrence Berkeley . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :