Los ingenieros biomédicos de la Universidad de Duke han ideado un enfoque de aprendizaje automático para modelar las interacciones entre variables complejas en bacterias modificadas que de otro modo serían demasiado engorrosas para predecir. Sus algoritmos son generalizables para muchos tipos de sistemas biológicos.
En el nuevo estudio, los investigadores entrenaron una red neuronal para predecir los patrones circulares que crearía un circuito biológico integrado en un cultivo bacteriano. El sistema funcionó 30,000 veces más rápido que el modelo computacional existente.
Para mejorar aún más la precisión, el equipo ideó un método para volver a capacitar el modelo de aprendizaje automático varias veces para comparar sus respuestas. Luego lo utilizaron para resolver un segundo sistema biológico que es computacionalmente exigente de una manera diferente, mostrando que el algoritmo puede funcionar paradesafíos dispares.
Los resultados aparecen en línea el 25 de septiembre en la revista Comunicaciones de la naturaleza .
"Este trabajo fue inspirado por Google que muestra que las redes neuronales pueden aprender a vencer a un humano en el juego de mesa Go", dijo Lingchong You, profesor de ingeniería biomédica en Duke.
"Aunque el juego tiene reglas simples, hay demasiadas posibilidades para que una computadora calcule la mejor opción de manera determinista", dijo. "Me preguntaba si ese enfoque podría ser útil para hacer frente a ciertos aspectos de la complejidad biológica".enfrentándonos "
El desafío que enfrentaron Usted y su asociado posdoctoral Shangying Wang fue determinar qué conjunto de parámetros podría producir un patrón específico en un cultivo de bacterias después de un circuito genético diseñado.
En trabajos anteriores, el laboratorio de You programó bacterias para producir proteínas que, dependiendo de los detalles del crecimiento del cultivo, interactúan entre sí para formar anillos. Al controlar variables como el tamaño del ambiente de crecimiento y la cantidad de nutrientes provistos,los investigadores descubrieron que podían controlar el grosor del anillo, cuánto tiempo tardó en aparecer y otras características.
Al cambiar cualquier cantidad de docenas de variables potenciales, los investigadores descubrieron que podían hacer más, como causar la formación de dos o incluso tres anillos. Pero debido a que una sola simulación por computadora tomó cinco minutos, no resultó práctico buscar cualquier diseño grandeespacio para un resultado específico.
Para su estudio, el sistema constaba de 13 variables bacterianas como las tasas de crecimiento, difusión, degradación de proteínas y movimiento celular. Solo calcular seis valores por parámetro llevaría una sola computadora más de 600 años. Ejecutarlo en paraleloel clúster informático con cientos de nodos puede reducir el tiempo de ejecución a varios meses, pero el aprendizaje automático puede reducirlo a horas.
"El modelo que utilizamos es lento porque tiene que tener en cuenta los pasos intermedios en el tiempo a una velocidad lo suficientemente pequeña como para ser exactos", dijo Usted. "Pero no siempre nos interesan los pasos intermedios. Solo queremosresultados finales para ciertas aplicaciones. Y podemos volver a descubrir los pasos intermedios si consideramos que los resultados finales son interesantes "
Para saltar a los resultados finales, Wang recurrió a un modelo de aprendizaje automático llamado red neuronal profunda que puede hacer predicciones de órdenes de magnitud de manera más rápida que el modelo original. La red toma las variables del modelo como su entrada, inicialmente asigna pesos y sesgos aleatorios, y escupe una predicción de qué patrón se formará la colonia bacteriana, omitiendo por completo los pasos intermedios que conducen al patrón final.
Si bien el resultado inicial no se acerca a la respuesta correcta, los pesos y sesgos se pueden ajustar cada vez que se ingresan nuevos datos de entrenamiento en la red. Dado un conjunto de "entrenamiento" lo suficientemente grande, la red neuronal eventualmente aprenderápara hacer predicciones precisas casi siempre.
Para manejar las pocas instancias en las que el aprendizaje automático se equivoca, usted y Wang idearon una forma de verificar rápidamente su trabajo. Para cada red neuronal, el proceso de aprendizaje tiene un elemento de aleatoriedad. En otras palabras, nuncaaprender de la misma manera dos veces, incluso si está entrenado en el mismo conjunto de respuestas.
Los investigadores entrenaron cuatro redes neuronales separadas y compararon sus respuestas para cada caso. Descubrieron que cuando las redes neuronales entrenadas hacen predicciones similares, estas predicciones estaban cerca de la respuesta correcta.
"Descubrimos que no teníamos que validar cada respuesta con el modelo computacional estándar más lento", dijo You. "En su lugar, utilizamos la 'sabiduría de la multitud'".
Con el modelo de aprendizaje automático entrenado y corroborado, los investigadores se propusieron usarlo para hacer nuevos descubrimientos sobre su circuito biológico. En las 100.000 simulaciones de datos iniciales utilizadas para entrenar la red neuronal, solo una produjo una colonia bacteriana con tres anillos.Pero con la velocidad de la red neuronal, Usted y Wang no solo pudieron encontrar muchos más trillizos, sino que también determinaron qué variables fueron cruciales para producirlos.
"La red neuronal fue capaz de encontrar patrones e interacciones entre las variables que de otro modo hubieran sido imposibles de descubrir", dijo Wang.
Como final de su estudio, usted y Wang probaron su enfoque en un sistema biológico que funciona al azar. La resolución de dichos sistemas requiere un modelo de computadora que repita los mismos parámetros muchas veces para encontrar el resultado más probable. Si bien este es un resultado completamente diferenteLos investigadores descubrieron que su enfoque aún funcionaba, lo que demuestra que es generalizable a muchos sistemas biológicos complejos diferentes.
Los investigadores ahora están tratando de usar su nuevo enfoque en sistemas biológicos más complejos. Además de ejecutarlo en computadoras con GPU más rápidas, están tratando de programar el algoritmo para que sea lo más eficiente posible.
"Entrenamos la red neuronal con 100,000 conjuntos de datos, pero eso podría haber sido excesivo", dijo Wang. "Estamos desarrollando un algoritmo en el que la red neuronal puede interactuar con simulaciones en tiempo real para ayudar a acelerar las cosas".
"Nuestro primer objetivo era un sistema relativamente simple", dijo You. "Ahora queremos mejorar estos sistemas de redes neuronales para proporcionar una ventana a la dinámica subyacente de los circuitos biológicos más complejos".
Este trabajo fue apoyado por la Oficina de Investigación Naval N00014-12-1-0631, los Institutos Nacionales de Salud 1R01-GM098642 y una beca David y Lucile Packard.
Fuente de la historia :
Materiales proporcionado por Universidad de Duke . Original escrito por Ken Kingery. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :