Los científicos informáticos de la Universidad Carnegie Mellon han adoptado un método de aprendizaje profundo que ha revolucionado el reconocimiento facial y otras aplicaciones basadas en imágenes en los últimos años y redirigió su poder para explorar la relación entre los genes.
El truco, dicen, es transformar cantidades masivas de datos de expresión génica en algo más parecido a una imagen. Las redes neuronales convolucionales CNN, que son expertas en analizar imágenes visuales, pueden inferir qué genes están interactuando entre sí.Las CNN superan a los métodos existentes en esta tarea.
El informe de los investigadores sobre cómo las CNN pueden ayudar a identificar los genes relacionados con la enfermedad y las vías genéticas y de desarrollo que podrían ser objetivos para los medicamentos se publica hoy en el Actas de la Academia Nacional de Ciencias . Pero Ziv Bar-Joseph, profesor de biología computacional y aprendizaje automático, dijo que las aplicaciones para el nuevo método, llamado CNNC, podrían ir mucho más allá de las interacciones genéticas.
La nueva información descrita en el documento sugiere que CNNC podría desplegarse de manera similar para investigar la causalidad en una amplia variedad de fenómenos, incluidos los datos financieros y las redes sociales, dijo Bar-Joseph, coautor del documento con Ye Yuan, una publicacióninvestigador doctoral en el Departamento de Aprendizaje Automático de CMU.
"Las CNN, que se desarrollaron hace una década, son revolucionarias", dijo Bar-Joseph. "Todavía estoy asombrado de Google Photos, que las usa para reconocimiento facial", agregó mientras se desplazaba por las fotos en su teléfono inteligente, que muestra cómo la aplicación podría identificar a su hijo a diferentes edades, o identificar a su padre basándose en una imagen del lado derecho trasero de su cabeza. "A veces damos por sentado esta tecnología porque la usamos todo el tiempo. Pero es increíblemente poderosay no está restringido a imágenes. Todo depende de cómo represente sus datos ".
En este caso, él y Yuan estaban analizando las relaciones genéticas. Los aproximadamente 20,000 genes en humanos funcionan en conjunto, por lo que es necesario saber cómo los genes trabajan juntos en complejos o redes para comprender el desarrollo humano o las enfermedades.
Una forma de inferir estas relaciones es observar la expresión génica, que representa los niveles de actividad de los genes en las células. Generalmente, si el gen A está activo al mismo tiempo que el gen B está activo, eso es una pista de que los dos están interactuando, Dijo Yuan. Aún así, es posible que esto sea una coincidencia o que ambos sean activados por un tercer gen C. Se han desarrollado varios métodos previos para desentrañar estas relaciones.
Para emplear CNN para ayudar a analizar las relaciones genéticas, Yuan y Bar-Joseph utilizaron datos de expresión de células individuales, experimentos que pueden determinar el nivel de cada gen en una sola célula. Los resultados de cientos de miles de estos análisis de células individualesLuego se organizaron en forma de matriz o histograma de modo que cada célula de la matriz representara un nivel diferente de coexpresión para un par de genes.
La presentación de los datos de esta manera agregó un aspecto espacial que hizo que los datos fueran más parecidos a imágenes y, por lo tanto, más accesibles para las CNN. Al usar datos de genes cuyas interacciones ya se habían establecido, los investigadores pudieron capacitar a las CNN parareconozca qué genes estaban interactuando y cuáles no se basaron en los patrones visuales en la matriz de datos, dijo Yuan.
"Es muy, muy difícil distinguir entre causalidad y correlación", dijo Yuan, pero el método CNNC demostró ser estadísticamente más preciso que los métodos existentes. Él y Bar-Joseph anticipan que CNNC será una de varias técnicas que los investigadores eventualmente implementarán enanalizar grandes conjuntos de datos.
"Este es un método muy general que podría aplicarse a una serie de análisis", dijo Bar-Joseph. La principal limitación son los datos: cuantos más datos haya, mejor funcionarán las CNN. La biología celular es adecuada parausando CNNC, como un experimento típico puede involucrar a decenas de miles de células y generar una gran cantidad de datos.
Los Institutos Nacionales de Salud, la Fundación Nacional de Ciencias y la Fundación James S. McDonnell apoyaron esta investigación.
Fuente de la historia :
Materiales proporcionado por Universidad Carnegie Mellon . Original escrito por Byron Spice. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :