Compañeros virtuales inteligentes como Alexa, Siri y Google Assistant se han integrado durante mucho tiempo en nuestra vida cotidiana. Y los programas informáticos inteligentes, los llamados algoritmos, también han evolucionado como una herramienta integral en la investigación científica. Las enormes cantidades de datos generados enLa investigación en ciencias de la vida se puede examinar de manera eficiente para detectar patrones recurrentes con la ayuda de algoritmos. Ciertos programas pueden detectar estructuras recurrentes en moléculas de proteínas grandes y luego usar esta información para sacar conclusiones sobre las tareas celulares que realizan estas moléculas, por ejemplo, sifuncionan como interruptores de genes, motores moleculares o moléculas de señalización. Las predicciones hechas por dichos algoritmos sobre la base de secuencias de proteínas, que consisten en una serie de bloques de construcción de proteínas unidas como un collar de perlas, ahora son increíblemente precisas.
Sin embargo, una desventaja importante de las técnicas anteriores es que los usuarios se mantienen completamente a oscuras sobre por qué el algoritmo asigna una función particular a ciertas secuencias de proteínas. El conocimiento preciso de la computadora sobre las proteínas no está directamente disponible, a pesar de que dicho conocimientopodría resultar invaluable para avanzar en la investigación y el desarrollo de nuevos agentes.
Un equipo de estudiantes, dirigido conjuntamente por Roland Eils e Irina Lehmann del Instituto de Salud de Berlín BIH y Charité - Universitätsmedizin Berlin, en colaboración con Dominik Niopek del Instituto de Farmacia y Biotecnología Molecular IPMB de la Universidad de Heidelberg,se propuso el objetivo de desbloquear este conocimiento de la computadora. Comenzó a trabajar en este tema en 2017 y ha desarrollado un algoritmo llamado "DeeProtein", una red neuronal completa e inteligente que puede predecir las funciones de las proteínas en función de la secuencia de cada individuo.bloques de construcción de proteínas, los aminoácidos. Como la mayoría de los algoritmos de aprendizaje, DeeProtein es una "caja negra", lo que significa que su funcionamiento sigue siendo un misterio para los programadores y los usuarios. Pero los estudiantes ahora han usado un "truco" para desentrañarEl secreto de esta red.
Los jóvenes científicos comenzaron desarrollando una forma de mirar en sentido figurado por encima del hombro del programa mientras realiza su trabajo ". En el análisis de sensibilidad enmascaramos sucesivamente cada posición en la secuencia de proteínas y dejamos que DeeProtein calcule, o más bien prediga, la funciónde la proteína de esta información incompleta ", explica Julius Upmeier zu Belzen. Es estudiante del programa de maestría en biotecnología molecular en el IPMB y autor principal del artículo, que acaba de ser publicado en la revista Inteligencia de la máquina de la naturaleza *. "A continuación le damos a DeeProtein la información completa de la secuencia y comparamos los dos conjuntos de predicciones", agrega Upmeier zu Belzen. "De esta manera calculamos, para cada posición en la secuencia de proteínas, cuán importante es esta posición para predecir elfunción correcta. Esto significa que le damos a cada posición o aminoácido en la cadena de proteínas un valor de sensibilidad para la función de la proteína ".
Los científicos luego usan la nueva técnica analítica para identificar las regiones de las proteínas que son vitales para su función. Esta técnica funciona para señalizar proteínas que juegan un papel durante la carcinogénesis y también para la herramienta de edición de genes CRISPR-Cas9, que tieneya ha sido probado en una gran cantidad de estudios preclínicos y clínicos. "El análisis de sensibilidad nos permite identificar regiones proteicas que toleran los cambios bien o no tan bien", dice Dominik Niopek. "Este es un primer paso importante si queremos hacer objetivoscambios en las proteínas, para equiparlas con nuevas funciones o para 'desactivar' propiedades indeseables ".
"Con este trabajo mostramos que las predicciones de las redes neuronales no solo pueden ser útiles, sino que ahora también podemos usar este conocimiento implícito por primera vez para fines prácticos", explica Roland Eils. Este enfoque es relevante para muchos problemasen biología molecular y medicina. "Si, por ejemplo, queremos desarrollar medicamentos dirigidos o terapias genéticas, necesitamos saber exactamente dónde enfocar nuestra atención", agrega Eils. "DeeProtein ahora puede ayudarnos a hacer eso".
Fuente de la historia :
Materiales proporcionado por Berliner Institut für Gesundheitsforschung / Instituto de Salud de Berlín . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :