Un equipo de investigación conjunto de KAIST y UCSD ha desarrollado una red neuronal profunda llamada DeepTFactor que predice factores de transcripción a partir de secuencias de proteínas. DeepTFactor servirá como una herramienta útil para comprender los sistemas reguladores de los organismos, acelerando el uso del aprendizaje profundo para resolver problemas biológicosproblemas.
Un factor de transcripción es una proteína que se une específicamente a las secuencias de ADN para controlar el inicio de la transcripción. El análisis de la regulación transcripcional permite comprender cómo los organismos controlan la expresión génica en respuesta a cambios genéticos o ambientales. En este sentido, encontrar el factor de transcripción de unorganismo es el primer paso en el análisis del sistema regulador transcripcional de un organismo.
Anteriormente, los factores de transcripción se predecían analizando la homología de secuencia con factores de transcripción ya caracterizados o mediante enfoques basados en datos, como el aprendizaje automático. Los modelos de aprendizaje automático convencionales requieren un proceso de selección de características riguroso que se basa en la experiencia del dominio, como el cálculo de las propiedades fisicoquímicas.de moléculas o analizando la homología de secuencias biológicas. Mientras tanto, el aprendizaje profundo puede inherentemente aprender características latentes para la tarea específica.
Un equipo de investigación conjunto compuesto por el candidato a doctorado Gi Bae Kim y el distinguido profesor Sang Yup Lee del Departamento de Ingeniería Química y Biomolecular de KAIST, y Ye Gao y el Profesor Bernhard O. Palsson del Departamento de Ingeniería Bioquímica de UCSDinformó sobre una herramienta basada en el aprendizaje profundo para la predicción de factores de transcripción. Su artículo de investigación "DeepTFactor: una herramienta basada en el aprendizaje profundo para la predicción de factores de transcripción" se publicó en línea en PNAS .
Su artículo informa sobre el desarrollo de DeepTFactor, una herramienta basada en el aprendizaje profundo que predice si una secuencia de proteína dada es un factor de transcripción usando tres redes neuronales convolucionales paralelas. El equipo de investigación conjunto predijo 332 factores de transcripción de Escherichia coli K-12 MG1655 usandoDeepTFactor y el rendimiento de DeepTFactor al confirmar experimentalmente los sitios de unión en todo el genoma de tres factores de transcripción predichos YqhC, YiaU y YahB.
El equipo de investigación conjunto utilizó además un método de relevancia para comprender el proceso de razonamiento de DeepTFactor. Los investigadores confirmaron que, aunque la información sobre los dominios de unión al ADN del factor de transcripción no se proporcionó explícitamente en el proceso de capacitación, DeepTFactor los aprendió implícitamente y los usó paraA diferencia de las herramientas de predicción de factores de transcripción anteriores que se desarrollaron solo para secuencias de proteínas de organismos específicos, se espera que DeepTFactor se utilice en el análisis de los sistemas de transcripción de todos los organismos a un alto nivel de rendimiento.
El distinguido profesor Sang Yup Lee dijo: "DeepTFactor se puede utilizar para descubrir factores de transcripción desconocidos de numerosas secuencias de proteínas que aún no se han caracterizado. Se espera que DeepTFactor sirva como una herramienta importante para analizar los sistemas reguladores de organismos de interés. "
Fuente de la historia :
Materiales proporcionado por Instituto Avanzado de Ciencia y Tecnología de Corea KAIST . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :