Un marco computacional basado en el aprendizaje profundo, 'DeepEC', permitirá la predicción de alta calidad y alto rendimiento de los números de comisión enzimática, que es esencial para la comprensión precisa de las funciones enzimáticas.
Un equipo del Dr. Jae Yong Ryu, el Profesor Hyun Uk Kim y el Distinguido Profesor Sang Yup Lee en KAIST informó el marco computacional impulsado por el aprendizaje profundo que predice los números de la comisión enzimática CE con alta precisión de una manera de alto rendimiento.
DeepEC toma una secuencia de proteínas como entrada y predice con precisión los números EC como salida. Las enzimas son proteínas que catalizan reacciones bioquímicas y los números EC que consisten en cuatro niveles es decir, abcd indican reacciones bioquímicas. Por lo tanto, la identificación de los números ECes fundamental para comprender con precisión las funciones enzimáticas y el metabolismo.
Los números de EC generalmente se dan a una secuencia de proteína que codifica una enzima durante un procedimiento de anotación del genoma. Debido a la importancia de los números de EC, se han desarrollado varias herramientas de predicción de números de EC, pero tienen margen para una mejora adicional con respecto al tiempo de cálculo,precisión, cobertura y el tamaño total de los archivos necesarios para la predicción del número CE.
DeepEC usa tres redes neuronales convolucionales CNN como un motor principal para la predicción de números EC, y también implementa un análisis de homología para los números EC si los tres CNN no producen números EC confiables para una secuencia de proteínas dada. DeepEC fue desarrollado porutilizando un conjunto de datos estándar de oro que cubre 1.388.606 secuencias de proteínas y 4.669 números EC.
En particular, los estudios de evaluación comparativa de DeepEC y otras cinco herramientas representativas de predicción de números EC mostraron que DeepEC realizó las predicciones más precisas y rápidas para los números EC. DeepEC también requirió el espacio de disco más pequeño para la implementación, lo que lo convierte en un software de terceros idealcomponente.
Además, DeepEC fue el más sensible en la detección de la pérdida de la función enzimática como resultado de mutaciones en los dominios / residuo del sitio de unión de las secuencias de proteínas; en este análisis comparativo, todos los dominios o residuos del sitio de unión fueron sustituidos con residuo de L-alanina en ordenpara eliminar la función de la proteína, que se conoce como el método de escaneo de L-alanina.
Este estudio fue publicado en línea en el Actas de la Academia Nacional de Ciencias de los Estados Unidos de América PNAS el 20 de junio de 2019, titulado "El aprendizaje profundo permite la predicción de alta calidad y alto rendimiento de los números de comisiones enzimáticas"
"DeepEC puede usarse como una herramienta independiente y también como un componente de software de terceros en combinación con otras plataformas computacionales que examinan las reacciones metabólicas. DeepEC está disponible gratuitamente en línea", dijo el profesor Kim.
El distinguido profesor Lee dijo: "Con DeepEC, es posible procesar volúmenes cada vez mayores de datos de secuencia de proteínas de manera más eficiente y precisa".
Este trabajo fue apoyado por el Programa de Desarrollo de Tecnología para Resolver Cambios Climáticos en Ingeniería Metabólica de Sistemas para Biorefinerías del Ministerio de Ciencia y TIC a través de la Fundación Nacional de Investigación de Corea. Este trabajo también fue financiado por el Programa de Desarrollo de Tecnología Médica y Bio deFundación Nacional de Investigación de Corea financiada por el gobierno coreano, el Ministerio de Ciencia y TIC.
Fuente de la historia :
Materiales proporcionado por El Instituto Avanzado de Ciencia y Tecnología de Corea KAIST . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :