Un estudio realizado por investigadores del Instituto de Ciencias del Cáncer de Singapur CSI Singapur en la Universidad Nacional de Singapur y la Facultad de Ciencias Biológicas de la Universidad Tecnológica de Nanyang, Singapur NTU Singapur reveló una deficiencia común en los métodos existentes de inteligencia artificial utilizadospara predecir las interacciones potenciador-promotor, que pueden dar lugar a medidas de rendimiento infladas. Los resultados, publicados en la revista científica Genética de la naturaleza en julio de 2019, proporciona una hoja de ruta mejorada para la comprensión de la regulación genética.
Un potenciador es una secuencia corta de ADN que trabaja para acelerar la transcripción genética, mientras que un promotor es un fragmento de ADN que actúa para iniciar la transcripción génica. Comprender las interacciones entre un potenciador y un promotor es fundamental para los estudios de regulación génica, ya que existeGran interés científico sobre si las interacciones pueden ser disfuncionales en las células cancerosas y presentar una oportunidad para la intervención clínica. Para estudiar las interacciones potenciador-promotor a gran escala y de manera rentable, los métodos de inteligencia artificial para predecir tales interacciones son vitales.para facilitar a los investigadores en sus estudios y permitirles extender la disponibilidad de dichos datos a nuevos tipos de células.
En el estudio realizado por el Dr. Cao Fan, investigador en CSI Singapur, y la Dra. Melissa J. Fullwood, investigadora principal en CSI Singapur y profesora asistente de Nanyang en NTU Singapur, el equipo de investigación intentó desarrollar una interacción potenciador-promotormétodo de predicción que utiliza conjuntos de datos existentes de TargetFinder, un método avanzado de aprendizaje automático que predice interacciones potenciador-promotor basadas en el factor de transcripción y los perfiles de modificación de histonas en las regiones de ventana entre potenciadores y promotores. Durante ese tiempo, el equipo observó que las interacciones potenciador-promotor se predecían encaracterísticas de secuencia de ADN al azar en las regiones de la ventana, lo que indica un alto rendimiento.
Sin embargo, tras un examen cuidadoso de los conjuntos de datos de TargetFinder, el equipo se dio cuenta de que los altos rendimientos informados podrían atribuirse a la alta superposición entre las regiones de ventana de muestras positivas en los conjuntos de datos, lo que afecta el rendimiento previsto. Para mitigar el problema de las muestras superpuestas,Luego, el equipo evaluó los métodos de interacción potenciador-promotor utilizando una estrategia de división de cromosomas. TargetFinder logró un rendimiento significativamente menor con la estrategia de división de cromosomas, lo que demostró que las mediciones de rendimiento estaban realmente infladas en la predicción anterior.
El equipo también examinó otro método, JEME, un método de aprendizaje automático supervisado que utiliza conjuntos de datos con diferencias significativas en las distribuciones de distancia entre muestras positivas y negativas para predecir las interacciones potenciador-promotor. Su investigación reveló que JEME también da como resultado un rendimiento infladomediciones debido al uso erróneo de datos de entrada.
"Nuestro estudio destaca la necesidad de un diseño experimental cuidadoso cuando se aplica el aprendizaje automático a la investigación genómica. Es clave evaluar adecuadamente un método de interacción potenciador-promotor y tener en cuenta la posibilidad de generar una medición de rendimiento altamente inflada", dijo el Dr. Cao.
"La predicción precisa de las interacciones potenciador-promotor es esencial en los estudios de regulación génica para facilitar nuestra capacidad de comprender si existen diferencias entre las muestras de cáncer, como los diferentes subtipos clínicos de cáncer, para desarrollar mejor los biomarcadores y las terapias contra el cánceren el futuro ", dijo el Dr. Fullwood.
En adelante, el equipo de investigación trabajará en un nuevo enfoque preciso de aprendizaje automático para la predicción de las interacciones potenciador-promotor, y aplicará el método al análisis de cohortes de cáncer para comprender las alteraciones en las interacciones potenciador-promotor en el cáncer.
Fuente de la historia :
Materiales proporcionado por Universidad Nacional de Singapur . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :