Un nuevo método computacional puede mejorar la precisión de los análisis de expresión génica, que se utilizan cada vez más para diagnosticar y controlar los cánceres y son una herramienta importante para la investigación biológica básica.
Investigadores de la Universidad Carnegie Mellon, la Universidad Stony Brook y el Instituto del Cáncer Dana-Farber dijeron que su método, llamado Salmon, es capaz de corregir los sesgos técnicos que se sabe que ocurren durante la secuenciación de ARN, o ARN-seq, el método líder paraestimar la expresión génica. Además, opera a velocidades similares a otros métodos rápidos, un factor crítico ya que estas pruebas se están volviendo más comunes y numerosas.
Su informe se publicará en línea el 6 de marzo por la revista Métodos de la naturaleza . Carl Kingsford, profesor asociado en el Departamento de Biología Computacional de CMU, dijo que el código fuente de Salmon está disponible gratuitamente en línea y ya ha sido descargado por miles de usuarios.
"El salmón proporciona un modelo mucho más rico del experimento RNA-seq y de los posibles sesgos que se sabe que ocurren durante la secuenciación", dijo Kingsford. Esto es importante, agregó, porque esta técnica se usa cada vez más para clasificar enfermedades y sussubtipos, que comprenden los cambios en la expresión génica durante el desarrollo y el seguimiento de la progresión del cáncer.
Aunque la composición genética de un organismo es estática, la actividad de los genes individuales varía mucho con el tiempo, lo que hace que la expresión génica sea un factor importante para comprender cómo funcionan los organismos y qué ocurre durante los procesos de la enfermedad. La actividad genética no se puede medir de manera eficiente directamente, pero puedededucirse mediante el monitoreo del ARN, las moléculas que transportan información de los genes para producir proteínas y otras actividades celulares.
RNA-seq es una tecnología líder para producir estas instantáneas de la actividad génica. Pero dependiendo del tejido que se analiza y la forma en que se prepara cada muestra, pueden producirse varios sesgos experimentales y hacer que las "lecturas" de RNA-seq se sobrepasen oKingsford dijo que no se tomaron muestras de varios genes.
"Aunque conocemos muchos de los tipos de sesgos que pueden ocurrir, modelarlos debe ocurrir muestra por muestra", agregó. "Y si tiene que construir un modelo de sesgo complicado utilizando métodos tradicionales,lleva mucho tiempo "
Los investigadores nombraron el método después de un pez famoso por nadar río arriba porque emplea un algoritmo que puede estimar el efecto de los sesgos y el nivel de expresión de los genes como flujos de datos experimentales.
"De esa manera, es capaz de construir un modelo de sesgo rico y hacerlo aproximadamente tan rápido como otras herramientas de análisis rápido", dijo Kingsford.
Fuente de la historia :
Materiales proporcionado por Universidad Carnegie Mellon . Original escrito por Byron Spice. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :