Un nuevo estudio, afiliado a UNIST ha presentado recientemente un algoritmo estadístico novedoso, capaz de identificar genes de enfermedades potenciales de una manera más precisa y rentable. Este algoritmo también se ha considerado como un nuevo enfoque prometedor para la identificación de enfermedades candidatasgenes, ya que funciona de manera efectiva con menos datos genómicos y solo toma uno o dos minutos obtener resultados.
Este avance ha sido realizado por el profesor Dougu Nam y su equipo de investigación en la Facultad de Ciencias de la Vida de UNIST. Sus hallazgos han sido publicados en Investigación de ácidos nucleicos el 19 de marzo de 2018.
En el estudio, el equipo de investigación presentó el método y el software novedosos GSA-SNP2 para el análisis de enriquecimiento de la vía de los datos del valor P de GWAS. Según el equipo de investigación, GSA-SNP2 proporciona alta potencia, control de error de tipo I decente y cálculo rápidoincorporando el modelo de conjunto aleatorio y la puntuación genética ajustada por recuento de SNP.
"GSA-SNP2 es una herramienta poderosa y eficiente para el enriquecimiento de vías y el análisis de redes de datos resumidos del estudio de asociación de todo el genoma GWAS", dice el profesor Nam. "Con este algoritmo, podemos identificar fácilmente nuevos objetivos farmacológicos, profundizando asínuestra comprensión de las enfermedades y desbloquear nuevas terapias para tratarlas ".
El genoma de cada individuo es una combinación única de secuencias de ADN que desempeñan un papel importante en la determinación de quiénes somos. Esto explica todas las diferencias individuales, incluida la susceptibilidad a enfermedades y diversos fenotipos. Esta variación genética entre los seres humanos se conoce como polimorfismos de nucleótido único SNPLos SNP que se correlacionan con enfermedades específicas podrían servir como biomarcadores predictivos para ayudar al desarrollo de nuevos fármacos. A través del análisis estadístico de los datos resumidos de GWAS, es posible identificar los SNP asociados a la enfermedad.
A pesar de las cantidades astronómicas de dinero y tiempo invertidas en el análisis estadístico de los datos de SNP, las tecnologías de detección de SNP convencionales no han podido identificar todos los SNP posibles. Esto se debe a que la mayoría de los métodos convencionales para detectar SNP están diseñados para controlar estrictamente-positivos en los resultados. Por lo tanto, entre decenas de miles de datos genómicos y cientos de miles de SNP analizados, el número de marcadores descritos dentro de un gen de enfermedad candidato a menudo alcanza varios.
"Aunque es necesario controlar los SNP falsos positivos para la interpretación correcta de los resultados, un filtrado excesivo puede obstaculizar su utilidad en el desarrollo de fármacos", dice el profesor Nam. "Por lo tanto, la potencia estadística mejorada es esencial para los algoritmos estadísticos prácticos".
El equipo tuvo como objetivo desarrollar un algoritmo que mejora la predictibilidad estadística mientras mantiene un control preciso de los falsos positivos. Para ello, aplicaron la curva de tendencia monótona Cubic Spline a la puntuación del gen a través del análisis de la vía competitiva para los datos de expresión génica.
En un estudio comparativo que utilizó datos de GWAS simulados y reales, GSA-SNP2 mostró vías positivas de alto poder y el estándar de oro mejor priorizadas en comparación con seis métodos existentes basados en el enriquecimiento y dos métodos autónomos. Según estos resultados, la diferencia entre las víasSe investigaron enfoques de análisis y también se discutieron los efectos de las estructuras de correlación de genes en el análisis de enriquecimiento de la vía. Además, GSA-SNP2 es capaz de visualizar redes de interacción de proteínas dentro y a través de las vías significativas para que el usuario pueda priorizar las subredes centrales paraestudios adicionales.
Según el equipo de investigación, GSA-SNP2 proporciona un control de error tipo I muy mejorado mediante el uso de puntajes genéticos ajustados por recuento de SNP, al mismo tiempo que conserva un alto poder estadístico. También proporciona redes de interacción de proteínas locales y globales en las vías asociadas, y puede facilitar el análisis integrado de rutas y redes de datos GWAS.
El equipo de investigación espera que su GSA-SNP2 sea capaz de visualizar redes de interacción de proteínas dentro y a través de las vías importantes para que el usuario pueda priorizar las subredes centrales para estudios adicionales.
Fuente de la historia :
Materiales proporcionado por Instituto Nacional de Ciencia y Tecnología de Ulsan UNIST . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :