Un grupo de científicos rusos, entre ellos personal del Instituto de Física y Tecnología de Moscú, ha propuesto un nuevo método para la comparación de secuencias de ADN acopladas al metagenoma de todos los organismos en una muestra de material biológico que se está investigando. El métodopermite resolver de forma más eficaz y rápida la tarea de comparar muestras y puede integrarse fácilmente en el proceso de análisis de datos de cualquier estudio de metagenoma. El estudio ha sido publicado en BMC Bioinformática diario.
Las bacterias, que habitan el cuerpo humano, ocupan un lugar especial para los científicos en el estudio de la metagenómica. No se puede subestimar la importancia de la metagenómica: en una estimación aproximada, las células bacterianas de nuestro cuerpo superan en número a las nuestras en un orden de magnitud yla mayoría de ellos se encuentran en el intestino. Varios proyectos globales, como el "Proyecto del Microbioma Humano", han revelado que la composición de la comunidad bacteriana afecta nuestro riesgo de enfermedad, la selección de una dieta óptima, el estado de ánimo e incluso la creatividad.lo contrario es cierto: la composición de estos microorganismos es sensible a los procesos que ocurren en el cuerpo. Por lo tanto, al comparar el paciente de la muestra con personas con un metagenoma intestinal sano, a largo plazo será posible evaluar en el futuro el riesgo deenfermedades, como diabetes o enfermedad inflamatoria intestinal.
El enfoque tradicional del análisis del metagenoma consiste en comparar muestras en función de su composición taxonómica: porcentajes de cada especie microbiana encontrada. Para determinar la composición de la muestra, sus secuencias genéticas se comparan con una base de datos de genomas bacterianos conocidos, denominadaSin embargo, este enfoque tiene varias desventajas. En primer lugar, los genomas de referencia son a menudo inexactos, ya que la composición del genoma de referencia es una tarea computacionalmente compleja y que requiere mucho tiempo, especialmente para las especies que son difíciles de cultivar; y los genomas deLas especies aisladas en el laboratorio pueden portar un conjunto de genes, que es significativamente diferente de la misma especie que vive en un entorno natural. En segundo lugar, no todos los organismos se recogen en genomas de referencia en general; ejemplos de tales organismos son virus. Por lo tanto, esa parte dela secuencia de la muestra, que no coincide con la muestra de referencia, simplemente no se tiene en cuenta durante el análisis,a pesar de que puede ser bastante grande y significativo.Por su parte, un método basado en la comparación de frecuencias k-mer no requiere el recurso a una muestra de referencia ni la existencia de información sobre los organismos estudiados, por lo que todas las secuencias de la muestra se someten a análisis, lo que da la mejorresultados.
El método se basa en la representación de la secuencia genómica de un organismo como el conjunto con todas las instancias de "palabras" de nucleótidos de longitud especificada "k", llamadas k-mers. Dado que el genoma es una secuencia única para cada organismo, los conjuntos detales "palabras" también difieren entre organismos individuales. Por lo tanto, el conjunto de todos los k-mers para un metagenoma puede verse como un conjunto de conjuntos, es decir, de sus organismos constituyentes. Esto nos permite evaluar las diferencias en la composición bacteriana al comparar muestras.
Para probar la eficacia de la técnica k-mer en comparación con los enfoques tradicionales, se utilizaron dos conjuntos de datos del metagenoma: un conjunto de datos reales y un conjunto de datos generados artificialmente. Datos artificiales creados a partir de genomas, con proporciones conocidas de antemano es conveniente de usar al probar el método, ya que conocemos la secuencia con precisión y podemos evaluar el resultado recibido comparándolo con un valor correcto a priori. Se utilizaron metagenomas intestinales de residentes de Estados Unidos y China como datos reales.
Se sabe que las comunidades intestinales bacterianas difieren significativamente entre distintas poblaciones, y los algoritmos han pretendido permitirnos encontrar, exactamente aquellos indicadores, que muestran la diferencia en la composición. Por lo tanto, el criterio para evaluar la efectividad del método que se considerófue la medida en que se pueden distinguir los metagenomas, es decir, cuánto difieren los metagenomas chinos en general de los estadounidenses.
El método ha mostrado mejores resultados en ambos tipos de datos al comparar k-mers, que cuando se usa el mapeo tradicional con un conjunto de referencia. Además, cuando se usan datos reales, se permitió un desajuste entre los resultados intestinales para k-mer y los enfoques tradicionalesnosotros para detectar otro componente importante del metagenoma intestinal, a saber, el fago bacteriano crAssphage, que había escapado a la atención de los investigadores utilizando el método tradicional. Según el autor del artículo, Dmitri Alexeev: "Curiosamente, los genes se pueden ver no solocomo segmentos de ADN con proteínas codificadas en ellos, pero también como información en general. Es esta distinción de información la que nos ha permitido identificar nuevos segmentos de ADN no descritos en el catálogo de genes conocidos. Es interesante ver cómo este enfoqueser utilizado por otros grupos de investigación. "
La técnica desarrollada nos permite encontrar de manera más eficiente y precisa las diferencias entre los metagenomas para una variedad de comunidades bacterianas, lo que puede ayudar a estudiar, diagnosticar y tratar muchas enfermedades humanas.
Fuente de la historia :
Materiales proporcionados por Instituto de Física y Tecnología de Moscú . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :