Tres artículos publicados el 11 de noviembre en Naturaleza presentan avances importantes en la comprensión de la evolución de aves y mamíferos, que son posibles gracias a nuevos métodos para comparar los genomas de cientos de especies.
La genómica comparativa utiliza datos genómicos para estudiar las relaciones evolutivas entre especies e identificar secuencias de ADN con funciones esenciales conservadas en muchas especies. Este enfoque requiere una alineación de las secuencias del genoma para que las posiciones correspondientes en diferentes genomas puedan compararse, pero eso se convierte encada vez más difícil a medida que aumenta el número de genomas.
Investigadores del Instituto de Genómica de UC Santa Cruz desarrollaron un nuevo y poderoso método de alineación del genoma que ha hecho posibles los nuevos estudios, incluida la alineación más grande jamás lograda de más de 600 genomas de vertebrados. Los resultados brindan una vista detallada de cómo se relacionan las especiesentre sí a nivel genético.
"Literalmente alineamos las secuencias de ADN para ver las posiciones correspondientes en cada genoma, de modo que pueda observar los elementos individuales del genoma y ver con gran detalle qué ha cambiado y qué ha permanecido igual a lo largo del tiempo evolutivo", explicóBenedict Paten, profesor asociado de ingeniería biomolecular en UC Santa Cruz y autor correspondiente de dos de los nuevos artículos.
La identificación de secuencias de ADN que se conservan, que permanecen sin cambios durante millones de años de evolución, permite a los científicos identificar elementos del genoma que controlan funciones importantes en una amplia gama de especies.t cambió porque no puede, y ahora podemos ver eso con una resolución más alta que nunca ", explicó Paten.
La generación anterior de herramientas de alineación se basó en comparar todo con un solo genoma de referencia, lo que resultó en un problema llamado "sesgo de referencia". Paten y el coautor Glenn Hickey desarrollaron originalmente un programa de alineación sin referencias llamado Cactus, que era de última generaciónel arte en ese momento, pero funcionaba solo a pequeña escala. El estudiante graduado de UCSC Joel Armstrong ahora en Google luego lo extendió para crear un nuevo y poderoso programa llamado Progressive Cactus, que puede funcionar para cientos e incluso miles de genomas.
"La mayoría de los métodos de alineación anteriores estaban limitados por el sesgo de referencia, por lo que si el humano es la referencia, podrían decirle mucho sobre la relación del genoma humano con el genoma del ratón y mucho sobre la relación del genoma humano con el genoma del perro -pero no mucho sobre la relación del genoma del ratón con el genoma del perro ", explicó Armstrong." Lo que hemos hecho con Progressive Cactus es averiguar cómo evitar la limitación del sesgo de referencia sin dejar de ser lo suficientemente eficiente y preciso para manejar la escala masivade los proyectos actuales de secuenciación del genoma ".
Armstrong es autor principal de los tres artículos y primer autor del artículo que describe Progressive Cactus y presenta los resultados de una alineación de 605 genomas que representan cientos de millones de años de evolución de vertebrados. Esta alineación sin precedentes combina dos alineaciones más pequeñas,uno para 242 mamíferos placentarios y otro para 363 aves. Los otros dos artículos se centran por separado en las alineaciones del genoma de mamíferos y aves.
Este esfuerzo de colaboración internacional fue coordinado por un grupo organizador dirigido por los coautores Guojie Zhang en la Universidad de Copenhague y el China National GeneBank, Elinor Karlsson en el Broad Institute de Harvard y MIT, y Paten en UCSC. Los datos genómicos utilizados en estos análisisfueron generados por dos amplios consorcios: el proyecto 10,000 Bird Genomes B10K para genomas de aves y el proyecto Zoonomia para genomas de mamíferos.
Los científicos han estado haciendo planes durante años para secuenciar y analizar los genomas de decenas de miles de animales. El coautor David Haussler, director del UCSC Genomics Institute, ayudó a iniciar el proyecto Genome 10K en 2009. Los esfuerzos relacionados incluyen el Vertebrate Genome Project yEarth BioGenome Project, y todos estos proyectos ahora están cobrando fuerza.
"Estos son artículos muy prospectivos, porque los métodos que hemos desarrollado escalarán a alineaciones de miles de genomas", dijo Paten. "A medida que la tecnología de secuenciación se vuelve más barata y rápida, la gente secuencia cientos de nuevas especies yesto abre nuevas posibilidades para comprender las relaciones evolutivas y los fundamentos genéticos de la biología. Hay una cantidad colosal de información en estos genomas ".
Fuente de la historia :
Materiales proporcionado por Universidad de California - Santa Cruz . Original escrito por Tim Stephens. Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :