Cuando los científicos anunciaron la secuencia completa del genoma humano en 2003, se equivocaron un poco.
De hecho, casi 20 años después, alrededor del 8% del genoma nunca se ha secuenciado por completo, en gran parte porque consiste en fragmentos de ADN altamente repetitivos que son difíciles de alinear con el resto.
Pero un consorcio de tres años finalmente completó ese ADN restante, proporcionando la primera secuencia genómica completa y sin espacios para que los científicos y médicos puedan consultar.
El genoma recién completado, denominado T2T-CHM13, representa una importante actualización del genoma de referencia actual, denominado GRCh38, que utilizan los médicos cuando buscan mutaciones relacionadas con enfermedades, así como los científicos que analizan la evolución de la genética humanavariación.
Entre otras cosas, las nuevas secuencias de ADN revelan detalles nunca antes vistos sobre la región alrededor del centrómero, que es donde los cromosomas se agarran y separan cuando las células se dividen, asegurando que cada célula "hija" herede la cantidad correcta de cromosomasLa variabilidad dentro de esta región también puede proporcionar nueva evidencia de cómo evolucionaron nuestros antepasados humanos en África.
"Descubrir la secuencia completa de estas regiones del genoma que antes faltaban nos dijo mucho sobre cómo están organizadas, que era totalmente desconocida para muchos cromosomas", dijo Nicolas Altemose, becario postdoctoral en la Universidad de California, Berkeley,y coautor de cuatro nuevos artículos sobre el genoma completo. "Antes, solo teníamos la imagen más borrosa de lo que había allí, y ahora es muy claro hasta la resolución de un solo par de bases".
Altemose es el primer autor de un artículo que describe las secuencias de pares de bases alrededor del centrómero. Un artículo que explica cómo se realizó la secuenciación aparecerá en la edición impresa del 1 de abril de la revista Ciencia, mientras que el artículo centrómero de Altemose y otros cuatro que describen lo que nos dicen las nuevas secuencias se resumen en la revista con los artículos completos publicados en línea. Cuatro artículos complementarios, incluido uno del que Altemose es coautor, también aparecerán en línea el 1 de abrilen el diarioMétodos de la naturaleza.
La secuenciación y el análisis fueron realizados por un equipo de más de 100 personas, el llamado Telemere-to-Telomere Consortium, o T2T, llamado así por los telómeros que cubren los extremos de todos los cromosomas. La versión sin espacios del consorcio de los 22autosomas y el cromosoma sexual X se compone de 3.055 millones de pares de bases, las unidades a partir de las cuales se construyen los cromosomas y nuestros genes, y 19.969 genes que codifican proteínas. De los genes que codifican proteínas, el equipo de T2T encontró unos 2.000 nuevos, la mayoríadeshabilitados, pero 115 de los cuales aún pueden expresarse. También encontraron alrededor de 2 millones de variantes adicionales en el genoma humano, 622 de las cuales ocurren en genes médicamente relevantes.
"En el futuro, cuando se secuencie el genoma de alguien, podremos identificar todas las variantes en su ADN y usar esa información para guiar mejor su atención médica", dijo Adam Phillippy, uno de los líderes de T2T yinvestigador principal del Instituto Nacional de Investigación del Genoma Humano NHGRI, por sus siglas en inglés de los Institutos Nacionales de la Salud."Realmente terminar la secuencia del genoma humano fue como ponerse un nuevo par de anteojos. Ahora que podemos ver todo con claridad, estamos un paso más cercapara entender lo que todo esto significa".
El centrómero en evolución
Las nuevas secuencias de ADN en y alrededor del centrómero totalizan alrededor del 6,2 % del genoma completo, o casi 190 millones de pares de bases, o nucleótidos. De las secuencias restantes recién agregadas, la mayoría se encuentran alrededor de los telómeros al final de cada cromosoma yen las regiones que rodean los genes ribosómicos. Todo el genoma está formado por solo cuatro tipos de nucleótidos, que, en grupos de tres, codifican los aminoácidos utilizados para construir proteínas. La principal investigación de Altemose consiste en encontrar y explorar áreas de los cromosomas donde las proteínas interactúancon ADN.
"Sin proteínas, el ADN no es nada", dijo Altemose, quien obtuvo un doctorado en bioingeniería conjuntamente de UC Berkeley y UC San Francisco en 2021 después de haber recibido un doctorado en estadística de la Universidad de Oxford. "El ADN esun conjunto de instrucciones sin nadie que lo lea si no tiene proteínas alrededor para organizarlo, regularlo, repararlo cuando está dañado y replicarlo. Las interacciones proteína-ADN son realmente donde ocurre toda la acción para la regulación del genoma,y ser capaz de mapear dónde se unen ciertas proteínas al genoma es realmente importante para comprender su función".
Después de que el consorcio T2T secuenciara el ADN faltante, Altemose y su equipo usaron nuevas técnicas para encontrar el lugar dentro del centrómero donde un gran complejo proteico llamado cinetocoro sujeta sólidamente el cromosoma para que otras máquinas dentro del núcleo puedan separar los pares de cromosomas.
"Cuando esto sale mal, terminas con cromosomas mal segregados, y eso conduce a todo tipo de problemas", dijo. "Si eso sucede en la meiosis, eso significa que puedes tener anomalías cromosómicas que conducen a abortos espontáneos o enfermedades congénitas.Si sucede en las células somáticas, puede terminar con cáncer, básicamente, células que tienen una mala regulación masiva".
Lo que encontraron dentro y alrededor de los centrómeros fueron capas de nuevas secuencias superpuestas a capas de secuencias más antiguas, como si a través de la evolución se hubieran establecido repetidamente nuevas regiones de centrómeros para unirse al cinetocoro. Las regiones más antiguas se caracterizan por mutaciones y deleciones más aleatorias., lo que indica que la célula ya no los usa. Las secuencias más nuevas donde se une el cinetocoro son mucho menos variables y también menos metiladas. La adición de un grupo metilo es una etiqueta epigenética que tiende a silenciar los genes.
Todas las capas dentro y alrededor del centrómero están compuestas de longitudes repetitivas de ADN, en base a una unidad de aproximadamente 171 pares de bases de largo, que es aproximadamente la longitud del ADN que envuelve un grupo de proteínas para formar un nucleosoma, manteniendo elADN empaquetado y compacto. Estas unidades de 171 pares de bases forman estructuras repetidas aún más grandes que se duplican muchas veces en tándem, construyendo una gran región de secuencias repetitivas alrededor del centrómero.
El equipo de T2T se centró en un solo genoma humano, obtenido de un tumor no canceroso llamado mola hidatiforme, que es esencialmente un embrión humano que rechazó el ADN materno y duplicó su ADN paterno. Dichos embriones mueren y se transforman en tumores.Pero el hecho de que este topo tuviera dos copias idénticas del ADN paterno, ambas con el cromosoma X del padre, en lugar de un ADN diferente tanto del padre como de la madre, facilitó la secuenciación.
Los investigadores también publicaron esta semana la secuencia completa de un cromosoma Y de una fuente diferente, que tardó casi tanto en ensamblarse como el resto del genoma combinado, dijo Altemose. El análisis de esta nueva secuencia del cromosoma Y aparecerá en unpublicación futura.
Altemose y su equipo, que incluía a la científica del proyecto de UC Berkeley Sasha Langley, también utilizaron el nuevo genoma de referencia como andamio para comparar el ADN centromérico de 1600 individuos de todo el mundo, revelando diferencias importantes tanto en la secuencia como en el número de copias de secuencias repetitivasADN alrededor del centrómero. Estudios previos han demostrado que cuando grupos de humanos antiguos emigraron de África al resto del mundo, solo se llevaron una pequeña muestra de variantes genéticas con ellos. Altemose y su equipo confirmaron que este patrón se extiende a los centrómeros.
"Lo que encontramos es que en individuos con ascendencia reciente fuera del continente africano, sus centrómeros, al menos en el cromosoma X, tienden a dividirse en dos grandes grupos, mientras que la mayor parte de la variación interesante se encuentra en individuos que tienen ascendencia africana reciente,", dijo Altemose. "Esto no es del todo una sorpresa, dado lo que sabemos sobre el resto del genoma. Pero lo que sugiere es que si queremos observar la variación interesante en estas regiones centroméricas, realmente necesitamos tener unesfuerzo enfocado para secuenciar más genomas africanos y completar el ensamblaje de secuencias de telómero a telómero".
Las secuencias de ADN alrededor del centrómero también podrían usarse para rastrear los linajes humanos hasta nuestros ancestros simios comunes, señaló.
"A medida que te alejas del sitio del centrómero activo, obtienes una secuencia cada vez más degradada, hasta el punto en que si vas a las orillas más lejanas de este mar de secuencias repetitivas, comienzas a ver el antiguo centrómero que, tal vez, nuestros ancestros primates distantes solían unirse al cinetocoro”, dijo Altemose. “Es casi como capas de fósiles”.
Secuenciación de lectura larga que cambia las reglas del juego
El éxito de T2T se debe a técnicas mejoradas para secuenciar tramos largos de ADN a la vez, lo que ayuda a determinar el orden de tramos de ADN altamente repetitivos. Entre estos se encuentra la secuenciación HiFi de PacBio, que puede leer longitudes de más de 20 000 pares de bases conalta precisión. La tecnología desarrollada por Oxford Nanopore Technologies Ltd., por otro lado, puede leer hasta varios millones de pares de bases en secuencia, aunque con menos fidelidad. En comparación, la llamada secuenciación de próxima generación de Illumina Inc. se limita acientos de pares de bases.
"Estas nuevas tecnologías de secuenciación de ADN de lectura larga son simplemente increíbles; cambian las reglas del juego, no solo para este mundo de ADN repetitivo, sino porque le permiten secuenciar moléculas únicas y largas de ADN", dijo Altemose. "Usted puedecomenzar a hacer preguntas a un nivel de resolución que antes no era posible, ni siquiera con métodos de secuenciación de lectura corta".
Altemose planea explorar más las regiones centroméricas, utilizando una técnica mejorada que él y sus colegas en Stanford desarrollaron para identificar los sitios en el cromosoma que están unidos por proteínas, similar a cómo el cinetocoro se une al centrómero. Esta técnica también utilizatecnología de secuenciación de lectura larga. Él y su grupo describieron la técnica, llamada metilación dirigida con secuenciación de lectura larga DiMeLo-seq, en un artículo que apareció esta semana en la revistaMétodos de la naturaleza.
Mientras tanto, el consorcio T2T se está asociando con el Consorcio de Referencia del PanGenoma Humano para trabajar en un genoma de referencia que represente a toda la humanidad.
"En lugar de solo tener una referencia de un individuo humano o una mola hidatiforme, que ni siquiera es un individuo humano real, deberíamos tener una referencia que represente a todos", dijo Altemose. "Hay varias ideas sobre cómo lograreso. Pero lo que primero necesitamos es una comprensión de cómo se ve esa variación, y necesitamos muchas secuencias genómicas individuales de alta calidad para lograr eso".
Su trabajo sobre las regiones centroméricas, al que llamó "un proyecto apasionante", fue financiado por becas posdoctorales. Los líderes del proyecto T2T fueron Karen Miga de UC Santa Cruz, Evan Eichler de la Universidad de Washington y Adam Phillippy deNHGRI, que proporcionó gran parte de la financiación. Otros coautores del artículo sobre el centrómero de UC Berkeley son Aaron Streets, profesor asistente de bioingeniería; Abby Dernburg y Gary Karpen, profesores de biología molecular y celular; la científica del proyecto Sasha Langley; y ex becaria postdoctoralGina Caldas.
Fuente de la historia:
Materiales proporcionado por Universidad de California-Berkeley. Original escrito por Robert Sanders. Nota: el contenido se puede editar por estilo y longitud.
referencia de diario:
Citar esta página:
Visita Nuevo científico for more global science stories >>>