Son los elementos repetidos más comunes en el genoma humano; más de un millón de copias se encuentran dispersas entre nuestros genes. Llamados elementos Alu, estos relativamente cortos aproximadamente 300 pares de bases Watson-Crick, secuencias repetitivas no codificantes deEl ADN ha estado implicado en la rápida evolución de los seres humanos y las especies de primates no humanos. Desafortunadamente, estas repeticiones también causan una variación estructural genómica que puede conducir a la enfermedad.
Los elementos Alu que causan enfermedades no funcionan solos. Para causar variaciones estructurales, los pares de elementos Alu / Alu median los reordenamientos genómicos que resultan en ganancias o pérdidas en el número de copias de genes, y estos cambios pueden tener profundas consecuencias para la salud de un individuo.
Por ejemplo, el primer reordenamiento mediado por Alu se describió hace 30 años en un paciente con hipercolesterolemia familiar o niveles muy altos de colesterol en la sangre. El paciente portaba una pequeña deleción del gen parael receptor de lipoproteína de baja densidad LDL que se une a las partículas de lipoproteína de baja densidad, que son los principales portadores de colesterol en la sangre. Los reordenamientos mediados por Alu / Alu han resultado en una pequeña deleción del receptor de LDL en este paciente,no es apto para capturar partículas de colesterol LDL y eliminarlas de la sangre.
Años después, otras afecciones médicas igualmente graves se relacionaron con variaciones estructurales mediadas por Alu / Alu, como la paraplejía espástica 4 y la anemia de Fanconi. Los científicos han estimado que las variantes del número de copias asociadas con Alu / Alu causan aproximadamente el 0.3 por ciento de las enfermedades genéticas humanas.
En sus laboratorios del Baylor College of Medicine, el Dr. James R. Lupski y el Dr. Chad A. Shaw han estado estudiando los mecanismos que median una serie de variaciones estructurales durante muchos años; el interés de investigación del Dr. Lupski en la mutagénesis de variante estructural se ha extendidodécadas. Entre otras cosas, su laboratorio y los hallazgos de otros laboratorios señalaron la variación mediada por elementos de Alu como la causa de una porción significativa de algunas enfermedades genéticas pediátricas.
"Se cree que los elementos Alu de los que estamos hablando son completamente inertes, no producen proteínas activamente, pero surgen problemas cuando la maquinaria que repara el ADN roto replica incorrectamente un segmento genómico flanqueado por un par de elementos Alu repetitivos. La maquinaria"se confunde" con las secuencias repetitivas de Alu y responde de una manera que conduce a la duplicación o eliminación de la secuencia entre los elementos Alu, y esto puede conducir a la enfermedad ", dijo Shaw, quien es estadístico, científico computacional y unprofesor asociado de genética molecular y humana en Baylor College of Medicine, así como director senior de bioinformática en Baylor Genetics.
La situación sería análoga a leer un texto que tiene la misma oración repetida dos veces a intervalos. En esta analogía, el gen está representado por un párrafo de texto flanqueado por las dos mismas frases cortas. El lector vería la repetición, confundirse y probablemente omitir esa sección, posiblemente falta información importante entre las repeticiones. Por el contrario, el lector leería las mismas oraciones varias veces volviendo a la primera oración. En el genoma, 'falta' una sección que incluye genes importantes:una variante de eliminación del número de copia, o la repetición de un segmento, que causa una duplicación o ganancia de copia, puede tener graves consecuencias para la salud.
Dada la relevancia de los elementos Alu en las enfermedades genéticas humanas, así como la evolución del genoma, los investigadores querían encontrar una manera de predecir qué genes son susceptibles a los reordenamientos mediados por Alu / Alu. Los métodos clínicamente aplicados actuales para medir la variación del genoma tienen limitaciones paralograr este objetivo, como una resolución insuficiente o un gran costo, por lo que los investigadores desarrollaron un enfoque novedoso.
"Comenzamos realizando un estudio estadístico integral para identificar las características de los pares Alu que causan enfermedades", dijo Xiaofei Song, un estudiante graduado en el laboratorio de Lupski. "Esto nos permitiría construir un modelo de aprendizaje automático parapredecir genes que probablemente serían susceptibles a cambios debido a reordenamientos mediados por Alu / Alu ".
Cómo construir y probar un modelo de aprendizaje automático para predecir genes causantes de enfermedades
Los investigadores aplicaron un enfoque computacional integral e imparcial para identificar las características de los pares Alu que hacen que los genes sean susceptibles a la ganancia o pérdida de número de copias.
"Analizamos un conjunto de datos de entrenamiento compuesto por 219 pares Alu que se sabe que contribuyen a las enfermedades al afectar genes específicos", dijo Song. "Primero, identificamos las características de secuencia de los elementos Alu en esos 219 pares; luego, nosotrosexaminó todo el genoma humano, utilizando la secuencia de referencia del genoma humano actual a la que el Centro de Secuenciación del Genoma Humano Baylor HGSC contribuyó significativamente, para otros pares de Alu con características similares. Entonces, si encontramos una región que incluya varios pares de Alu conestas características específicas, entonces lo consideraríamos como un 'punto caliente' de inestabilidad genómica asociada con pares Alu ".
"También observamos otras características, como las características de la sección de ADN que rodea a dos elementos Alu", dijo Shaw, quien también es profesor adjunto adjunto de estadística en la Universidad de Rice. "Si los pares están a cierta distancia de cada unootros y están orientados de cierta manera, entonces este es un factor de riesgo. Tener un alto nivel de similitud en la secuencia de ADN es otra pista de que un par Alu puede confundir la maquinaria de replicación y mediar los reordenamientos ".
Los investigadores realizaron un extenso análisis computacional del genoma humano y aproximadamente 78 millones de pares de Alu utilizando la supercomputadora BlueGene de la Universidad de Rice que integró todos estos datos y construyeron un modelo integral. Utilizaron el modelo para evaluar todo el genoma, caracterizando el riesgode Alu / reordenamiento mediado por Alu para cada gen.
"Además, realizamos un trabajo computacional para probar nuestro modelo en datos reales del genoma humano: más de 54 mil muestras de genoma personal. Para cada una de estas muestras, la variación del número de copias se ha determinado y está disponible como variación genómica anonimizadainformación en el laboratorio de diagnóstico de Baylor Genetics ", dijo Song." Este análisis predijo que varios genes de enfermedades conocidas estaban en riesgo de ganar o perder el número de copias mediadas por Alu / Alu ".
Los investigadores seleccionaron 89 de los casos predichos y, utilizando PCR y secuenciación genómica en el laboratorio de Lupski, probaron la presencia de reordenamientos mediados por Alu, confirmando la predicción en el 94 por ciento de los casos.
"Todos estos son nuevos descubrimientos de variaciones en el número de copias causadas por reordenamientos mediados por Alu", dijo Shaw. "También identificamos la unión, el fragmento de ADN entre los elementos de Alu, que puede incluir uno o más genes que han sido reorganizados."
El trabajo también permitió a Song producir un AluAluCNVpredictor, una herramienta basada en la web que permite a los investigadores de todo el mundo predecir el riesgo de reordenamientos mediados por Alu / Alu para los genes de su interés. Se puede acceder a esta herramienta en http://alualucnvpredictor.research.bcm.edu:3838/ .
La colaboración interdisciplinaria descubre pistas ocultas en el ADN
Este trabajo muestra el poder de la colaboración entre genetistas experimentales, genomicistas y científicos computacionales. Años de investigación han producido un amplio conocimiento de la base genética de la enfermedad, así como grandes cantidades de datos genómicos que, gracias a los equipos computacionales que construyeron sofisticados cálculos computacionalesLas herramientas ahora se pueden analizar para descubrir pistas ocultas en el ADN. Los resultados son una comprensión más profunda de la estructura del genoma, la capacidad de dilucidar nuevas asociaciones entre enfermedades y genes, un diagnóstico molecular mejorado y la revelación de nuevos conocimientos sobre la inestabilidad genómica.estructura genética humana y evolución del genoma humano.
"Nuestro enfoque nos permite visualizar evidencia de reordenamientos genómicos a muy alta resolución", dijo Shaw. "Una de las cosas que el trabajo de Song nos ha ayudado a aprender es que una gran parte de la variación humana, incluidas ambas variantes asociadas y no asociadas conenfermedad, es impulsada por pequeños eventos de Alu / Alu mediados por ".
Esta investigación marca otro capítulo importante en más de una década de colaboración entre la ciencia de banco húmedo en el laboratorio Lupski, la genómica en el Baylor HGSC y la ciencia computacional en el laboratorio Shaw, así como los ricos datos para la investigación proporcionados por Baylor GeneticsEste trabajo destaca el entorno incomparable para la investigación interdisciplinaria en el Baylor College of Medicine.
"El poder de nuestro estudio es la unión del análisis computacional y estadístico de 'BigData' con la ciencia experimental en banco húmedo, así como los datos reales de variación del genoma personal humano del laboratorio de diagnóstico. En el proceso, obtuvimos información sobre genómicaestabilidad / inestabilidad y variación estructural del genoma humano responsable de la enfermedad ", dijo Lupski, Profesor Cullen de Genética Molecular y Humana y profesor de pediatría en Baylor. Lupski también es médico tratante en el Texas Children's Hospital, miembro del HGSC, directorinvestigador en el Centro Baylor-Hopkins de Genómica Mendeliana y facultad con el programa de capacitación de posgrado Baylor Genetics and Genomics.
Lea todos los detalles de este estudio y la lista completa de contribuyentes y sus afiliaciones en la revista Investigación del genoma .
Este trabajo fue financiado en parte por el Instituto Nacional de Investigación del Genoma Humano de EE. UU. NHGRI / el Instituto Nacional del Corazón, los Pulmones y la Sangre NHLBI otorgó UM1HG006542 al Centro de Genómica Mendeliana Baylor-Hopkins BHCMG, el Instituto Nacional de Trastornos Neurológicos yEl accidente cerebrovascular NINDS otorga R01 NS058529 y R35 NS105078, y el Instituto Nacional de Ciencias Médicas Generales NIGMS otorga GM106373 y GM080600. El trabajo fue apoyado por la beca NIGMS K99GM120453 y una beca HHMI Damon Runyon Cancer Foundation DRG-2155 y por la beca NINDSF31 NS083159.
Fuente de la historia :
Materiales proporcionado por Baylor College of Medicine . Original escrito por Ana María Rodríguez, Ph.D .. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :