Los haplotipos son un conjunto de variaciones genéticas que, ubicadas lado a lado en el mismo cromosoma, se transmiten en un solo grupo a la próxima generación. Su examen permite comprender la heredabilidad de ciertos rasgos complejos, como el riesgo dedesarrollar una enfermedad. Sin embargo, para llevar a cabo este análisis, generalmente es necesario el análisis del genoma de los miembros de la familia padres e hijos, un proceso tedioso y costoso. Para superar este problema, investigadores de las Universidades de Ginebra UNIGE y Lausana UNIL y el Instituto Suizo de Bioinformática SIB han desarrollado SHAPEIT4, un poderoso algoritmo informático que permite identificar rápidamente los haplotipos de cientos de miles de personas no relacionadas.Los resultados son tan detallados como cuando se realiza un análisis familiar, un proceso que no puede serrealizado a gran escala. Su herramienta ahora está disponible en línea bajo una licencia de código abierto, disponible gratuitamente para toda la comunidad de investigación.descubierto en Comunicaciones de la naturaleza .
Hoy en día, el análisis de datos genéticos se está volviendo cada vez más importante, particularmente en el campo de la medicina personalizada. El número de genomas humanos secuenciados cada año está creciendo exponencialmente y las bases de datos más grandes representan más de un millón de individuos. Esta riqueza de datos esextremadamente valioso para comprender mejor el destino genético de la humanidad, ya sea para determinar el peso genético de una enfermedad en particular o para comprender mejor la historia de la migración humana. Sin embargo, para ser significativos, estos grandes datos deben procesarse electrónicamente ". Sin embargo, el procesamientoel poder de las computadoras se mantiene relativamente estable, a diferencia del crecimiento ultra rápido de Big Data genómico ", dice Olivier Delaneau, profesor de SNSF en el Departamento de Biología Computacional de la Facultad de Biología y Medicina de la UNIL y en SIB, que dirigió este trabajo." Nuestro algoritmopor lo tanto, tiene como objetivo optimizar el procesamiento de datos genéticos para absorber esta cantidad de información y hacer que los científicos la puedan utilizar, despila brecha entre su cantidad y el poder comparativamente limitado de las computadoras "
Comprenda mejor el papel de los haplotipos
El genotipado permite conocer los alelos de un individuo, es decir, las variaciones genéticas recibidas de sus padres. Sin embargo, sin conocer el genoma de los padres, no sabemos qué alelos se transmiten simultáneamente a los niños y en qué combinaciones ".la información, los haplotipos, es crucial si realmente queremos entender la base genética de la variación humana, explica Emmanouil Dermitzakis, profesor del Departamento de Medicina Genética y Desarrollo de la Facultad de Medicina de UNIGE y SIB, quien co-supervisó este trabajo.Esto es cierto tanto para la genética de poblaciones como en la perspectiva de la medicina de precisión ".
Para determinar el riesgo genético de la enfermedad, por ejemplo, los científicos evalúan si una variación genética está más o menos presente en individuos que han desarrollado la enfermedad con el fin de determinar el papel de esta variación en la enfermedad que se estudia ".En los haplotipos, realizamos el mismo tipo de análisis, dice Emmanouil Dermitzakis. Sin embargo, estamos pasando de una sola variante a una combinación de muchas variantes, lo que nos permite determinar qué combinaciones alélicas en el mismo cromosoma tienen el mayor impacto en el riesgo de enfermedad.¡Es mucho más preciso! "
El método desarrollado por los investigadores hace posible procesar un número extremadamente grande de genomas, alrededor de 500,000 a 1,000,000 de individuos, y determinar sus haplotipos sin conocer su ascendencia o descendencia, mientras se usa la potencia informática estándar. La herramienta SHAPEIT4 ha sido exitosaprobado en los 500,000 genomas individuales presentes en el Biobanco del Reino Unido, una base de datos científica desarrollada en el Reino Unido. "Aquí tenemos un ejemplo típico de lo que es Big Data", dice Olivier Delaneau. Una cantidad tan grande de datos hace posible construirmodelos estadísticos de alta precisión, siempre que puedan interpretarse sin ahogarse en ellos ".
Una licencia de código abierto para la transparencia
Los investigadores han decidido hacer que su herramienta sea accesible para todos bajo una licencia MIT de código abierto: todo el código está disponible y se puede modificar a voluntad, de acuerdo con las necesidades de los investigadores. Esta decisión se tomó principalmente en aras de la transparencia yreproducibilidad, así como para estimular a los investigadores de todo el mundo. "Pero solo damos acceso a la herramienta de análisis, bajo ninguna circunstancia a un corpus de datos", explica Olivier Delaneau. "Entonces depende de cada individuo usarlo.en los datos que tiene "
Esta herramienta es mucho más eficiente que las herramientas más antiguas, además de ser más rápida y económica. También permite limitar el impacto ambiental digital. Las computadoras muy poderosas que se utilizan para procesar Big Data realmente consumen mucha energía; reducen su usotambién ayuda a minimizar su impacto negativo.
Fuente de la historia :
Materiales proporcionado por Universidad de Ginebra . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :