Los médicos usan clasificaciones estándar de enfermedades basadas en los síntomas o la ubicación en el cuerpo para ayudar a hacer diagnósticos. Estas clasificaciones, llamadas nosologías, pueden ayudar a los médicos a comprender qué enfermedades están estrechamente relacionadas y, por lo tanto, pueden ser causadas por los mismos problemas subyacentes o responder a losmismos tratamientos
Una parte importante de la comprensión de la enfermedad es estimar su heredabilidad, es decir, qué porcentaje de la variación de la enfermedad en los individuos se debe a variantes genéticas heredadas versus causas ambientales como la exposición a la contaminación, infecciones o traumas. Tradicionalmente, para calcular la heredabilidad de un determinadoLos investigadores necesitaban conjuntos de datos caros que contenían todo tipo de datos médicos y genéticos, además de un conocimiento detallado de las relaciones familiares. En un nuevo estudio, científicos de datos de la Universidad de Chicago estimaron la heredabilidad y mapearon las relaciones entre miles de enfermedades utilizando datos de registros electrónicos de salud.
El estudio, publicado el 3 de diciembre de 2019 en Comunicaciones de la naturaleza , calcularon las curvas estadísticas de la prevalencia de cada enfermedad a lo largo de una vida promedio, mostrando cuáles tienden a atacar más temprano o más tarde en la vida. Los investigadores también crearon "incrustaciones de enfermedades" o agrupaciones de enfermedades que muestran cuán estrechamente se relacionan entre sísobre códigos de diagnóstico y notas en el registro de salud. Utilizando similitudes en estas curvas y patrones revelados por las incrustaciones de la enfermedad, los investigadores podrían estimar la heredabilidad y las correlaciones genéticas entre las enfermedades.
"Solía ser que cada nueva estimación de heredabilidad o correlaciones genéticas y ambientales entre enfermedades era un gran problema", dijo Andrey Rzhetsky, PhD, científico de datos en UChicago, quien es el autor principal del artículo. "Aquí pudimosestimar miles de valores de heredabilidad y cientos de miles de correlaciones, haciendo lo que solía ser muy costoso y lento a gran escala "
inicio temprano vs inicio tardío
Para construir los modelos estadísticos del equipo, el investigador postdoctoral Gengjie Jia, PhD, el primer autor del artículo, utilizó datos de Truven MarketScan, una base de datos de declaraciones de propiedades saludables no identificadas de 151 millones de personas en los Estados Unidos durante 11 años. También incluyerondatos del Registro Nacional de Pacientes de Dinamarca 5,6 millones de personas mayores de 21 años y del Registro Nacional de Salud de Suecia 9,4 millones de personas mayores de 44 años. Luego crearon curvas de prevalencia de la enfermedad que representan el porcentaje de personas que tienen una enfermedad en cada edad.
Las curvas documentan cambios estadísticamente significativos en la prevalencia de una afección a lo largo de la vida útil promedio. Los diferentes extremos y formas de las curvas muestran si una enfermedad es más prevalente en edades más tempranas de inicio temprano o mayores de inicio tardío. Los investigadores también pueden identificarcaídas o picos en la curva que pueden ser un signo de eventos desencadenantes ambientales que pueden influir en enfermedades, como la pubertad, cambios en la dieta, traumatismos o exposición a infecciones.
El equipo también construyó "incrustaciones de enfermedades" o relaciones entre enfermedades, utilizando un modelo de red neuronal para analizar varios factores diferentes alrededor de cuándo aparece una enfermedad en un registro médico. Este análisis se modeló a partir del procesamiento del lenguaje natural que define la semántica subyacente de una palabraanalizando las palabras que lo rodean. En un registro de salud, una enfermedad es como una palabra, y el registro histórico de las condiciones que desarrollan a lo largo de la vida forman una oración. Por ejemplo, "dolores de cabeza" podrían ser seguidos por "migrañas" a medida que los médicos se reducenun diagnóstico. Por lo tanto, cuando los traza en un mapa bidimensional, los dolores de cabeza aparecerían más cerca de las migrañas que, por ejemplo, los calambres estomacales.
"El sistema está aprendiendo de secuencias reales en los datos del paciente al optimizar 20 parámetros para cada enfermedad", dijo Rzhetsky. "A partir de ese contexto, dado el historial de salud pasado del paciente, la red está tratando de anticipar lo que vendrá después. Puedepiénselo como lo que pasa en la mente del médico cuando hace un diagnóstico "
identificación de nuevos patrones
A medida que estudiaron los datos, comenzaron a surgir varios patrones. En los datos de EE. UU., Las enfermedades de aparición temprana superaron en número a las de aparición tardía, pero fueron menos prevalentes en la población. Esto podría deberse a que la detección y el monitoreo rutinarios de los recién nacidos tienden a identificar másenfermedades, o porque las enfermedades con un fuerte componente genético tienden a atacar antes y causar más muertes.
Cuando dos enfermedades están estrechamente correlacionadas solo por la genética, es probable que las formas de sus curvas de prevalencia sean muy diferentes. Si están vinculadas solo por factores ambientales, son mucho más similares, pero las curvas son más similares cuando son ambientales ylas correlaciones genéticas son altas
Los investigadores también vieron que algunas enfermedades que parecen estar estrechamente relacionadas, como las afecciones psiquiátricas, se agrupan en diferentes grupos según la edad media de aparición. El trastorno por déficit de atención con hiperactividad y el autismo, por ejemplo, son de aparición temprana, mientras que la esquizofrenia, trastorno bipolary la depresión tienden a aparecer de forma tardía.
Jia dijo que esta ejecución inicial con conjuntos de datos de salud tan grandes valida su enfoque para clasificar enfermedades en función de la similitud de las formas de las curvas. Si bien a un nivel alto, el resultado coincidía con las clasificaciones y asociaciones comúnmente aceptadas entre grupos de enfermedades, lo hizoidentifique algunas sorpresas. Por ejemplo, se encontró que las infecciones parasitarias se alinean con una variedad de enfermedades no infecciosas, como neurofibromatosis, trastornos de la membrana timpánica del oído, osteogénesis imperfecta enfermedad de los huesos frágiles y anomalías oculares congénitas.
Las curvas de prevalencia de la enfermedad, estandarizadas por edad y sexo, nunca antes se habían comparado sistemáticamente como lo hace este estudio haga clic aquí para ver una base de datos de búsqueda de curvas de prevalencia estratificadas por sexo y país para más de 500 enfermedades.El equipo espera refinar estas herramientas y usarlas para ayudar a llenar los vacíos de las condiciones menos estudiadas.
"Nuestras estimaciones pueden usarse para decidir dónde asignar los recursos de investigación", dijo Rzhetsky. "¿Esta enfermedad tiene un componente genético o ambiental más fuerte? Lo hicimos a través de un espectro completo de enfermedades, por lo que es una herramienta general que puede seraplicado a otras condiciones a medida que surgen "
Fuente de la historia :
Materiales proporcionado por Universidad de Chicago . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :