El campo de la genómica funcional, que analiza las actividades del genoma y los niveles de expresión génica en lugar de mutaciones genéticas particulares, generalmente se basa en la agregación de información de muchas muestras por su poder estadístico. Esto significa que compartir ampliamente los datos brutos es vital; sin embargo, compartir estos datos actualmente es un desafío debido a las preocupaciones de privacidad de las personas dentro de esos conjuntos de datos, lo que hace que estos datos sean en gran medida inaccesibles detrás de los firewalls.
En un estudio publicado el 12 de noviembre en la revista celda , un equipo de investigadores demuestra que es posible desidentificar esos datos para garantizar la privacidad del paciente. También demuestran cómo estos datos sin procesar podrían vincularse a individuos específicos a través de sus variantes genéticas mediante algo tan simple como una taza de café abandonada siestas medidas de saneamiento no se implementan.
"El propósito de este estudio es encontrar formas prácticas de compartir ampliamente los datos en bruto sin crear preocupaciones de privacidad indebidas", dice el autor principal Mark Gerstein, profesor de bioinformática en la Universidad de Yale.
La investigación de la genómica funcional suele estar vinculada a una enfermedad específica. Por ejemplo, una investigación de una afección psiquiátrica en particular podría observar la expresión de ciertos genes en un tipo de neurona. Y, por la naturaleza de tener su material genético incluido en talestudio, el estado médico de un individuo con respecto a esa condición podría ser revelado inadvertidamente.
Esto puede suceder a través de lo que se conoce como un cuasi-identificador. La forma en que funciona un cuasi-identificador es que si alguien tiene suficientes puntos de datos individuales sobre usted, incluso si esos datos por sí mismos no son confidenciales o únicos, se pueden combinarpara crear un identificador que sea exclusivo para usted. En un entorno no genético, esto significa que si alguien tiene su código postal, fecha de nacimiento, modelo de automóvil que conduce y otros datos similares que podrían no considerarse privados o confidenciales por sí mismos, es posible que eventualmente puedan combinarlos y crear un perfil único que lo vincule con otros datos que no desea que sean públicos, como los registros financieros que se recopilaron cuando solicitó un préstamo para un automóvil. Lo mismo podría sucedersi alguien pudiera obtener algunas de sus variantes genéticas y vincular esas variantes con la presencia de su material genético en un estudio sobre una enfermedad en particular. Esto a su vez podría revelar un diagnóstico, como el estado del VIH o una predisposición hereditaria al cáncer, quewopreferiría mantener la privacidad.
En su estudio, los investigadores construyeron un escenario de "ataque de vinculación" para demostrar cómo alguien podría hacer este tipo de conexiones a partir de datos de estudios de genómica funcional mediante el uso de ADN obtenido de una taza de café desechada. Después de agregar muestras de dos participantes que dieron su consentimiento a unaEn la base de datos de genómica funcional, los investigadores reunieron tazas de café usadas de los mismos individuos. Secuenciaron el material genético dejado en las tazas y pudieron hacer coincidir con éxito ese material con las muestras en la base de datos e inferir información de salud sensible sobre los participantes. Los investigadores también fueroncapaz de usar información de ADN "robada" de una base de datos de genotipado para hacer coincidir las identidades de 421 personas con la información fenotípica encontrada en un conjunto de datos de prueba de genómica funcional que los investigadores construyeron para 436 personas.
Sin embargo, los investigadores también identificaron pasos que se pueden tomar para frustrar este tipo de ataques de vinculación y salvaguardar la información de salud de los participantes cuando se comparten conjuntos de datos de genómica funcional. "La genómica funcional es especial porque las variantes generalmente no son necesarias para el procesamiento de datos", diceEl primer autor Gamze Gürsoy, investigador postdoctoral en el laboratorio de Gerstein. "Debido a esto, podemos desinfectar las variantes para evitar que los datos se vinculen a la información privada relacionada con los fenotipos incluidos en estos estudios, sin dejar de conservar la utilidad de los datos.. "
Para lograr este equilibrio entre la privacidad y la utilidad de los datos, los investigadores proponen una manipulación del formato de archivo que permitirá compartir datos genómicos funcionales sin procesar y, al mismo tiempo, reducir en gran medida la fuga de información confidencial al generalizar información sobre variantes fenotípicas. El formato de archivo se basa en unsistema de formato de archivo estándar ampliamente utilizado, es compatible con una variedad de software y canalizaciones, y cuando se probó, mostró poca pérdida de utilidad. Los investigadores también han desarrollado un marco con el que otros investigadores pueden ajustar el nivel de privacidad y el equilibrio de utilidad que deseanlograr con el formato de archivo basado en las políticas y consentimientos de los donantes.
"A medida que se publican más datos para este tipo de estudios de genómica funcional, las preocupaciones sobre la seguridad y la privacidad no deben perderse", dice Gerstein. "En los albores de Internet, la gente no se dio cuenta de la importancia que tendrían sus actividades en líneaconvertirse. Ahora ese tipo de privacidad digital se ha vuelto tan importante para nosotros. Si pasamos a una era en la que secuenciar su genoma se convierte en una rutina, no queremos que estas preocupaciones sobre la privacidad de la salud se vuelvan dominantes ".
Este trabajo fue apoyado por los Institutos Nacionales de Salud, el fondo de cátedra AL Williams y el fondo asesorado por donantes de la iniciativa Chan Zuckerberg.
Fuente de la historia :
Materiales proporcionados por Prensa de celda . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :