Imagínese tratando de hornear un pastel, excepto que tiene que ir a diferentes tiendas para obtener harina y leche, conducir por la ciudad para obtener huevos y llamar a un amigo para pedir prestado un molde para pasteles.
Este es el tipo de escenario desarticulado que enfrentan muchos científicos cuando intentan recopilar datos dispersos en pequeñas bases de datos y archivos PDF difíciles de buscar.
"No es que los datos no existan", dijo Andrew Su, profesor asociado del Instituto de Investigación Scripps TSRI. "Los datos simplemente no se almacenan de manera que los científicos puedan acceder fácilmente".
"Los datos abiertos son vitales para el progreso y la investigación", agregó el Profesor Asistente TSRI de Medicina Molecular y Experimental Ben Good. "Necesitamos derribar esas barreras".
Para resolver este problema, Su, Good y sus colegas de TSRI han integrado datos biomédicos en Wikidata, una base de datos pública y editable donde los investigadores pueden vincular fácilmente genes, proteínas y más. Su trabajo fue anunciado en dos artículos recientes en la revista Base de datos .
Una mejor manera de investigar
Los avances tecnológicos en los últimos 10 años han llevado a aumentos rápidos en el volumen y la tasa de investigación biomédica, lo que a su vez ha llevado a un rápido crecimiento en el conocimiento biomédico. Sin embargo, este conocimiento está actualmente fragmentado en innumerables recursos, desde en líneabases de datos a archivos de datos complementarios a hechos individuales en documentos individuales.
"Como comunidad de investigación, pasamos mucho tiempo buscando buenos recursos y tratando de vincularlos", dijo Tim Putman, investigador asociado de investigación de TSRI, quien fue el primer autor de uno de los estudios. "Es indignante".
Incluso cuando las bases de datos están abiertas al público, el conocimiento actual no siempre se organiza de manera uniforme, explicó Putman.
En lugar de dejar que cada grupo de investigación aborde la integración de datos individualmente, Wikidata ofrece un nuevo modelo para organizar toda esta información. Basado en los mismos principios que Wikipedia, Wikidata permite a cualquier persona agregar nueva información a una base de datos comunitaria abierta.
Mientras que otros editores de Wikidata han agregado información sobre millones de artículos tan diversos como obras de arte a ciudades de EE. UU., El equipo de TSRI se ha centrado en agregar información sobre conceptos biomédicos.
El asociado de investigación de TSRI, Sebastian Burgstaller-Muehlbacher, primer autor en un estudio, agregó datos sobre todos los genes humanos y de ratón, todas las enfermedades humanas y todos los medicamentos aprobados por la Administración de Drogas y Alimentos de los EE. UU.
Putman luego extendió Wikidata con un enfoque en los genomas microbianos. Con toda esta información recopilada en un sistema, los investigadores pueden detectar más fácilmente las conexiones entre enfermedades, patógenos y procesos biológicos. Como ejemplo, Putman utilizó el modelo para mostrar que otros microorganismos enel cuerpo puede influir en las infecciones por clamidia.
Como prueba de concepto, Putman dirigió el desarrollo de un navegador genómico basado en Wikidata. En lugar de tener que desarrollar un navegador para cada genoma secuenciado, este navegador genómico permite a los usuarios explorar cualquier genoma que se haya cargado en Wikidata.
"Puede acercarse a un gen, hacer clic en él y aparecerá la secuencia", dijo Good. El navegador del genoma se vinculará de nuevo a la entrada original de Wikidata.
Al final, los investigadores planean tener una base de datos completa y uniforme que sea fácil de buscar y abrir a cualquiera que quiera agregar datos y vincular conceptos relacionados.
"Creemos que todos estos datos deberían estar abiertos", dijo Su. "Esto tiene sentido intuitivo".
Fuente de la historia :
Materiales proporcionado por Instituto de Investigación Scripps . Nota: El contenido puede ser editado por estilo y longitud.
Referencias de revistas :
Cite esta página :