La investigación de "Big data" corre el riesgo de verse perjudicada por el mal diseño de los identificadores digitales que etiquetan los datos. Un grupo de investigadores de todo el mundo, dirigido por Julie McMurry, de la Oregon Health & Science University, ha reunido un conjunto de pautas pragmáticaspara crear, hacer referencia y mantener identificadores basados en la web para mejorar la reproducibilidad, la atribución y el descubrimiento científico. La guía, publicada el 29 de junio en la revista de acceso abierto PLOS Biología ayuda a abordar los problemas frecuentes asociados con identificadores persistentes vinculados a datos científicos.
En la última década, las ciencias de la vida han cambiado drásticamente a medida que los datos continúan evolucionando para ser más grandes, más interdependientes y nativos basados en la web. En este panorama, la comunidad más amplia de investigación científica ha luchado por diseñar estos datos para la web de modo quees permanentemente accesible, reutilizable y atribuible.
Dependiendo de la base de datos individual involucrada, los identificadores pueden significar un gen, un genoma, un químico, un organismo, un conjunto de datos experimentales o incluso un artículo publicado. La utilidad de todos estos elementos depende de la solidez y singularidad de suidentificadores respectivos, lo que les permite ser vinculados y descubiertos a perpetuidad. Los autores señalan que la forma orgánica en que han surgido la mayoría de los identificadores amenaza esa utilidad, y reconocen que es difícil crear y mantener identificadores o direcciones web persistentes que noromper y que se usan de manera consistente.
Este trabajo hace un llamado a los profesionales para que hagan un mejor trabajo de ingeniería de identificadores, de acuerdo con las convenciones emergentes desarrolladas por la comunidad, para que los datos puedan ser utilizados de manera más efectiva para el descubrimiento científico. También hace un llamado a los usuarios a conocer lo suficiente estas convenciones, y de herramientas disponibles, para no quemarse por enlaces rotos y conexiones perdidas.
"Al igual que con los accesorios de plomería, la cuestión de cómo funcionan los identificadores solo debe ser entendida por aquellos que los construyen y mantienen. Sin embargo, todos necesitan saber cómo deben usarse los identificadores, y aquí es donde la convención es importante", dijoMcMurry. "A través de este trabajo, esperamos alentar a todos los participantes en el ecosistema académico, incluidos los autores, creadores de datos, integradores de datos, editores, desarrolladores de software y solucionadores, a adherirse a las mejores prácticas para maximizar la utilidad y el impactode datos de ciencias biológicas "
Fuente de la historia :
Materiales proporcionados por PLOS . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :