El primer informe del Grupo de Trabajo de Datos de Investigación Abierta descubrió que dos de los mayores desafíos para utilizar de manera efectiva los datos de investigación abiertos son que: incluso cuando es accesible desde el punto de vista teórico, los investigadores a menudo simplemente no pueden encontrar esos datos, y si lo encuentran,no puede usarlo debido a las frustrantes variaciones de formato y otros problemas de compatibilidad.
Jo Johnson, Ministro de Estado de Universidades, Ciencia, Investigación e Innovación, estableció el Grupo de trabajo, dirigido por la profesora Pam Thomas vicerrectora de investigación de la Universidad de Warwick y encargado de proporcionar asesoramiento independienteen forma de una "hoja de ruta" para la infraestructura nacional de datos de investigación abierta del Reino Unido. Este primer informe del Grupo de trabajo ha identificado los siguientes desafíos clave que deberán abordarse en cualquier hoja de ruta para la infraestructura de datos de investigación abierta. Estos incluyen :
Búsqueda de datos: los mecanismos disponibles para identificar y encontrar datos de investigación "subóptimos". Funcionan de manera razonablemente efectiva en solo unas pocas áreas temáticas y para expertos en esos campos. Existen estándares de metadatos competitivos y no hayequivalente, para datos de investigación, a la búsqueda de 'texto completo' que suelen usar los motores de búsqueda.
Uso y reutilización de los datos: "Las diferentes estructuras y formatos de datos a menudo exigen esfuerzos desproporcionados antes de que se pueda usar y analizar de manera efectiva una gama de conjuntos de datos". La falta de interoperabilidad plantea obstáculos particulares para quienes operan en campos interdisciplinarios o desean usar datosdesde fuera de su propia área especializada.
Es importante trabajar con los usuarios para garantizar que los datos sean reutilizables. Es posible que los datos tengan que reestructurarse y reutilizarse de varias maneras para que sean realmente reutilizables, pero puede ser un uso ineficiente deEl tiempo y la experiencia de los investigadores para emprender este cambio de propósito ellos mismos, pero no está claro quién debería hacerlo.
Problemas de software: ha habido algún progreso en el desarrollo de software, sin embargo, el informe también establece que "las habilidades y la comprensión del software siguen siendo variables en toda la comunidad de investigación, y las carreras profesionales para los especialistas en software en la comunidad de investigación aún necesitan atención".
Calidad de los datos: "Sigue siendo frecuente que los investigadores no confíen en los datos de otros investigadores. El suministro de documentación detallada sobre procedencia y procedimientos analíticos es de importancia crítica; pero los requisitos para el aseguramiento de la calidad pueden ser de varias capas, difíciles yConsume mucho tiempo y las responsabilidades para garantizar que los datos se ajusten a los estándares básicos de calidad a menudo no están claramente definidas. Con frecuencia, tanto para los creadores como para los usuarios de los datos de investigación no está claro qué se ha hecho o quién se hará, y quién lo hará ".
Automatización: demasiados aspectos de la gestión y curación de datos implican una intervención manual, y esto "constituye una barrera importante contra la adopción más amplia de buenas prácticas". El desarrollo de herramientas generalizadas para facilitar los flujos de trabajo automatizados sería de gran ayuda para reducir tales barreras.
Selección, almacenamiento y conservación: fuera de unos pocos campos relativamente conocidos, puede prevalecer una falta de comprensión común de qué datos junto con el software y la documentación asociados deben almacenarse, dónde, cuándo y cómo, en diferentesetapas del proceso de investigación y posteriormente
Seguridad: la protección contra actividades delictivas de diversos tipos piratería, fraude, ataques DDOS, etc. aumentará en importancia a medida que los volúmenes de datos de investigación continúen creciendo, junto con las fuentes de las que se extraen, yA medida que la infraestructura de datos de investigación crece en complejidad, esto puede dar lugar a nuevos tipos de tensiones entre el deseo de apertura y seguridad de los datos.
La Profesora de la Presidencia de las Fuerzas de Tarea, Pam Thomas, dijo: "La Fuerza de Tarea ahora procederá a desarrollar una hoja de ruta completa, que tendrá como objetivo abordar la gama de problemas que hemos identificado en nuestro primer informe, y cómo se podrían obtener los recursos, quese publicará en 2018. Sin embargo, también proporcionaremos ayuda y orientación más inmediatas a través de la publicación a lo largo de este verano de una serie de estudios de caso que se centran en las mejores prácticas en el manejo de datos de investigación abierta en disciplinas e instituciones ".
El Grupo de trabajo también identifica una serie de áreas y oportunidades que podrían conducir a acciones positivas para ayudar a resolver los problemas que ha identificado y que probablemente aparecerán en la hoja de ruta final que incluyen :
Buenas prácticas: ejemplos de buenas prácticas en una serie de campos que incluyen la genómica, la astronomía y la cristalografía. Las revistas toman la delantera. Las preocupaciones sobre la reproducibilidad y la replicabilidad pueden llevar a los consejos editoriales de las revistas académicas a desempeñar un papel importante aquí en la adopción yimplementar políticas de datos apropiadas.
Habilidades: un reconocimiento cada vez mayor de la necesidad de identificar y corregir brechas significativas en las habilidades de los investigadores en muchas disciplinas. Existe la necesidad de una comprensión más clara de lo que es razonable esperar que un investigador competente pueda hacer sin ayuda.También es un consenso que hay una falta suficiente de personal de apoyo con las habilidades apropiadas para apoyar a los investigadores en la gestión eficaz de sus datos, y que las trayectorias profesionales para ellos no son claras y deben abordarse
Incentivos: existe un acuerdo generalizado sobre la necesidad de zanahorias en lugar de palos, y la cita de datos a menudo se considera un incentivo clave potencial para los investigadores. Pero sería necesario que los investigadores obtengan una retribución clara de una buena gestión de datos y datos abiertos.
Fuente de la historia :
Materiales proporcionado por Universidad de Warwick . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :