Millones, si no miles de millones, de especímenes residen en las colecciones de historia natural del mundo, pero la mayoría de estos no se han estudiado con cuidado, ni siquiera se han examinado, en décadas. Si bien contienen datos críticos para muchos esfuerzos científicos, la mayoría de los objetos están en silencioen sus propios pequeños gabinetes de curiosidad.
Por lo tanto, la digitalización masiva de colecciones de historia natural se ha convertido en un objetivo importante en los museos de todo el mundo. Habiendo reunido a numerosos biólogos, curadores, voluntarios y científicos ciudadanos, tales iniciativas ya han generado grandes conjuntos de datos a partir de estas colecciones y han proporcionado una visión sin precedentes.
Ahora, un estudio, publicado recientemente en acceso abierto Diario de datos de biodiversidad , sugiere que los últimos avances en digitalización y aprendizaje automático podrían ayudar juntos a los conservadores de museos en sus esfuerzos por cuidar y aprender de este increíble recurso global.
Un equipo de investigadores del Departamento de Botánica del Smithsonian, el Laboratorio de Ciencia de Datos y la Oficina del Programa de Digitalización colaboraron recientemente con NVIDIA para llevar a cabo un proyecto piloto utilizando enfoques de aprendizaje profundo para cavar en muestras de herbario digitalizadas.
Su estudio es uno de los primeros en describir el uso de métodos de aprendizaje profundo para mejorar nuestra comprensión de las muestras de recolección digitalizadas. También es el primero en demostrar que una red neuronal convolucional profunda - un sistema informático basado en la actividad de las neuronas en animalescerebros que básicamente pueden aprender por sí mismos: pueden diferenciar efectivamente entre plantas similares con una precisión asombrosa de casi el 100%.
En el documento, los científicos describen dos redes neuronales diferentes que entrenaron para realizar tareas en la porción digitalizada actualmente 1.2 millones de especímenes del Herbario Nacional de los Estados Unidos.
El equipo primero entrenó una red para reconocer automáticamente las hojas de herbario que habían sido manchadas con cristales de mercurio, ya que algunos recolectores tempranos solían usar el mercurio para proteger las colecciones de plantas del daño causado por insectos. La segunda red fue entrenada para discriminar entre dos familias deplantas que comparten una apariencia superficial sorprendentemente similar.
Las redes neuronales entrenadas se realizaron con una precisión del 90% y 96% respectivamente o 94% y 99% si se descartaron los especímenes más desafiantes, lo que confirma que el aprendizaje profundo es una tecnología útil e importante para el análisis futuro de las colecciones digitalizadas de museos.
"Los resultados se pueden aprovechar para mejorar la curación y desbloquear nuevas vías de investigación", concluyen los científicos.
"Este trabajo de investigación es una maravillosa prueba de concepto. Ahora sabemos que podemos aplicar el aprendizaje automático a especímenes de historia natural digitalizados para resolver problemas de curaduría e identificación. El futuro utilizará estas herramientas combinadas con grandes conjuntos de datos compartidos para probar fundamentaleshipótesis sobre la evolución y distribución de plantas y animales ", dice el Dr. Laurence J. Dorr, presidente del Departamento de Botánica del Smithsonian y coautor del estudio.
Fuente de la historia :
Materiales proporcionado por Editores Pensoft . La historia original tiene licencia bajo a Licencia Creative Commons . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :