Las comunidades microbiológicas, que incluyen bacterias, organismos unicelulares y nematodos, revelan una gran cantidad de información sobre el estado de los suelos. En todo el mundo, se está realizando mucha investigación sobre esta biodiversidad a nivel genético, pero a tercerosno siempre pueden dar el mejor uso posible a estos resultados de investigación. La razón de esto: la información registrada en las bases de datos varía en términos de calidad. Los investigadores de UFZ ahora han creado una nueva base de datos de metadatos para metagenomas terrestres con más de 15,000 conjuntos de datos,que pretende facilitar el trabajo para los científicos. Esto fue publicado en la revista científica Investigación de ácidos nucleicos .
Más de 202,000 metagenomas, es decir, toda la información genética contenida en una muestra de suelo dada, se puede encontrar en las dos bases de datos más importantes en las que los microbiólogos pueden archivar datos de investigación: los repositorios MG-Rast y Sequence Read Archive SRA. Aquí, investigadores internacionales han registrado dónde realizaron investigaciones en comunidades microbiológicas o secuenciación del genoma en el fondo del mar, en bosques, praderas o rocas, y sus hallazgos. Al hacerlo, permiten que otros investigadores utilicen estos datos en sus propias actividades de investigación ycompárelo con sus propios hallazgos. Y les ahorra tener que repetir el trabajo que lleva mucho tiempo sobre preguntas que ya pueden haber sido respondidas. Sin embargo, los investigadores encuentran obstáculos para su trabajo una y otra vez: los conjuntos de datos a menudo están incompletosy no está uniformemente marcado. "Esto hace que sea más difícil para los usuarios interesados procesar aún más los datos", dice el Dr. Ulisses Nunes da Rocha, ecólogo microbiológico ene UFZ y uno de los autores principales del estudio.Esto comienza con pequeños detalles, como la temperatura.La temperatura se puede registrar de diferentes maneras usando Fahrenheit, Kelvin o Celsius;Además, la forma en que se abrevian las unidades varía.Pero también hay incertidumbre con respecto a lo que pueden parecer cuestiones básicas;Por ejemplo, algunos científicos de todo el mundo tienen diferentes interpretaciones de la definición exacta de un bioma el término científico para un hábitat a gran escala.Todo esto, dice el Dr. da Rocha, hace que sea más difícil usar los datos de manera eficiente.
El Dr. Ulisses Nunes da Rocha y su equipo ahora han filtrado los datos del metagenoma de los conjuntos de datos MG Rast y SRA recopilados por investigadores en el entorno terrestre de todo el mundo. Por el contrario, seleccionaron los datos recopilados de los mares y océanos. ExactamenteSe reunieron 15.022 conjuntos de datos de metagenomas de bosques o pastizales o del subsuelo originario de 84 países en la nueva base de datos de metadatos. No desarrollaron nuevos estándares científicos para la descripción exacta de estos metadatos, como las coordenadas geográficas, el valor de pHo las temperaturas involucradas pero usaron un método de estandarización existente. "La base de datos de metadatos ayuda a los investigadores cuyo trabajo se centra en el medio ambiente terrestre y que desean incorporar datos de este tipo en su propio trabajo", dice el investigador de UFZ.experimentos de laboratorio con el propósito de fijar CO2 o establecer el efecto de pesticidas en comunidades microbiológicas, por nombrar dos ePor ejemplo, los investigadores pueden consultar la base de datos para ver si los investigadores de algún lugar del mundo ya han realizado experimentos similares sobre este tema y han puesto a disposición sus datos.
La base de datos de metadatos "TerrestrialMetagenomeDB" de libre acceso de la UFZ entró en línea a principios de noviembre. Los usuarios pueden usar inicialmente seis filtros, como el origen del bioma, el tipo de muestra o la fuente de datos para buscar en la base de datos y, si es necesario,rastrear datos más específicos por medio de otros 33 filtros. En segundo lugar, otro enfoque proporciona un mapa interactivo del mundo que los usuarios pueden usar para buscar conjuntos de datos de acuerdo con características geográficas. Tres videos tutoriales ofrecen soporte adicional al usuario sobre cómo realizar mejor la investigacióny descargue los datos. La base de datos de metadatos se actualiza automáticamente dos veces al año, en enero y julio. Como parte de este proceso, se recuperan automáticamente conjuntos de datos nuevos o corregidos de los repositorios MG-Rast y SRA, suponiendo que grupos de científicos tenganadaptó los atributos de sus propios datos a los estándares de la nueva base de datos. Hay un gran potencial: hay alrededor de 100,000 conjuntos de datos en espera que contienen datos en tierrametagenomas que no se pudieron estandarizar hasta la fecha porque los datos no se habían ingresado con la suficiente precisión.Para el Dr. Ulisses Nunes da Rocha y su grupo de trabajo UFZ "Ciencia de datos de sistemas microbiológicos", este es solo el primer paso en un proceso para facilitar el análisis de grandes datos de comunidades microbiológicas en sistemas terrestres a escala global.
Fuente de la historia :
Materiales proporcionado por Centro Helmholtz de Investigación Ambiental - UFZ . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :