Los niños acostados de espaldas en un campo cubierto de hierba pueden escanear las nubes en busca de imágenes, tal vez un conejito esponjoso aquí y un dragón ardiente por allá. A menudo, los científicos atmosféricos hacen lo contrario: buscan imágenes de datos para las nubes como parte desu investigación para comprender los sistemas de la Tierra.
Etiquetar manualmente las imágenes de datos píxel por píxel lleva mucho tiempo, por lo que los investigadores confían en las técnicas de procesamiento automático, como los algoritmos de detección de nubes. Pero el resultado de los algoritmos no es tan exacto como los científicos quieren que sea.
Recientemente, investigadores del Laboratorio Nacional del Noroeste del Pacífico del Departamento de Energía se unieron para descubrir si el aprendizaje profundo, un subconjunto distinto del aprendizaje automático, puede hacer un mejor trabajo al identificar nubes en datos LIDAR que los algoritmos actuales basados en la físicaLa respuesta: un claro "sí". El nuevo modelo está mucho más cerca de las respuestas a las que llegan los científicos, pero en solo una fracción del tiempo.
Lidar es un instrumento de detección remota que emite un láser pulsado y recoge la señal de retorno dispersada por gotas de nubes o aerosoles. Esta señal de retorno proporciona información sobre la altura y la estructura vertical de las características atmosféricas, como nubes o capas de humo. Tales datosde los lidars terrestres son una parte importante de los pronósticos globales.
La científica de la Tierra Donna Flynn notó que, en algunos casos, lo que los algoritmos detectaban como nubes en las imágenes lidar no coincidía bien con lo que veía su ojo experto. Los algoritmos tienden a sobreestimar los límites de las nubes.
"El algoritmo actual identifica las nubes con pinceladas amplias", dice Flynn, investigador co-principal del proyecto. "Necesitamos determinar con mayor precisión la parte superior y base verdaderas de la nube y distinguir múltiples capas de nubes".
Actualización iniciada
Hasta hace poco, el poder de cómputo limitaba las redes neuronales artificiales, un tipo de modelo de aprendizaje profundo, a un pequeño número de capas computacionales. Ahora, con una mayor potencia de cómputo disponible a través de grupos de supercomputación, los investigadores pueden usar más cómputos, cada uno de ellos basado enúltimo: en una serie de capas. Cuantas más capas tenga una red neuronal artificial, más potente será la red de aprendizaje profundo.
Determinar cuáles son esos cálculos es parte del entrenamiento del modelo. Para comenzar, los investigadores necesitan imágenes de datos LIDAR debidamente etiquetadas, o datos de "verdad fundamental", para el entrenamiento y las pruebas del modelo. Entonces, Flynn pasó muchas largas horasetiquetar a mano imágenes píxel por píxel: nube o no nube. Su ojo puede distinguir los límites de la nube y la nube frente a una capa de aerosol. Tardó 40 horas, el equivalente a una semana laboral completa, para etiquetar alrededor de 100 días de datos LIDARrecogido en el observatorio atmosférico de las Grandes Llanuras del Sur, parte de las instalaciones de usuario de Medición de Radiación Atmosférica del DOE, en Oklahoma.
Dado el tiempo y la mano de obra intensiva del proceso de etiquetado manual, el científico computacional PNNL y el co-investigador principal Erol Cromwell utilizaron métodos de aprendizaje que requerían datos mínimos de verdad básica.
El modelo aprende a través de la retroalimentación propia. Compara su propio rendimiento con los resultados etiquetados a mano y ajusta sus cálculos en consecuencia, explica Cromwell. Recorre estos pasos, mejorando cada vez.
Cromwell presentará los hallazgos del equipo en la Conferencia de Invierno del Instituto de Ingenieros Eléctricos y Electrónicos sobre Aplicaciones de la Visión por Computadora en enero.
Objetivo alcanzado
Con la capacitación, el modelo de aprendizaje profundo supera a los algoritmos actuales. La precisión del modelo es casi el doble y mucho más cercana a lo que un experto humano encontraría, pero en una fracción del tiempo.
Los siguientes pasos son evaluar el rendimiento del modelo en los datos LIDAR recopilados en diferentes ubicaciones y en diferentes estaciones. Las pruebas iniciales sobre los datos del observatorio ARM en Oliktok Point en Alaska son prometedoras.
"Una ventaja del modelo de aprendizaje profundo es el aprendizaje por transferencia", dice Cromwell. "Podemos entrenar aún más el modelo con datos de Oliktok para hacer que su rendimiento sea más sólido".
"Reducir las fuentes de incertidumbre en las predicciones del modelo global es especialmente importante para la comunidad científica científica", dice Flynn. "Con su precisión mejorada, el aprendizaje profundo aumenta nuestra confianza".
Agrega: "Además, ¡nos da más tiempo para estar afuera mirando nubes reales!"
Video: http://www.youtube.com/watch?time_continue=2&v=VOWBSVVXuo0
Fuente de la historia :
Materiales proporcionado por DOE / Laboratorio Nacional del Noroeste del Pacífico . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :