Un nuevo modelo computacional permite a los investigadores basarse en conjuntos de datos normalmente incompatibles, como imágenes satelitales y publicaciones en redes sociales, para responder preguntas sobre lo que está sucediendo en ubicaciones específicas. Los investigadores desarrollaron el modelo para que sirva como una herramienta para identificar violaciones deacuerdos de no proliferación nuclear.
"Nuestro objetivo era desarrollar un marco de trabajo que utiliza información de una variedad de sensores y fuentes de datos para identificar estas posibles violaciones de la no proliferación nuclear", dice Hamid Krim, coautor de un artículo sobre el trabajo, profesor de electricidade ingeniería informática en la Universidad Estatal de Carolina del Norte y director del Laboratorio VISSTA ". Algunos de estos datos pueden ser convencionales, como las lecturas del contador Geiger o los datos multiespectrales de imágenes satelitales. Pero muchas de estas fuentes de datos pueden ser no tradicionales, como las redes socialespublicaciones. Y estas fuentes proporcionan una amplia variedad de datos que normalmente no son compatibles, como el texto incluido en las publicaciones de Twitter y las imágenes publicadas en Flickr.
"Al hacer que estas diferentes entradas sean compatibles entre sí, podemos aceptar una gama más amplia de entradas de datos y usar esos datos de una manera significativa que, en última instancia, puede ayudar a las autoridades a llegar a conclusiones más confiables", dice Krim.
Los investigadores dicen que el modelo se puede utilizar para trabajar con cualquier dato que pueda identificarse como proveniente del área objetivo. Por ejemplo, las imágenes de satélite son claramente identificables, pero también pueden basarse en publicaciones de redes sociales que están etiquetadas activa o pasivamentecomo procedente del área correspondiente.
La pregunta entonces es: ¿cómo se trabaja con datos incompatibles? Para explicar, usaremos un problema indirecto que los investigadores utilizaron en su artículo: identificar una inundación. Eligieron una inundación porque los datos sobre inundaciones no están clasificados, mientras quelos datos sobre la actividad nuclear son.
El primer paso del proceso es utilizar ecuaciones matemáticas para traducir cada tipo de datos a un formato útil. Por ejemplo, las imágenes se pueden ejecutar en modelos para determinar si son imágenes de inundaciones, mientras que las publicaciones de texto se pueden ejecutar en modelospara determinar si incluyen referencias a inundaciones. Una vez que esos flujos de datos se traducen a un formato neutral, es decir, indican inundaciones o no inundaciones, se pueden comparar entre sí para responder preguntas básicas como: ¿los datos se respaldan entre sí??
Pero no es tan simple. Por ejemplo, la gente puede estar tuiteando sobre una inundación que está ocurriendo a cientos de millas de distancia, lo que podría sesgar cualquier cálculo del modelo general. Para abordar esto, los investigadores incorporaron elementos matemáticos que dan cuenta dela complejidad de los datos en los que se basan.
"Abordar la complejidad es particularmente importante en el contexto de la aplicación de la ley de no proliferación", dice Krim. Las entradas de datos relevantes pueden incluir fotos de tipos particulares de tecnología, referencias hechas en conversaciones grabadas en audio, etc. Un modelo como el quedesarrollada debe ser lo suficientemente flexible para tener en cuenta la variabilidad y complejidad de los distintos tipos de datos y las diversas pistas que estamos buscando ".
Los investigadores probaron su modelo utilizando datos de una inundación de 2013 que tuvo lugar en Colorado y pudieron resolver la incompatibilidad de los datos multimodales para estimar con precisión la ubicación de la inundación.
Los próximos pasos del proyecto incluyen la evaluación de instalaciones nucleares en Occidente para identificar características comunes que también pueden ser aplicables a instalaciones en sociedades más aisladas, como Corea del Norte.
"Queremos encontrar formas de transferir información de un entorno conocido a uno oculto", dice Krim. "¿Cómo podemos determinar qué información y qué modelos son transferibles de un lugar a otro, dados datos incompatibles o inconsistentes? ¿Qué es normal?¿Y qué no? No es un problema fácil ".
Fuente de la historia :
Materiales proporcionado por Universidad Estatal de Carolina del Norte . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :