En octubre de 2012, cuando el huracán Sandy azotó la densamente poblada costa este de EE. UU., El estado de Nueva Jersey necesitó información rápidamente. Los planificadores estatales y los gerentes de emergencias recurrieron a los datos de la Oficina del Censo de EE. UU. Sobre las personas que viven y trabajan en el área afectada paraidentifique las comunidades que serían las más afectadas y elabore un plan de recuperación en los meses siguientes.
Un equipo dirigido por la Universidad de Duke, en colaboración con la Oficina del Censo, ha desarrollado nuevos métodos que permiten a las personas aprender lo más posible de los datos del Censo y otras estadísticas de la fuerza laboral del gobierno para cosas como la gestión de desastres, la formulación de políticas y las decisiones de financiación,al tiempo que garantiza que nadie pueda rastrear los datos hasta su hogar o negocio.
Las estadísticas relacionadas con el censo se utilizan para asignar más de 400 mil millones de dólares anuales para ayuda en caso de desastres, centros de capacitación laboral, carreteras y otros servicios. Al mismo tiempo, los estadounidenses confían a la Oficina del Censo y a otras agencias su información personal en el entendimiento de quesus respuestas se mantendrán confidenciales.
El profesor asistente de ciencias de la computación de Duke Ashwin Machanavajjhala y el estudiante graduado Samuel Haney describieron su enfoque el 18 de mayo en la Conferencia SIGMOD / PODS 2017 de la Association for Computing Machinery en Chicago.
Cada vez que completa una encuesta o censo de la Oficina del Censo, sus respuestas se combinan con otras para producir estadísticas resumidas sobre la población local en cada ciudad y área rural: cuántas personas viven y trabajan allí, qué trabajos hacen, cómoviaje al trabajo y otras características.
Estos datos desidentificados se publican en forma agregada y se extraen para patrones y perspectivas que tienen un enorme impacto en su vida, desde si una empresa decide mudarse o expandirse a su área, hasta cuántos policías y bomberos tiene su ciudady dónde construir nuevos hospitales y escuelas.
La Oficina del Censo utiliza una variedad de medidas para garantizar que nadie pueda realizar ingeniería inversa de los datos e identificar a las personas que están dentro de ellos. El desafío, dijo Machanavajjhala, es permitir que terceros analicen los datos para hacer descubrimientos sobre los encuestados comoun grupo, mientras revela lo menos posible sobre cualquier individuo o empresa en él.
Un enfoque para este acto de equilibrio, propuesto por primera vez en 2006, involucra un conjunto de técnicas llamadas "privacidad diferencial".
Con una privacidad diferencial, una persona puede compartir su información personal sin preocuparse de que alguien que analiza los datos agregados pueda averiguar qué información es suya. Nadie puede identificar sus datos, incluso si tienen otra información sobre usted.
Aunque la privacidad diferencial se introdujo hace más de 10 años, ahora se está comenzando a utilizar de manera más amplia para recopilar y compartir datos confidenciales. Apple ha implementado técnicas de privacidad diferencial en iOS 10, el último sistema operativo móvil para iPhoneGoogle ha hecho lo mismo con su navegador web Chrome.
"Hoy en día, la privacidad diferencial se considera un estándar de oro para analizar datos confidenciales", dijo Machanavajjhala.
Las técnicas de privacidad diferencial generalmente funcionan calculando la respuesta verdadera y luego agregando ruido aleatorio a la salida. El objetivo, dijo Machanavajjhala, es garantizar que agregar o eliminar cualquier registro individual o individuo de la base de datos no afecte significativamente el resultado.Pero los críticos de la privacidad diferencial argumentan que lograr ese objetivo requiere introducir demasiado ruido para obtener información precisa.
Ese objetivo se basa en una definición matemática de privacidad que puede ser demasiado estricta para ciertas aplicaciones, dijo Machanavajjhala. "Y en muchos casos, puede no coincidir con lo que exige la ley, o lo que los usuarios creen que se entiende por privacidad""
En cambio, los investigadores probaron un nuevo enfoque. Tomaron las protecciones de privacidad requeridas por la ley y las adaptaron en una definición personalizada de privacidad similar a la privacidad diferencial. Luego desarrollaron algoritmos que inyectaron suficiente ruido para satisfacer esa definición y mantener laley.
Los investigadores realizaron un experimento en el que aplicaron sus algoritmos a datos de empleo del mundo real subyacentes a una herramienta de mapeo en línea producida por la Oficina del Censo de EE. UU., Llamada OnTheMap for Emergency Management.
A raíz del huracán Sandy, la herramienta de mapeo ha proporcionado estimaciones precisas del número de trabajadores afectados por raza, origen étnico, industria u otras características, para determinar qué grupos de personas o tipos de empresas necesitaban más ayuda.
Los usuarios también podrían usar el conjunto de datos para ver dónde se encuentran las empresas y cómo viajan los empleados al trabajo para determinar el impacto del huracán en los viajeros.
Pero en su experimento, los investigadores pudieron demostrar, matemáticamente, que tales respuestas no acercarían a alguien a inferir información sobre una sola persona o empresa que pudiera violar las normas de privacidad, como si un empleado tenía un trabajoen un lugar de trabajo en particular, o precisamente qué fracción de la fuerza laboral de una empresa pertenecía a una determinada raza o tenía un cierto nivel de educación.
Su estudio demostró que es posible divulgar dichos datos al público para su análisis y garantizar su seguridad frente a fugas no deseadas, con una precisión de resultados comparable o incluso mejor que los métodos actuales, que no ofrecen garantías de privacidad similares.
Los algoritmos no son específicos de los datos de la Oficina del Censo de los EE. UU. Las técnicas que desarrollaron también son aplicables a otras estadísticas relacionadas con el empleo producidas por otros países u organismos, como la Oficina de Estadísticas Laborales de los EE. UU. Y la Oficina de Análisis Económico de los EE. UU.
Fuente de la historia :
Materiales proporcionado por Universidad de Duke . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :