Noticias de ciencia

de organizaciones de investigación

Nuevas herramientas protegen los datos del censo sobre dónde vive y trabaja

Los algoritmos garantizan la privacidad individual sin comprometer los conocimientos de la comunidad

Fecha :: 23 de mayo de 2017
Fuente :: Universidad de Duke
Resumen :: Los nuevos métodos permiten a las personas aprender lo más posible de los datos del censo para la toma de decisiones políticas y de financiación, al tiempo que garantizan que nadie pueda rastrear los datos hasta su hogar o negocio. Las estadísticas relacionadas con el censo se utilizan para asignar miles de millones de dólaresanualmente para cosas como ayuda en caso de desastres, carreteras y escuelas. Los investigadores han desarrollado algoritmos que garantizan que su información se mantenga privada sin comprometer la investigación sobre su comunidad.
Compartir :

HISTORIA COMPLETA

En octubre de 2012, cuando el huracán Sandy azotó la densamente poblada costa este de EE. UU., El estado de Nueva Jersey necesitó información rápidamente. Los planificadores estatales y los gerentes de emergencias recurrieron a los datos de la Oficina del Censo de EE. UU. Sobre las personas que viven y trabajan en el área afectada paraidentifique las comunidades que serían las más afectadas y elabore un plan de recuperación en los meses siguientes.

anuncio

Un equipo dirigido por la Universidad de Duke, en colaboración con la Oficina del Censo, ha desarrollado nuevos métodos que permiten a las personas aprender lo más posible de los datos del Censo y otras estadísticas de la fuerza laboral del gobierno para cosas como la gestión de desastres, la formulación de políticas y las decisiones de financiación,al tiempo que garantiza que nadie pueda rastrear los datos hasta su hogar o negocio.

Las estadísticas relacionadas con el censo se utilizan para asignar más de 400 mil millones de dólares anuales para ayuda en caso de desastres, centros de capacitación laboral, carreteras y otros servicios. Al mismo tiempo, los estadounidenses confían a la Oficina del Censo y a otras agencias su información personal en el entendimiento de quesus respuestas se mantendrán confidenciales.

El profesor asistente de ciencias de la computación de Duke Ashwin Machanavajjhala y el estudiante graduado Samuel Haney describieron su enfoque el 18 de mayo en la Conferencia SIGMOD / PODS 2017 de la Association for Computing Machinery en Chicago.

Cada vez que completa una encuesta o censo de la Oficina del Censo, sus respuestas se combinan con otras para producir estadísticas resumidas sobre la población local en cada ciudad y área rural: cuántas personas viven y trabajan allí, qué trabajos hacen, cómoviaje al trabajo y otras características.

Estos datos desidentificados se publican en forma agregada y se extraen para patrones y perspectivas que tienen un enorme impacto en su vida, desde si una empresa decide mudarse o expandirse a su área, hasta cuántos policías y bomberos tiene su ciudady dónde construir nuevos hospitales y escuelas.

anuncio

La Oficina del Censo utiliza una variedad de medidas para garantizar que nadie pueda realizar ingeniería inversa de los datos e identificar a las personas que están dentro de ellos. El desafío, dijo Machanavajjhala, es permitir que terceros analicen los datos para hacer descubrimientos sobre los encuestados comoun grupo, mientras revela lo menos posible sobre cualquier individuo o empresa en él.

Un enfoque para este acto de equilibrio, propuesto por primera vez en 2006, involucra un conjunto de técnicas llamadas "privacidad diferencial".

Con una privacidad diferencial, una persona puede compartir su información personal sin preocuparse de que alguien que analiza los datos agregados pueda averiguar qué información es suya. Nadie puede identificar sus datos, incluso si tienen otra información sobre usted.

Aunque la privacidad diferencial se introdujo hace más de 10 años, ahora se está comenzando a utilizar de manera más amplia para recopilar y compartir datos confidenciales. Apple ha implementado técnicas de privacidad diferencial en iOS 10, el último sistema operativo móvil para iPhoneGoogle ha hecho lo mismo con su navegador web Chrome.

"Hoy en día, la privacidad diferencial se considera un estándar de oro para analizar datos confidenciales", dijo Machanavajjhala.

anuncio

Las técnicas de privacidad diferencial generalmente funcionan calculando la respuesta verdadera y luego agregando ruido aleatorio a la salida. El objetivo, dijo Machanavajjhala, es garantizar que agregar o eliminar cualquier registro individual o individuo de la base de datos no afecte significativamente el resultado.Pero los críticos de la privacidad diferencial argumentan que lograr ese objetivo requiere introducir demasiado ruido para obtener información precisa.

Ese objetivo se basa en una definición matemática de privacidad que puede ser demasiado estricta para ciertas aplicaciones, dijo Machanavajjhala. "Y en muchos casos, puede no coincidir con lo que exige la ley, o lo que los usuarios creen que se entiende por privacidad""

En cambio, los investigadores probaron un nuevo enfoque. Tomaron las protecciones de privacidad requeridas por la ley y las adaptaron en una definición personalizada de privacidad similar a la privacidad diferencial. Luego desarrollaron algoritmos que inyectaron suficiente ruido para satisfacer esa definición y mantener laley.

Los investigadores realizaron un experimento en el que aplicaron sus algoritmos a datos de empleo del mundo real subyacentes a una herramienta de mapeo en línea producida por la Oficina del Censo de EE. UU., Llamada OnTheMap for Emergency Management.

A raíz del huracán Sandy, la herramienta de mapeo ha proporcionado estimaciones precisas del número de trabajadores afectados por raza, origen étnico, industria u otras características, para determinar qué grupos de personas o tipos de empresas necesitaban más ayuda.

Los usuarios también podrían usar el conjunto de datos para ver dónde se encuentran las empresas y cómo viajan los empleados al trabajo para determinar el impacto del huracán en los viajeros.

Pero en su experimento, los investigadores pudieron demostrar, matemáticamente, que tales respuestas no acercarían a alguien a inferir información sobre una sola persona o empresa que pudiera violar las normas de privacidad, como si un empleado tenía un trabajoen un lugar de trabajo en particular, o precisamente qué fracción de la fuerza laboral de una empresa pertenecía a una determinada raza o tenía un cierto nivel de educación.

Su estudio demostró que es posible divulgar dichos datos al público para su análisis y garantizar su seguridad frente a fugas no deseadas, con una precisión de resultados comparable o incluso mejor que los métodos actuales, que no ofrecen garantías de privacidad similares.

Los algoritmos no son específicos de los datos de la Oficina del Censo de los EE. UU. Las técnicas que desarrollaron también son aplicables a otras estadísticas relacionadas con el empleo producidas por otros países u organismos, como la Oficina de Estadísticas Laborales de los EE. UU. Y la Oficina de Análisis Económico de los EE. UU.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad de Duke . Nota: El contenido puede ser editado por estilo y longitud.

Referencia del diario :

Samuel Haney, Ashwin Machanavajjhala, John M. Abowd, Matthew Graham, Mark Kutzbach, Lars Vilhuber. Costo de servicios públicos de privacidad formal para publicar estadísticas nacionales de empleadores y empleados . Conferencia ACM SIGMOD / PODS , 2017 DOI: 10.1145 / 3035918.3035940

Cita esta página :

Duke University. "Las nuevas herramientas protegen los datos del censo sobre dónde vive y trabaja: los algoritmos garantizan la privacidad individual sin comprometer los conocimientos de la comunidad". ScienceDaily. ScienceDaily, 23 de mayo de 2017. .

Duke University. 2017, 23 de mayo. Nuevas herramientas protegen los datos del censo sobre dónde vive y trabaja: los algoritmos garantizan la privacidad individual sin comprometer los conocimientos de la comunidad. ScienceDaily . Recuperado el 19 de julio de 2020 de www.science-things.com/releases/2017/05/170523083727.htm

TEMAS RELACIONADOS
- Ciencia y sociedad

anuncio

TÉRMINOS RELACIONADOS

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Nuevas herramientas protegen los datos del censo sobre dónde vive y trabaja

Los algoritmos garantizan la privacidad individual sin comprometer los conocimientos de la comunidad

1

2

3

4

5

1

2

3

4

5

Los niños rara vez transmiten COVID-19, los médicos escriben en nuevos comentarios

Es probable que la población mundial disminuya después de mediados de siglo, pronosticando cambios importantes en la población mundial y el poder económico

¿No podría distanciarse socialmente? Culpe a su memoria de trabajo

Impactos socioeconómicos, ambientales de COVID-19 cuantificado

Las entrevistas de trabajo del sector tecnológico evalúan la ansiedad, no las habilidades de software

'¿Podría mi hijo tener autismo? Diez signos de posibles retrasos relacionados con el autismo en niños de 6 a 12 meses

¿Por qué algunas palabras pueden ser más memorables que otras?

Paso de tiempo distorsionado durante el bloqueo de COVID-19

Los investigadores prevén problemas lingüísticos durante los viajes espaciales

Teletransportación en la actuación musical en vivo

Niños engreídos: los niños de cuatro años con el mismo exceso de confianza que los banqueros que toman riesgos

La física que impulsa las recesiones económicas periódicas

Los nuevos algoritmos de aprendizaje automático ofrecen garantías de seguridad y equidad

La física cuántica proporciona una forma de ocultar la ignorancia

Para las aulas universitarias, ¿son los robots de telepresencia la mejor opción para estar allí?

Nueva herramienta convierte automáticamente las matemáticas en imágenes