Una nueva plataforma desarrollada por el MIT y los investigadores de la Universidad de Harvard garantiza que los servicios web se adhieran a las preferencias de los usuarios sobre cómo se almacenan y comparten sus datos en la nube.
En el mundo actual de la computación en la nube, los usuarios de aplicaciones móviles y servicios web almacenan datos personales en servidores de centros de datos remotos. Estos datos pueden incluir fotos, perfiles de redes sociales, direcciones de correo electrónico e incluso datos de acondicionamiento físico de dispositivos portátiles. Los servicios a menudo agregan múltipleslos datos de los usuarios a través de los servidores para obtener información sobre, por ejemplo, los patrones de compra de los consumidores para ayudar a recomendar nuevos artículos a usuarios específicos, o pueden compartir datos con los anunciantes. Sin embargo, tradicionalmente, los usuarios no han tenido el poder de restringir cómo se procesan sus datos ycompartido.
En un documento presentado en la conferencia de Diseño e Implementación de Sistemas en Red USENIX de esta semana, los investigadores describen una plataforma, llamada Riverbed, que obliga a los servidores del centro de datos a usar los datos solo de manera que los usuarios aprueben explícitamente.
En Riverbed, el navegador web de un usuario o la aplicación de teléfono inteligente no se comunica directamente con la nube. En cambio, un proxy de Riverbed se ejecuta en el dispositivo de un usuario para mediar la comunicación. Cuando el servicio intenta cargar los datos del usuario en un servicio remoto, las etiquetas de proxylos datos con un conjunto de usos permitidos para sus datos, denominado "política"
Los usuarios pueden seleccionar cualquier cantidad de restricciones predefinidas, como "no almacene mis datos en un almacenamiento persistente" o "mis datos solo se pueden compartir con el servicio externo [nombre de dominio]". El proxy etiqueta todos los datos conla política seleccionada
En el centro de datos, Riverbed asigna los datos cargados a un grupo aislado de componentes de software, y cada grupo procesa solo los datos etiquetados con las mismas políticas. Por ejemplo, un grupo puede contener datos que no se pueden compartir con otros servicios, mientras queotro puede contener datos que no se pueden escribir en el disco. Riverbed monitorea el código del lado del servidor para asegurarse de que se adhiera a las políticas de un usuario. Si no lo hace, Riverbed termina el servicio.
Riverbed tiene como objetivo hacer cumplir las preferencias de datos del usuario, al tiempo que mantiene las ventajas de la computación en la nube, como realizar cómputos a gran escala en servidores subcontratados. "Los usuarios dan muchos datos a las aplicaciones web para servicios, pero pierden el control de cómo se usan los datoso hacia dónde va ", dice el primer autor Frank Wang SM '16, PhD '18, un recién graduado del Departamento de Ingeniería Eléctrica y Ciencias de la Computación y del Laboratorio de Ciencias de la Computación e Inteligencia Artificial." Les damos a los usuarios el control para contar aplicaciones web,'Así es exactamente como puedes usar mis datos' "
En ese hilo, una ventaja adicional para los desarrolladores de aplicaciones, Wang agrega, es establecer más confianza con los usuarios. "Eso es una gran cosa ahora", dice Wang. "Un punto de venta para su aplicación sería decir: 'El objetivo de mi aplicación espara proteger los datos del usuario '"
Junto a Wang en el papel están el estudiante de doctorado Ronny Ko y el profesor asociado de ciencias de la computación James Mickens, ambos de Harvard.
Creando "universos"
En 2016, la Unión Europea aprobó el Reglamento General de Protección de Datos GDPR, que establece que los usuarios deben dar su consentimiento para que se acceda a sus datos, que tienen derecho a solicitar que se eliminen sus datos y que las empresas deben implementar medidas de seguridad apropiadasSin embargo, para los desarrolladores web, estas leyes proporcionan poca orientación técnica para escribir aplicaciones sofisticadas que necesitan aprovechar los datos del usuario.
En el pasado, los informáticos han diseñado sistemas de "control de flujo de información" IFC que permiten a los programadores etiquetar las variables del programa con políticas de datos. Pero con tantas variables y muchas posibles interacciones entre variables, estos sistemas son difíciles de programar., ningún servicio web a gran escala utiliza técnicas IFC.
Principalmente, Riverbed aprovecha el hecho de que el código del lado del servidor de una aplicación puede ejecutarse sobre un programa especial "monitor" - programas que rastrean, regulan y verifican cómo otros programas manipulan datos. El monitor crea una copia separada delcódigo de la aplicación para cada política única asignada a los datos. Cada copia se denomina "universo". El monitor garantiza que los usuarios que comparten la misma política carguen y manipulen sus datos en el mismo universo. Este método permite que el monitor finaliceel código de un universo, si ese código intenta violar la política de datos del universo.
Este proceso incorpora un intérprete personalizado, un programa que compila el lenguaje de programación en un código que es entendido por una computadora. Los intérpretes también se utilizan para ayudar a los programas de tiempo de ejecución a implementar comandos de bajo nivel en un programa original mientras se ejecuta. Los investigadores modificaron un intérprete tradicionalpara extraer políticas definidas de los datos de usuario entrantes y etiquetar ciertas variables con una dirección de política específica. Las etiquetas, por ejemplo, denotarán servicios web incluidos en la lista blanca para compartir datos o restringirán el almacenamiento persistente, lo que significa que los datos no se pueden almacenar cuando el usuario deja de usarservicio web.
"Digamos que quiero que mis datos se agreguen con otros usuarios. Estos datos se colocan en su propio universo con otros datos de usuario con la misma política", dice Wang. "Si un usuario no quiere compartir ningún dato con nadie, ese usuario tiene su propio universo entero. De esta manera, no tiene ninguna polinización cruzada de datos ".
Para los desarrolladores, esto hace que sea mucho más fácil cumplir con GDPR y otras leyes de privacidad, dice Wang, porque los usuarios han dado su consentimiento explícito para el acceso a los datos. "Todos los usuarios en cada universo tienen las mismas políticas, por lo que puede hacer todas sus operacionesy no te preocupes por los datos que se ponen en un algoritmo, porque todos tienen la misma política sobre datos en ese universo ", dice Wang.
copia eficiente
En el peor de los casos, dice Wang, cada usuario de cada servicio tendría un universo separado. En general, esto podría causar una sobrecarga de cómputo significativa y ralentizar el servicio. Pero los investigadores aprovecharon una técnica relativamente nueva, llamada "contenedor-virtualización basada ", que permite que el monitor Riverbed cree más eficientemente múltiples universos del mismo programa. Como resultado, la administración de universos es rápida, incluso si un servicio tiene cientos o miles de universos.
En su artículo, los investigadores evaluaron Riverbed en varias aplicaciones, demostrando que la plataforma mantiene los datos seguros con poca sobrecarga. Los resultados muestran que más de 1,000 universos pueden exprimirse en un solo servidor, con un cálculo adicional que ralentiza el servicio en aproximadamente 10por ciento. Eso es lo suficientemente rápido y eficiente para el uso en el mundo real, dice Wang.
Los investigadores imaginan que las políticas están redactadas por grupos de defensa, como Electronic Frontier Foundation EFF, un grupo internacional sin fines de lucro de derechos digitales. Las políticas nuevas se pueden "incluir" en un servicio administrado por Riverbed en cualquier momento, lo que significa que los desarrolladoresno es necesario reescribir el código
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :