La navegación en la web se vuelve más fácil cada día, ya que el monitoreo corporativo de nuestros correos electrónicos y hábitos de navegación ajusta los algoritmos que nos sirven anuncios y recomendaciones personalizadas. Pero la conveniencia tiene un costo. En las manos equivocadas, nuestra información personal puede ser utilizadaen contra de nosotros, para discriminar el seguro de vivienda y salud, y el cobro excesivo de bienes y servicios, entre otros riesgos.
"La Web es como el Salvaje Oeste", dice Roxana Geambasu, un científico informático en Columbia Engineering y el Data Science Institute. "No hay supervisión de cómo se recopilan, intercambian y utilizan nuestros datos".
Con los científicos informáticos, Augustin Chaintreau y Daniel Hsu, y los estudiantes graduados Mathias Lecuyer, Riley Spahn y Yannis Spiliopoulos, Geambasu ha diseñado una herramienta de segunda generación para brindar transparencia a la Web. Se llama Sunlight y se basa en su predecesor, XRay,los investigadores presentarán la nueva herramienta y un estudio relacionado el 14 de octubre en Denver, en la Asociación de Maquinaria de Computación de Estados Unidos, con los textos que se muestran a los usuarios de Gmail con texto en sus correos electrónicos y recomendaciones en Amazon y YouTube con sus patrones de compra y visualización.conferencia anual sobre seguridad.
La luz del sol funciona a una escala más amplia que XRay, y hace coincidir con mayor precisión los anuncios personalizados y las recomendaciones de los usuarios con fragmentos de información suministrada por los usuarios, dicen los investigadores. Los investigadores anteriores han rastreado anuncios específicos, recomendaciones de productos y precios a entradas específicas como la ubicación,términos de búsqueda y género, uno por uno. Una herramienta, AdFisher, recibió atención a principios de este año después de mostrar que los usuarios falsos de la Web que pensaban ser buscadores de empleo eran más propensos que los solicitantes de empleo a que se les mostraran anuncios de empleos ejecutivos cuando más tarde visitaban una noticiasitio.
La luz del sol, por el contrario, es la primera en analizar numerosas entradas y salidas juntas para formar hipótesis que se prueban en un conjunto de datos separado del original. Al final, cada hipótesis, y sus entradas y salidas vinculadas, se clasifican paraconfianza estadística. "Estamos tratando de lograr un equilibrio entre la confianza estadística y la escala para que podamos comenzar a ver lo que sucede en toda la Web", dijo Hsu.
Los investigadores establecieron 119 cuentas de Gmail, y el otoño pasado más de un mes enviaron 300 mensajes con palabras sensibles en la línea de asunto y el cuerpo del correo electrónico. Alrededor del 15 por ciento de los anuncios que siguieron parecían estar dirigidos; algunos parecían contradecir los de GoogleLos investigadores dijeron que la política de no orientar anuncios basados en "raza, religión, orientación sexual, salud o categorías financieras sensibles", dijeron los investigadores. Por ejemplo, las palabras escritas en el asunto de un mensaje: "desempleados", "deprimidos" y "Judío ", se descubrió que activaban anuncios de" financiamiento automático fácil ", un servicio para encontrar" cónyuges engañosos "y una búsqueda de" antepasados gratuitos ", respectivamente.
Los investigadores también establecieron perfiles de navegación falsos y navegaron por los 40 sitios más populares en la Web para ver qué anuncios aparecieron. Descubrieron que solo el 5 por ciento de los anuncios parecían estar dirigidos, pero algunos parecían violar la prohibición de publicidad de Google sobreSegún los investigadores, los productos y servicios que facilitan el uso de drogas, por ejemplo, una visita a "hightime.com" desencadenó un anuncio de bongs en AquaLab Technologies. Curiosamente, los algoritmos también parecían mejorar las tendencias políticas de los sitios de noticias populares., lanzando vínculos israelíes a los lectores de Fox News, y un candidato anti-Tea Party a los lectores de Huffington Post.
Los investigadores advierten contra inferir que Google y otras compañías están utilizando intencionalmente información confidencial para orientar anuncios y recomendaciones. El flujo de datos personales en la Web se ha vuelto tan complejo, dijeron, que las propias compañías pueden no saber cómo se está llevando a cabo la segmentación.
El 10 de noviembre de 2014, Google cerró abruptamente los anuncios de Gmail, el último día en que Geambasu y sus colegas pudieron recopilar datos. Los anuncios parecen haber sido reemplazados por los llamados anuncios orgánicos que se muestran en la pestaña de promociones.La luz solar también tiene la capacidad de detectar la orientación en esos anuncios, dijo Geambasu, pero los investigadores aún no lo han intentado.
La audiencia prevista de Sunlight es reguladores, vigilantes de consumo y periodistas. La herramienta les permite explorar cómo se usa la información personal y decidir dónde se necesita una investigación más cercana, dijeron. "En muchos sentidos, la Web ha sido una fuerza para el bien, pero allínecesita ser responsable si va a seguir así ", dijo Chaintreau.
"La luz del sol es distintiva porque puede examinar múltiples tipos de entradas simultáneamente por ejemplo, género, edad, actividad de navegación para desarrollar hipótesis sobre cuáles de estas entradas impactan ciertas salidas por ejemplo, anuncios en Gmail", dijo Anupam Datta,un investigador de Carnegie Mellon que dirigió el desarrollo de la herramienta AdFisher y no participó en el estudio actual: "Esta herramienta nos acerca al objetivo crítico de descubrir los efectos del uso de datos personales a escala".
Una copia del estudio "Luz del sol: detección de objetivos específicos a escala con confianza estadística" está disponible en línea.
Fuente de la historia :
Materiales proporcionados por Universidad de Columbia . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :