Investigación de Mozilla: los historiales de navegación son lo suficientemente únicos como para identificar a los usuarios de manera confiable



Imagen: ZDNet Un estudio publicado recientemente realizado por tres empleados de Mozilla ha analizado la privacidad proporcionada por los historiales de navegación. Sus hallazgos muestran que la mayoría de los usuarios tienen hábitos de navegación web únicos que permiten a los anunciantes en línea crear perfiles precisos. Estos perfiles se pueden usar para rastrear y volver a identificar a los usuarios en diferentes conjuntos de datos de usuarios que contienen incluso pequeñas muestras del historial de navegación de un usuario.
Efectivamente, el estudio viene a disipar el mito en línea de que el historial de navegación, incluso el anónimo, no es útil para los anunciantes en línea. En realidad, el estudio muestra que incluso una pequeña lista de 50 a 150 de los dominios favoritos y más visitados del usuario puede permitir a los anunciantes crear un perfil de seguimiento único. El artículo de investigación de Mozilla se llama "Replicación: por qué todavía no podemos navegar en paz: sobre la singularidad y la reidentificación de los historiales de navegación web" [PDF].
El documento se presentó a principios de este mes en la conferencia de seguridad de USENIX y es un seguimiento de otro estudio académico publicado en 2012 [PDF]. Este primer estudio fue uno de los proyectos más grandes que analizaba la privacidad del usuario en ese momento, y una empresa enorme para el equipo de investigación, que participó en la recopilación de datos del historial del navegador de más de 380.000 usuarios de Internet. Entre enero de 2009 y mayo de 2011, los investigadores pidieron a los usuarios que accedan a un sitio de prueba en línea donde utilizaron un código CSS inteligente para determinar qué sitios web de una lista predefinida de 6.000 dominios habían visitado los usuarios.
El estudio de 2012 descubrió que el 97% de los usuarios que accedieron a este sitio de prueba tenían una lista única de sitios en su historial de navegación, lo que hace que el historial del navegador sea un vector sólido de huellas dactilares del usuario. Además, cuando se les pidió a los usuarios que volvieran a acceder al sitio de prueba, los investigadores dijeron que podían volver a identificar a los usuarios en función de sus perfiles de historial de navegación desde la primera visita. Las tasas de precisión fueron del 38% cuando los investigadores observaron conjuntos de datos del historial de navegación de 50 de los dominios más populares del usuario, y del 70% cuando analizaron conjuntos de datos con 500 dominios.
Pero el año pasado, los investigadores de Mozilla querían reevaluar si el historial de navegación seguía siendo un vector de huellas dactilares válido y si el estudio de 2012 todavía es cierto. El nuevo experimento se puso en marcha entre el 16 de julio y el 13 de agosto de 2019, cuando Mozilla instó a los usuarios de Firefox a participar en este experimento. Los investigadores de Mozilla dijeron que más de 52.000 usuarios aceptaron participar y proporcionaron datos de navegación anónimos.
Sin embargo, esta vez, dado que los datos se recopilaron desde el propio Firefox y no a través de una página web que realizaba una prueba CSS prolongada, los datos eran mucho más precisos y fiables. Además, los datos que recopilaron los investigadores de Mozilla también son del mismo tipo de datos que las empresas de análisis en línea de hoy en día también recopilan sobre los usuarios, ya sea a través de asociaciones de datos, aplicaciones móviles, anuncios en línea u otros mecanismos. Al igual que antes, la recopilación de datos se llevó a cabo en dos etapas, en dos semanas, y los usuarios compartieron el historial de navegación en la primera semana y luego nuevamente en la segunda, para que los investigadores de Mozilla pudieran ver si podían volver a identificar a los usuarios.
En total, el equipo de Mozilla dijo que recopiló datos sobre 35 millones de visitas al sitio web en 660.000 dominios únicos. Y este acceso a datos de mejor calidad se reflejó inmediatamente en los hallazgos del estudio. Mozilla dijo que el 99% de los perfiles de navegación que recopilaron para el estudio eran únicos para cada usuario.
Esta singularidad permitió a los investigadores de Mozilla volver a identificar fácilmente a los usuarios durante la segunda semana del estudio. La precisión también fue superior al estudio de 2012, y Mozilla afirmó que tenía una tasa de reidentificabilidad de casi el 50% para conjuntos de datos que contienen 50 dominios del historial de navegación de un usuario. Esta tasa de reidentificabilidad aumentó a más del 80% cuando los investigadores de Mozilla expandieron el conjunto de datos del historial de navegación a 150 dominios.
Este último hallazgo sugiere que las empresas de análisis y los anunciantes en línea no necesitan grandes listas de datos del historial de navegación para rastrear a los usuarios, y que las peculiaridades de navegación de cada usuario y sus sitios favoritos eventualmente los delatan, incluso cuando los datos son anónimos, y las URL truncado para eliminar los nombres de usuario y dejar solo los dominios principales. Un video de la presentación del equipo de Mozilla está disponible aquí. pags VER GALERÍA COMPLETA.

Yorumlar

Bu blogdaki popüler yayınlar

Una lista de conferencias de seguridad canceladas o pospuestas debido a preocupaciones de coronavirus

Las tasas de parches OEM de Android han mejorado, con Nokia y Google liderando la carga