Votre historique de navigation peut vous identifier de manière précise,
d’après une étude menée par les chercheurs de Mozilla
Les chercheurs de Mozilla ont confirmé que les historiques de navigation peuvent être utilisés pour compiler des profils de navigation uniques et que ceux-ci peuvent être utilisés pour tracer les utilisateurs. Il existe également de nombreux acteurs assez omniprésents pour rassembler des historiques web suffisants pour exploiter l'historique de navigation comme identifiant.
Ce n'est pas la première fois que des chercheurs démontrent que les profils de navigation sont suffisamment distinctifs et stables pour être utilisés comme identifiants. Sarah Bird, Ilana Segall et Martin Lopatka ont été poussés à reprendre les résultats présentés dans un article de 2012 de Lukasz Olejnik, Claude Castelluccia et Artur Janc, en utilisant des données plus fines, et ils ont étendu ce travail pour détailler le risque pour la vie privée posé par l'agrégation des historiques de navigation.
Les données ont été recueillies auprès d'environ 52 000 utilisateurs du navigateur Firefox qui ont choisi de partager les données à des fins de recherche et de développement de produits au-delà de ce qui est prévu dans les politiques de collecte de données par défaut de Mozilla. Les chercheurs de Mozilla ont recueilli des données pendant 7 jours, puis ont fait une pause de 7 jours, avant de reprendre pendant 7 jours supplémentaires. Après avoir analysé les données collectées, ils ont identifié 48 919 profils de navigation distincts, dont 99 % sont uniques. Le document original, celui de 2012, a observé un ensemble d'environ 400 000 profils d'historique de navigation, dont 94 % étaient uniques.
« L'unicité élevée tient même lorsque les historiques sont tronqués à seulement 100 sites de premier plan. Nous constatons alors que pour les utilisateurs qui ont visité 50 domaines distincts ou plus au cours de la période de collecte de données de deux semaines, environ 50 % peuvent être réidentifiés en utilisant les 10 000 premiers sites. La possibilité de réidentification est passée à plus de 80 % pour les utilisateurs qui ont visité 150 domaines distincts ou plus », notent les chercheurs de Mozilla.
Ils ont également confirmé que les profils de l'historique de navigation sont stables dans le temps, une deuxième condition préalable pour que ces profils soient liés de manière répétée à des utilisateurs spécifiques et utilisés pour le suivi en ligne. « Nos taux de réidentification dans un ensemble de 1 766 sites étaient inférieurs à 10 % pour 100 sites malgré un profil unique à plus de 90 % dans les différents ensembles de données, mais ils ont augmenté à environ 80 % lorsque nous considérons 10 000 sites », ont-ils ajouté.
Enfin, certaines entreprises comme Alphabet (Google) et Facebook sont en mesure d'observer le web dans une mesure encore plus grande que lors de la recherche pour le document de 2012, ce qui peut leur permettre d'acquérir une profonde visibilité de l'activité de navigation et d'utiliser cette visibilité pour un suivi en ligne efficace, même si les utilisateurs utilisent des appareils différents pour naviguer sur Internet.
D'autres recherches récentes ont montré que l'anonymisation des modèles de navigation ou profil par la généralisation ne protège pas suffisamment l'anonymat des utilisateurs.
Une réglementation est nécessaire
Lukasz Olejnik, chercheur sur la protection de la vie privée et l'un des auteurs de l'article de 2012, a noté que les résultats de cette nouvelle recherche sont une confirmation bienvenue que les historiques de navigation sur le web sont des données personnelles qui peuvent révéler des informations sur l'utilisateur ou être utilisées pour suivre les utilisateurs.
« D'une certaine manière, l'historique de navigation ressemble à des données de type biométrique en raison de leur caractère unique et de leur stabilité », a-t-il commenté. Il a également souligné que, puisque ces données permettent de distinguer des individus parmi beaucoup d'autres, elles relèvent automatiquement du règlement général sur la protection des données (RGDP).
« Les historiques de navigation sur le web sont des données privées et, dans certains contextes, ce sont des données personnelles. C'est ce qu'indique l'état de l'art de la recherche. La technologie devrait suivre. Les réglementations et les normes en matière de traitement des données devraient également suivre. Ainsi que l'application de la loi », a-t-il conclu.
Sources : Rapport de recherche (1, 2)
Et vous ?
Quelle est votre opinion sur le sujet ?
Voir aussi :
Le Sénat US adopte une mesure qui permet au FBI de collecter sans mandat l'historique de navigation des Américains, dans une mise à jour du Patriot Act de 2001
Une extension Firefox prise à siphonner l'historique de navigation de ses 220 000 utilisateurs, après avoir bénéficié d'un coup de cœur de Mozilla
Mozilla supprime 23 extensions Firefox qui ont siphonné les données de plus de 500 000 utilisateurs, de façon malicieuse
« Clear History » qui permettra d'effacer son historique de navigation sur Facebook est pour 2019, la firme dit qu'il nuira à ses activités de pub
Partager