La réduction du temps de conservation des données n'aurait pas d'impact négatif sur les résultats des moteurs de recherche,
conclut un récent rapport

Dans le classement des moteurs de recherche, nous avons en tête Google qui détient environ 70 % de part de marché aux États-Unis et plus de 90 % de part de marché dans l’Union européenne. À côté de ce géant, nous avons également d’autres moteurs de recherche comme Yahoo et Bing qui sont aussi appréciés par de nombreux utilisateurs.

Pour offrir aux utilisateurs des informations personnalisées, ces entreprises doivent collecter de grandes quantités de données sur ces derniers afin d’anticiper sur ce qu’ils recherchent. Selon de nombreux avis, plus une entreprise collecte de grandes masses de données pendant longtemps, et plus elle pourrait avoir un avantage significatif par rapport aux entreprises en offrant aux utilisateurs des résultats de recherche plus précis. C’est pourquoi les entreprises préfèrent conserver les données collectées aussi longtemps que possible.

Avec le débat sur la vie privée des utilisateurs qui se fait de plus en pressant dans l’Union européenne et dans d’autres régions du globe, le National Bureau of Economic Research (NBER : « Bureau national de recherche économique »), une organisation privée américaine à but non lucratif consacrée aux sciences économiques et aux recherches empiriques associées, a publié une étude menée par Lesley Chiou, professeur agrégé à Occidental College, et Catherine Tucker, professeure à l’école Sloan School du MIT afin de savoir si la conservation des données des utilisateurs sur une courte durée entacherait la qualité des résultats de recherche délivrés en étant moins exacts par rapport à ceux fournis par les données conservées sur une plus longue période.

Pour ce faire, NBER a analysé les résultats de recherche fournis par les moteurs de recherche Bing et Yahoo alors que les entreprises ont changé leur politique de conservation de données. Ces changements se sont faits à la suite d’une recommandation d’un groupe consultatif sur la protection des données de la Commission européenne. En effet, en avril 2008, le groupe a recommandé aux moteurs de recherche de réduire le temps de conservation de données des journaux. Quelques mois plus tard et plus précisément en décembre 2008, Yahoo fut le premier moteur de recherche à répondre à cet appel en s’engageant à anonymiser les données des utilisateurs après 3 mois de conservation des données de journaux au lieu de 13 mois comme elle le faisait jusque-là. En janvier 2010, Microsoft a suivi la marche en annonçant qu’elle supprimerait les adresses IP associées aux requêtes de recherches dans son moteur Bing après 6 mois au lieu de 18 comme elle le faisait auparavant. Mais en avril 2011, soit environ 3 ans après le changement de sa politique, Yahoo a annoncé qu’elle passait à 18 mois au lieu de 3 mois afin de se maintenir au niveau de la concurrence.

Pour ce qui concerne Google, l’entreprise avait procédé au changement de sa politique une année avant Yahoo. En 2007, Google a annoncé que les données des journaux conservées sur ses serveurs pendant 18 à 24 mois seraient anomysées après cette période. En 2008, l’entreprise a annoncé qu’elle supprimerait les adresses après 9 mois et plus d’anonymisation après 18 mois.

Mais dans leur étude, Chiou et Tucker se sont concentrés sur les résultats de recherches issus des données conservées par Yahoo et Microsoft avant et après les changements opérés dans leur politique de conservation des données de journaux. Après analyse des données, les chercheurs n’ont pas trouvé de preuves empiriques d’un effet négatif sur l’exactitude des résultats de recherche à la suite de la réduction du temps de conservation des données des journaux. Autrement dit, les découvertes faites par les chercheurs « suggèrent que de longues périodes de stockage de données ne confèrent pas d’avantages dans la qualité des recherches, ce qui est un avantage souvent cité dans la conservation des données par les entreprises ».

En se basant sur les conclusions de ce rapport, les entreprises mettant des moteurs de recherche à la disposition des utilisateurs ne devraient plus craindre de conserver les données pendant une courte durée, ce qui pourrait éviter des procès inutiles et rassurer les utilisateurs quant à la protection de leur vie privée. Mais ces entreprises réduiront-elles le temps de conservation des données sur les utilisateurs ?

Source : Rapport des chercheurs (PDF)

Et vous ?

Quel est votre avis sur les conclusions de ce rapport ?

Sont-elles crédibles selon vous ?

Selon vous, pendant combien de temps les moteurs de recherche devraient-ils conserver les données des utilisateurs ?

Voir aussi

Droit à l’oubli : Google dépose un recours auprès du Conseil d’État pour contester la décision de déréférencement au niveau mondial
Vie privée : le patron du FBI suggère un accord international entre les gouvernements pour un accès légal aux données chiffrées