De la banque aux communications, nos vies modernes tournent quotidiennement autour des données, tout en soulevant des inquiétudes quant à la confidentialité. Une nouvelle étude de l’École polytechnique fédérale de Lausanne, publiée dans Nature Computational Science, confirme que plusieurs promesses portant sur des mécanismes de protection de cette confidentialité ne seront jamais tenues et qu’il faut accepter ces limites inhérentes.
L’innovation tirée par les données, comme la médecine personnalisée, de meilleurs services publics ou, par exemple, une production industrielle plus efficace et moins polluante, promet des avantages significatifs pour les citoyens et notre planète, et un large accès aux données est considéré comme essentiel pour la nutrition de ce futur. Cependant, les méthodes agressives de collecte et d’analyse des informations conduisent à des signaux d’alarme liés aux valeurs publiques et aux droits fondamentaux.
Cela a fait de l’élargissement de l’accès aux données, tout en protégeant la confidentialité des informations les plus sensibles, l’un des plus grands défis dans ce domaine. Selon les chercheurs responsables de la nouvelle étude, croire que toute utilisation des données est possible dans le plein respect du droit à la vie privée, c’est comme croire aux contes de fées.
Selon la co-auteure de l’étude, la professeure adjointe Carmela Troncoso, il existe deux approches traditionnelles de la vie privée. “Il existe un moyen d’utiliser la cryptographie, c’est-à-dire de traiter des données dans un secteur décrypté et d’obtenir ainsi un résultat. Mais pour y parvenir, il est nécessaire de concevoir des algorithmes spécialement ciblés, et non d’effectuer des opérations informatiques générales. »
Le problème avec cette méthode, écrivent les auteurs de l’étude, est qu’elle n’atteint pas l’objectif visé de partager des données individuelles de haute qualité d’une manière qui protège la confidentialité, mais permet également aux analystes de récupérer une base de données complète de manière flexible.
La deuxième solution qui est généralement proposée consiste à anonymiser les données et donc en supprimant les noms, lieux et autres codes postaux, mais Mme Tronkoso précise que dans ce cas, le problème réside généralement dans les données elles-mêmes.
“Il y a un certain exemple de Netflix lorsque la société a décidé de publier des bases de données et d’organiser un concours public pour créer de meilleurs algorithmes proposant des recommandations. La société a supprimé les noms des clients, mais lorsque les chercheurs ont comparé les classements de films avec d’autres plateformes où les gens évaluent les longs métrages, ils ont pu restaurer l’identité de certaines personnes. »
Nouvelle méthode, même problème
Plus récemment, les données synthétiques ont trouvé une place comme nouvelle méthode d’anonymisation des données, mais les recherches suggèrent que par rapport aux promesses des partisans de cette façon de faire, elles sont soumises aux mêmes limites que les données anonymisées. célèbre. “Dans notre travail, nous soulignons que les chercheurs et les praticiens doivent accepter les lacunes inhérentes à une grande flexibilité dans l’utilisation des données et à de fortes garanties de confidentialité”, a déclaré Theresa Stadler, co-auteur de l’étude.
“Cela peut signifier que la portée des applications basées sur les données sera réduite et que les détenteurs de données devront prendre des décisions explicites sur l’approche la plus appropriée pour le partage de données en fonction de leurs besoins”, a ajouté Mme Stadler.
Un autre message important contenu dans l’étude est l’idée d’une commercialisation plus lente et mieux contrôlée de la technologie. Le démarrage ultra-rapide est la norme de nos jours, avec l’idée de “résoudre les problèmes plus tard” en cas de problème. Tout cela est particulièrement dangereux, dit Mme Tronkoso.
“Nous devons commencer à accepter qu’il y a des limites. Voulons-nous vraiment continuer cette ruée vers les données où il n’y a aucune confidentialité et un impact significatif sur le processus démocratique ? Cela ressemble au jour de la marmotte, nous en parlons depuis 20 ans et maintenant cela se produit avec l’apprentissage automatique. Nous utilisons des algorithmes, ils sont biaisés et nous espérons qu’ils seront corrigés plus tard. Mais que se passe-t-il s’ils ne peuvent pas être réparés ? »
Cependant, une fonctionnalité limitée et une confidentialité améliorée ne sont pas le modèle commercial des géants de la technologie, et Mme Tronkoso exhorte le public à réfléchir davantage à la manière de résoudre ce problème.
“Une grande partie de ce que font Google et Apple consiste à” blanchir “leurs pratiques néfastes et à fermer le marché. Par exemple, Apple n’autorise pas les applications à collecter des données, mais collecte les données elles-mêmes d’une manière “respectueuse de la vie privée” avant de les vendre. Ce que nous disons, c’est qu’il n’y a pas de méthode pour protéger la confidentialité », a ajouté le chercheur.
Add Comment