Le monde nouveau du Big data
‘Nous entrons dans un monde où l’information numérique sera omniprésente, et cela ouvre « une perspective sur la réalité que nous n’avons jamais eu avant ».
En mai dernier, j’ai publié un article Big data et émergence de « Real Humans » . Je reprends et prolonge mes réflexions sur ce thème clé, ceci à partir de la lecture du livre de Viktor Mayer-Schönberger et Kenneth Cukie, paru en 2013 et consacré à ce sujet, « Big data : A Revolution That Will Transform How We Live, Work, and Think ».
Le tout numérique
Quelques rappels tout d’abord sur la dimension de ce qui se produit depuis une dizaine d’années, c’est-à-dire très peu de temps :
– « En 2007, seulement 7 % des données sont analogiques (documents, livres, photographies imprimées, etc.). Le reste était numérique (…). Aussi récemment qu’en 2000, seulement un quart de l’information archivée dans le monde était numérique. Les autres trois-quarts étaient sur support papier, film, disque vinyle, bande magnétique… (…) En 2013, la quantité d’information stockée dans le monde est estimée autour de 1200 exaoctets, et que moins de 2 % n’est pas numérique ».
– « La quantité d’information archivée croît quatre fois plus vite que l’économie mondiale, pendant que la puissance de traitement informatique croît neuf fois plus vite ».
– « Ceci s’étend maintenant aux données, qui deviennent un actif des entreprises, une contribution économique vitale, et le fondement de nouveaux modèles de business. C’est le pétrole de l’économie de l’information. Bien que les données ne soient que rarement enregistrées dans les bilans, ce n’est probablement qu’une question de temps ».
Dans leur livre, ils parlent de « datafication », c’est-à-dire du processus actuel qui tend à tout numériser, non plus seulement les écrits, mais les localisations, les actes individuels, voire l’empreinte de notre corps sur le siège d’une voiture : « Koshimizu et son équipe convertissent le dos en données en mesurant avec des capteurs la pression en 360 différents points d’un siège de voiture, et en indexant chaque point sur une échelle de zéro à 256. Le résultat est un code digital unique pour chaque individu. Dans l’essai, le système peut distinguer au sein d’une poignée de personnes avec 98 % de fiabilité. La recherche n’est pas stupide. La technologie est développée comme système antivol pour les voitures. Un véhicule ainsi équipé reconnaîtrait quand un conducteur illicite serait au volant et demanderait un mot de passe pour continuer la conduite ou peut-être couper le moteur ».
Ainsi, nous entrons dans un monde où l’information numérique sera omniprésente, et cela ouvre « une perspective sur la réalité que nous n’avons jamais eue avant. »
Tout change
L’émergence du Big data n’est pas seulement une affaire de quantité. Elle se traduit par des transformations multiples. Dans leur livre, Viktor Mayer-Schönberger et Kenneth Cukie en identifient trois :
– La possibilité d’analyser des quantités de données croissantes : non seulement nous pouvons stocker sans cesse davantage, mais nous pouvons les traiter massivement.
– L’acceptation de l’approximation et du désordre, car l’abondance des données rend moins nécessaire l’exactitude : « Quand la donnée était rare, chaque donnée élémentaire était critique, aussi il fallait faire attention pour ne pas créer de biais dans l’analyse. Aujourd’hui nous ne vivons plus dans une situation de manque d’informations. Ayant affaire à des ensembles de données de plus en plus complets, qui captent non plus seulement une petite tranche d’un phénomène à portée de main, mais beaucoup plus, voire tout, nous n’avons plus à nous soucier autant que des données élémentaires biaisent l’analyse globale ».
– La recherche des corrélations plutôt des causalités : « Dans le monde du Small Data, montrer que des intuitions de causalité sont fausses prend du temps. C’est en train de changer. Dans le futur, des corrélations issues du Big data seront utilisées pour réfuter des intuitions de causalité, en montrant que souvent il n’y a rien qu’une relation statistique entre l’effet et la cause supposée » (1).
Autre différence majeure avec le monde des choses matérielles, le fait de se servir des données ne les épuise pas : « La valeur des données ne diminue pas quand on s’en sert. Elles peuvent être traitées encore et encore. L’information est ce que les économistes appellent un bien « sans rivalité » : l’utilisation par une personne n’empêche un autre de s’en servir ». Au contraire, plus on s’en sert, plus de nouvelles idées naissent et de nouvelles valorisations aussi. Mais ceci n’est pas sans poser des problèmes…
Alerte vie privée !
Ce monde du Big data pose aussi de nouvelles questions. D’abord une « simple » : comment protéger la vie privée quand tout est progressivement numérisé, quand tout est stocké, et que tout peut être traité ? Peut-on simplement refuser de voir ses données archivées ? Certes, oui, mais quand il deviendra de plus en plus courant de tout voir être archivé, le refuser deviendra suspect… À défaut de refuser, je peux demander à ce que mes données soient anonymes. Mais si elles sont très nombreuses et précises, ce sera facile par des recoupements, de savoir à qui elles appartiennent. Un peu comme dans l’histoire où l’on ne donne pas le nom de la personne, mais on la désigne en disant que c’est elle qui se tient appuyée contre la porte du fond…
Mais il y a plus : puisqu’il est impossible de savoir à quoi telle information pourra être utilisée dans le futur, comment pourrais-je donner aujourd’hui une autorisation pour des usages à venir inconnus ? Ceci en revient à de fait paralyser toutes les protections de la vie privée : « Comment des entreprises pourraient-elles prévenir au nom d’un objectif qui n’existe pas encore ? Comment des individus pourraient-ils être donner une autorisation pour ce qui est inconnu ? Aussi en absence d’autorisation, toute analyse Big data portant sur des données personnelles pourrait impliquer un retour vers chaque individu, pour lui demander la permission pour chaque réutilisation (…). À l’ère du Big data, les trois stratégies essentielles longtemps utilisées pour garantir la préservation de la vie privée – notification et autorisation individuelle, possibilité de retrait, et anonymisation – ont perdu beaucoup de leur efficacité ». Le monde du Big data suppose l’invention de nouvelles règles et d’un nouveau droit. Il va devenir de plus en plus urgent de les inventer…
Anticiper ou subir ?
Les problèmes liés à la vie privée ne vont pas porter que sur les droits d’utilisation de nos données, ainsi que de leur utilisation. Ils vont aussi être liés à une autre menace : si une analyse de mes données montre que je vais très probablement commettre un acte délictueux, faut-il ou non agir ? C’était le thème central du film Minority Report de Steven Spielberg où l’on arrête quelqu’un, non pas parce qu’il a commis un délit, mais parce qu’il allait le commettre. Ce qui n’était que de la science-fiction n’en sera bientôt plus : nous n’aurons pas besoin comme dans le film de femmes mutantes capables de prévoir le futur, nous aurons des analyses de données qui nous le permettront. […]
lire l’intégralité de l’article
Par Robert Branche, Vice-Président de Nous Citoyens
Source : lesechos.fr