BLOG

Les big data ne mentent pas, mais les personnes qui les saisissent pourraient

Miniature de Lori MacVittie
Lori MacVittie
Publié le 16 juillet 2018

Il existe un vieil adage commercial que nous connaissons tous et qui dit ceci : Le client a toujours raison.

Dans cette économie numérique, il s'avère que cet axiome doit changer pour devenir : Les données du client sont toujours exactes.

Laissez-moi illustrer cela avec une petite histoire.

J’ai récemment décidé d’acheter une nouvelle voiture et d’échanger mon ancienne. J’avais l’ancienne depuis environ six ans et je la conduisais environ trois mille kilomètres par an. Je sais que cela semble fou mais c'est vrai. Je l'ai conduit une fois hors de l'État jusqu'à l'Ohio pour voir ma famille. C'est ça. Sinon, il restait dans un rayon de trente miles autour de chez lui. J’aime plaisanter en disant que je suis cette petite vieille dame qui ne conduit sa voiture que pour aller à l’église le dimanche.

Alors imaginez ma surprise lorsque le concessionnaire automobile m’informe que le relevé de mon compteur kilométrique est inexact – erroné de plus de 30 000 km – sur la base d’une seule ligne de données contenue dans le rapport d’historique du véhicule auquel le concessionnaire a accès. Une ligne de données affirmant en outre que ma voiture avait été entretenue dans le Dakota du Nord deux ans auparavant.

Cette divergence n’est pas à prendre à la légère. Les relevés du compteur kilométrique informent sur la valeur d’échange et il est illégal de les falsifier (des amendes et des peines de prison sont possibles). Étant donné que le compteur kilométrique réel affichait un chiffre bien inférieur à celui du rapport, vous pouvez imaginer que le concessionnaire était un peu perturbé. Il a dû prendre la décision indésirable de me faire confiance (qui a insisté sur le fait que je n’avais jamais pris la voiture pour aller dans le Dakota du Nord) ou de faire confiance aux données qui prétendaient que je l’avais fait ?

La question s’est rapidement réduite à « le client a-t-il toujours raison » ou « les données du client ont-elles toujours raison » ?

Il s’avère que ce n’est pas la première fois que quelqu’un est victime de données inexactes dans un rapport d’historique de véhicule. La plupart des données sont encore saisies manuellement, ce qui entraîne des erreurs. Mais le processus de correction de ces erreurs nécessite que la personne qui les a saisies admette avoir fait une erreur. Ce qui signifie qu’ils doivent se rappeler qu’ils ont fait une erreur il y a cinq, dix, voire quinze ans. Si le technicien qui a saisi les données est même là pour admettre l'erreur. 

Finalement, je suis reparti avec ma nouvelle voiture et le concessionnaire a dû se charger de corriger le rapport. Je suis prêt à parier que beaucoup d’entre vous ont une histoire similaire. C’est une situation bien trop courante lorsque vous évoluez dans une économie numérique.

Le facteur humain (erreur)

Alors que nous continuons à accroître notre dépendance aux machines pour résoudre des problèmes, exploiter des données et prendre des décisions, nous devons être conscients que les données dont nous disposons peuvent ne pas être exactes. À un moment donné dans la chaîne de garde de ces données, un être humain est intervenu. Et une vérité axiomatique de l’être humain est que nous faisons des erreurs. Il y a six ans, une seule mauvaise frappe de touche par un technicien de service du Dakota du Nord et soudain, vous vous retrouvez sous des lumières brûlantes et interrogé sur chacun de vos déplacements en voiture.

Nous devons être prudents quant à la confiance que nous accordons aux données que nous utilisons pour prendre des décisions. Ce ne sont pas seulement les erreurs accidentelles qui doivent nous inquiéter, mais aussi les erreurs intentionnelles. Vos données, je vous le garantis, sont sales. 

La conception du DNS est assez étonnante dans sa désignation des sources faisant autorité par rapport aux sources non autorisées. Parce que vous savez que s’il y a une divergence, vous pouvez vous adresser à la seule et véritable source et trouver la vérité. Avec les données clients, ce n’est pas le cas. C’est un signal d’alarme potentiel, car les systèmes que nous utilisons actuellement – et que nous utiliserons dans un avenir proche – ne peuvent pas nécessairement savoir ce qui est exact et ce qui ne l’est pas. Après tout, il n’y a aucun moyen de vérifier sa véracité. Aucune autorité de certification, aucune source faisant autorité désignée comme le DNS. Et dans de nombreux cas, il n’y a aucun moyen de contester les données.

Alors que nous continuons à créer des images numériques de nos clients à partir de fragments de données, nous devons être conscients de l’impact que ces données peuvent avoir, à la fois sur nous, en tant que décideurs commerciaux, et sur nos clients, en tant qu’êtres humains qui doivent vivre avec les conséquences de toute conclusion tirée sur la base de ces données.

En tant que fournisseurs de solutions de sécurité des applications , nous battons souvent le tambour de la protection des données et de l'identité contre l'exfiltration et le vol. Mais nous n’inversons pas souvent l’équation et ne parlons pas de la possibilité bien réelle d’ une corruption des données , que ce soit par accident ou par vengeance.

Nous devrions le faire – avant que cela ne devienne un sujet tendance sur Twitter.

Nous avons assisté à la montée des attaques numériques punitives contre les personnes sous de nombreuses formes. Parce que les répartiteurs du 911 ne peuvent pas obtenir des emplacements et des adresses précis à partir des téléphones portables, les victimes ont subi des incidents mortels . La vengeance pornographique est une réalité et l'usurpation de l'identité de nos amis et de notre famille sur les réseaux sociaux se produit tout le temps. Et cela fait plus de 3 ans que le PDG de Kustodian, Chris Rock, a démontré comment les fraudeurs pouvaient « tuer » artificiellement quelqu'un pour un profit ou une farce en raison des vulnérabilités des processus d'enregistrement des décès de la plupart des pays au DEF CON (CS Monitor). Pour ceux qui y prêtent attention, c'était l'un des piratages utilisés dans le film Hackers de 1995, avec l'annulation de la carte de crédit de quelqu'un et la soumission de fausses annonces personnelles en guise de représailles pour un affront - perçu ou réel. 

Ce n’est qu’une question de temps avant qu’un tel comportement vindicatif ne se propage et ne salisse les données ailleurs. 

Si vous pensez que je souffre d'un chapeau en papier d'aluminium sur la tête, souvenez-vous du rapport RedLock CSI de 2017 qui indiquait que 31 % des bases de données avaient un port ouvert sur Internet. À n'importe qui. Souvenez-vous de la débâcle de MongoDB , où plus de 27 000 bases de données étaient ouvertes à l’accès public. La mauvaise personne avec la bonne base de données laissée ouverte peut causer des ravages sur vos données.

C’est un problème car nous avons atteint le point d’inflexion où les données sont souvent traitées comme une version inviolable et infaillible de la vérité. À cause d’une erreur de saisie, cette « vérité » aurait pu me conduire en prison.

Diligence en matière de données numériques

Alors que nous continuons à accroître la part de nos activités – et de nos vies – stockée dans le monde numérique, nous devrions prendre une profonde inspiration et nous rappeler que les bits et les octets de nos entrepôts de données représentent un aspect des êtres humains réels. La diligence avec laquelle nous traitons ces données reflète notre attitude envers cet être humain réel qu’est notre client. Surtout lorsque nous ne pouvons pas savoir quelles données nous saisissons aujourd’hui pourraient être interprétées d’une manière qui pourrait nuire au client plus tard. Après tout, l’inscription dans l’historique de mon véhicule concernait simplement l’enregistrement d’une vidange d’huile dans le Dakota du Nord. Il n’y avait aucune intention malveillante, mais le résultat aurait pu être désastreux pour moi. 

Qu’il s’agisse d’élaborer des politiques de sécurité visant à prévenir la corruption des données, de contrôler l’accès aux applications et aux bases de données ou d’accorder une plus grande attention à la saisie manuelle des données, nous devons nous rappeler que même si les données ne mentent pas, elles représentent exactement ce que la personne qui les a saisies pourrait avoir.