BLOG

Big Data lügt nicht, aber die Leute, die sie nutzen, könnten es tun

Lori MacVittie Miniaturbild
Lori MacVittie
Veröffentlicht am 16. Juli 2018

Es gibt ein altes, uns allen bekanntes Geschäftsaxiom, das wie folgt lautet: Der Kunde hat immer Recht.

In dieser digitalen Wirtschaft muss sich dieses Axiom offenbar ändern und lauten: Die Daten des Kunden sind immer richtig.

Lassen Sie mich das anhand einer kleinen Geschichte veranschaulichen.

Ich habe vor Kurzem beschlossen, ein neues Auto zu kaufen und mein altes einzutauschen. Den alten hatte ich etwa sechs Jahre lang und bin damit jährlich etwa 5.000 Kilometer gefahren. Ich weiß, das klingt verrückt, aber es ist wahr. Ich bin damit einmal aus dem Staat nach Ohio gefahren, um meine Familie zu besuchen. Das ist es. Ansonsten blieb es in einem Umkreis von 58 Kilometern um sein Zuhause. Ich mache gerne Witze darüber, dass ich die kleine alte Dame bin, die sonntags nur mit dem Auto zur Kirche fährt.

Stellen Sie sich also meine Überraschung vor, als mir der Autohändler mitteilte, dass mein Kilometerstand nicht korrekt sei – er liege bei über 30.000 Fuß – und dies auf einer einzigen Datenzeile im Fahrzeugverlaufsbericht, auf den der Händler zugegriffen hatte. Eine Datenzeile, die außerdem behauptete, mein Auto sei vor zwei Jahren in North Dakota gewartet worden.

Diese Diskrepanz darf nicht auf die leichte Schulter genommen werden. Der Kilometerstand gibt Aufschluss über den Eintauschwert und es ist illegal, ihn zu manipulieren (es drohen Geld- und Gefängnisstrafen). Angesichts der Tatsache, dass der tatsächliche Kilometerzähler einen viel niedrigeren Wert anzeigte als der im Bericht, können Sie sich vorstellen, dass der Händler etwas verunsichert war. Er stand vor der unangenehmen Entscheidung, mir zu vertrauen – wer behauptete doch, ich hätte das Auto nie nach North Dakota gebracht – oder den Daten, die das bestätigten?

Die Frage ließ sich schnell auf „Hat der Kunde immer Recht?“ oder „Haben die Daten des Kunden immer Recht?“ reduzieren.

Wie sich herausstellt, ist dies nicht das erste Mal, dass jemand mit ungenauen Daten in einem Fahrzeugverlaufsbericht zu kämpfen hat. Die meisten Daten werden immer noch manuell eingegeben, daher passieren Fehler. Um diese Fehler zu korrigieren, muss die Person, die sie eingegeben hat, allerdings zugeben, dass sie einen Fehler gemacht hat. Das bedeutet, dass sie sich daran erinnern müssen, dass sie vor fünf, zehn oder sogar fünfzehn Jahren einen Fehler gemacht haben. Wenn der Techniker, der die Daten eingegeben hat, überhaupt noch da ist und den Fehler zugibt. 

Am Ende bin ich mit meinem neuen Auto weggefahren und die Korrektur des Gutachtens blieb dem Händler überlassen. Ich wette, viele von Ihnen haben eine ähnliche Geschichte. Dies kommt nur allzu häufig vor, wenn man in einer digitalen Wirtschaft tätig ist.

Der menschliche (Fehler-)Faktor

Da wir uns bei der Problemlösung, Datenauswertung und Entscheidungsfindung immer stärker auf Maschinen verlassen, müssen wir uns darüber im Klaren sein, dass die uns zur Verfügung stehenden Daten möglicherweise nicht genau sind. An irgendeinem Punkt im Verlauf der Aufbewahrung dieser Daten war ein Mensch involviert. Und eine axiomatische Wahrheit des Menschseins ist, dass wir Fehler machen. Ein einziger falscher Tastendruck eines Servicetechnikers in North Dakota vor sechs Jahren und plötzlich stehen Sie unter heißem Licht und werden zu jeder Autofahrt ausgefragt, die Sie jemals unternommen haben.

Wir müssen vorsichtig sein, wie viel Vertrauen wir in die Daten setzen, die wir für unsere Entscheidungen verwenden. Wir müssen uns nicht nur über versehentliche Fehler Sorgen machen, sondern auch über vorsätzliche Fehler. Ihre Daten sind, das garantiere ich, schmutzig. 

Das Design des DNS ist hinsichtlich der Unterscheidung zwischen autoritativen und nicht autoritativen Quellen ziemlich erstaunlich. Denn Sie wissen, dass Sie sich im Falle einer Unstimmigkeit an die einzig wahre Quelle wenden und die Wahrheit herausfinden können. Bei Kundendaten gibt es so etwas nicht. Dies ist ein potenzielles Warnsignal, da die Systeme, die wir jetzt verwenden – und in naher Zukunft verwenden werden – nicht unbedingt wissen können, was richtig ist und was nicht. Schließlich gibt es keinen Ort, an dem die Richtigkeit überprüft werden könnte. Keine Zertifizierungsstelle, keine ausgewiesenen autoritativen Quellen wie DNS. Und in vielen Fällen gibt es keine Möglichkeit, die Daten anzufechten.

Während wir weiterhin aus einzelnen Datenstücken digitale Bilder unserer Kunden erstellen, müssen wir uns darüber im Klaren sein, welche Auswirkungen diese Daten haben können – sowohl auf uns als Entscheidungsträger im Unternehmen als auch auf die Kunden als Menschen, die mit den Konsequenzen der Schlussfolgerungen leben müssen, die auf Grundlage dieser Daten gezogen werden.

Als Anbieter von Anwendungssicherheitslösungen trommeln wir oft für den Schutz von Daten und Identitäten vor Exfiltration und Diebstahl. Doch wir drehen den Spieß selten um und sprechen über die sehr reale Möglichkeit einer Datenbeschädigung , sei es versehentlich oder aus Rache.

Das sollten wir tun – bevor es zu einem Trendthema auf Twitter wird.

Wir haben in vielen Formen eine Zunahme digitaler Vergeltungsschläge gegen die Bevölkerung erlebt. Da die Notrufzentrale keine genauen Standorte und Adressen von Mobiltelefonen abrufen kann, kam es bei Swatting-Angriffen zu tödlichen Verletzungen. Rachepornos gibt es viele und in den sozialen Medien kommt es ständig vor, dass man sich als unsere Freunde und Familienmitglieder ausgibt. Und es ist mehr als drei Jahre her, seit Chris Rock, CEO von Kustodian, auf der DEF CON (CS Monitor) demonstrierte, wie Betrüger aufgrund von Schwachstellen in den Sterberegistrierungsprozessen der meisten Länder jemanden künstlich „töten“ können, um Profit zu machen oder einen Streich zu spielen. Für diejenigen, die aufgepasst haben: Dies war einer der Hacks, die im Film „Hackers“ von 1995 verwendet wurden, zusammen mit der Sperrung einer Kreditkarte und der Aufgabe falscher Kontaktanzeigen als Vergeltung für eine Beleidigung – vermeintlich oder tatsächlich. 

Es ist nur eine Frage der Zeit, bis sich solch rachsüchtiges Verhalten ausweitet und Daten auch anderswo verunreinigt. 

Wenn Sie glauben, ich hätte eine Aluhut auf dem Kopf, dann denken Sie an den RedLock CSI-Bericht aus dem Jahr 2017 , in dem festgestellt wurde, dass 31 % der Datenbanken einen zum Internet geöffneten Port hatten. An jeden. Erinnern Sie sich an das MongoDB-Debakel , bei dem mehr als 27.000 Datenbanken öffentlich zugänglich waren. Wenn die falsche Person die richtige Datenbank offen lässt, kann dies verheerende Auswirkungen auf Ihre Daten haben.

Das ist ein Problem, denn wir haben einen Wendepunkt erreicht, an dem Daten oft als unantastbare und untrügliche Version der Wahrheit behandelt werden. Aufgrund eines Eingabefehlers hätte mich diese „Wahrheit“ ins Gefängnis bringen können.

Digitale Datensorgfalt

Während immer mehr unserer Geschäfte – und unseres Lebens – in der digitalen Welt gespeichert werden, sollten wir tief durchatmen und uns daran erinnern, dass die Bits und Bytes in unseren Datenbanken einen Aspekt echter Menschen darstellen. Die Sorgfalt, mit der wir mit diesen Daten umgehen, spiegelt unsere Einstellung gegenüber dem echten Menschen wider, unserem Kunden. Vor allem dann, wenn wir nicht wissen können, welche Daten, die wir heute eingeben, später zum Schaden des Kunden interpretiert werden könnten. Schließlich diente der Eintrag in meiner Fahrzeughistorie lediglich dazu, einen Ölwechsel in North Dakota anzumelden. Es war keine böse Absicht, aber das Ergebnis hätte für mich katastrophal sein können. 

Ob es nun darum geht, Sicherheitsrichtlinien mit dem Ziel zu entwickeln, Datenkorruption zu verhindern, den Zugriff auf Apps und Datenbanken zu kontrollieren oder der manuellen Dateneingabe größere Aufmerksamkeit zu schenken: Wir müssen immer im Hinterkopf behalten, dass die Daten zwar nicht lügen – sie stellen exakt das dar, was die Person eingegeben hat –, die Person, die sie eingegeben hat, jedoch möglicherweise auch etwas anderes getan hat.