wirtschaft und weiterbildung 9/2019
R wirtschaft + weiterbildung 09_2019 47 schen nutzt. Man braucht eine sorgfältig geplante, repräsentative Zufallsstichprobe und muss eine Befragung durchführen, bei der auch alle mitmachen und bei der größten Wert auf Qualität gelegt wird. Sonst bekommt man immer systemati- sche Verzerrungen. Aber darum bemüht sich heute keiner mehr, weil alle dem My- thos Big Data verfallen sind. Mehr Daten bedeuten also letztlich mehr Fehler? Antes: Wer über künstliche Intelligenz spricht, muss auch über künstliche Dummheit reden. Denn unter der Menge der Daten leidet die Qualität der Ergeb- nisse, wenn ich naiv vorgehe. Und daher bedarf es größerer menschlicher Anstren- gungen, um die Qualität sicherzustellen. Die Tragödie von Big Data ist: Je mehr Va- riablen ich habe, desto mehr signifikante Korrelationen habe ich. Damit wächst jedoch auch die Zahl der unechten oder „falschen“ Korrelationen. Dafür gibt es unzählige Beispiele. Je größer die Daten- menge, umso mehr Korrelationen gibt es, die jedoch inhaltlich völlig schwachsinnig sind. Zum Beispiel, dass Menschen mit kleineren Füßen weniger verdienen. Hier ist es das Geschlecht, das das Ergebnis erklärt. Frauen haben kleinere Füße und verdienen weniger. Das ist hier leicht zu erkennen, ist jedoch üblicherweise viel komplexer. Im Englischen heißen diese Korrelationen „Spurious Correlations“. Sie meinen Scheinkorrelation? Antes: Das ist der übliche deutsche Be- griff, aber er ist eigentlich falsch. Denn die Zahlen sind tatsächlich korreliert. Der Schein kommt durch die falsche In- terpretation, die das Ganze zu einem ir- reführenden kausalen Zusammenhang verfälscht. Darum muss man unbedingt Mechanismen entwickeln, um all diese ir- reführenden Korrelationen und fälschlich hineingedeuteten Kausalitäten zu entlar- ven und möglichst rasch auszuschalten. So kann man zum Beispiel mit Daten belegen, dass sich der Käsekonsum in den USA von 2000 bis 2010 parallel zur Anzahl der Menschen entwickelt hat, die auf tragische Weise unter ihrer Bettdecke erstickt sind. Wenn diese Zusammen- hänge kausal wären, sollte man durch die Reduktion des Käsekonsums die Ge- fahr des Todes im Bettlaken reduzieren können – was natürlich blanker Unsinn ist. Durch Big Data kommt es zu einem starken Anstieg falsch positiver Ergeb- nisse und damit ist Big Data vor allem ein Bullshit-Generator. Was bedeuten „falsch positive Ergebnisse“? Antes: Es gibt allgemeingültige Regeln, die für jedes diagnostische Verfahren gel- ten. Wenn nach etwas gesucht wird, fin- det man einen Teil dessen, wonach man sucht, aber fast nie alles und unvermeid- lich auch einen Teil von dem, wonach man nicht sucht. Das erlebt jeder, der sich durch den Berg der Ergebnisse einer Google-Suche quält, um die wenigen Tref- fer zu finden, die tatsächlich Antworten auf seine Frage liefern. Das Gleiche gilt für jede wissenschaftliche Untersuchung. Bei klinischen Untersuchungen, Massen- screenings, Tests oder dem Datensam- meln ist es immer so: Es gibt richtig po- sitive und negative sowie falsch positive und negative Ergebnisse. Nehmen Sie eine Laboruntersuchung auf eine Infektion. Positiv heißt, dass eine Probe auf eine Infektion hinweist. Rich- tig positiv, dass die Analyse die Infektion bestätigt, falsch positiv, dass die Probe fälschlicherweise eine Infektion anzeigt. Darin liegt ein großes Schadenspotenzial, vor allem wenn die Diagnoseverfahren auf Gesunde oder Unverdächtige ange- wendet werden. Selbst wenn in Deutsch- land niemand einen Terroranschlag im Sinn hätte, würde jedes Verfahren trotz- dem Verdächtige produzieren. Damit wären die aber alle falsch positiv und jeder Verdacht wäre zu hundert Prozent ein Fehlalarm. Wenn wir also mehr Po- lizei einsetzen, haben wir auch mehr falsch positive Ergebnisse. Dasselbe gilt natürlich für falsch negative Ergeb- nisse. Wer als nicht verdächtig eingestuft wurde, ist es vielleicht doch. Der Geschäftsführer der Bertelsmann Stiftung, Jörg Dräger, der sich für den gesellschaftlich verantwortungsvollen Einsatz von Algorithmen einsetzt, hat
Made with FlippingBook
RkJQdWJsaXNoZXIy Mjc4MQ==