Citizen Data Scientist : WIR BRAUCHEN EUCH! Und das Warum erzähle ich in diesem Blog. Erster Test: Wussten Sie, dass das Alter der Miss America mit der Anzahl der Morde durch heißen Dampf und heiße Gegenstände korreliert? Oder dass die Storchenpopulation mit der Geburtenrate zusammenhängt?
Quatsch, denken Sie, das ist doch Schmarrn! Herzlichen Glückwunsch an Sie. Sie können sich Ihr Zertifikat zum Data Scientist direkt ausdrucken. Häh?! Wie das? Na ganz einfach: Nur ein sehr gut ausgebildeter und mit allen Wassern gewaschener Data Scientist erkennt diese Beispiele sofort als Scheinkorrelationen. Das sagt übrigens auch Gregory Piatetsky von KDnuggets auf der Online-Plattform für Data Mining. Und glaubt, den Unterschied zwischen dem Jedermann-Datenwissenschaftlern (seine Definition von Citizen Data Scientist) und dem Data Scientist erklärt zu haben.
In seinem Artikel „The Mirage of a Citizen Data Scientist” führt er Beispiele auf, warum der Citizen Data Scientist eher Fluch als Segen sei, und klärt auf: Es würde ihm Angst und Bange, wenn das Flugzeug, in dem er sitzt, von einem Hobby-Piloten per Autopilot gesteuert würde. Und so sei das auch mit den Citizen Data Scientists (CDS). Der Jedermann-Datenwissenschaftlern sei ein Hobby-Datensammler.
Da hat Herr Piatetsky, wie ich finde, ein gemeines Urteil gesprochen. Denn diese Jedermänner sind, salopp gesagt, Leute, die tiefe Einblicke in ihr jeweiliges Geschäftsfeld haben, sich mit den eigenen Daten auskennen und meist ein Studium in der Tasche haben. Für mich klingt das nicht nach Hobby-Pilot.
Schauen wir auf die von Gartner formulierte Definition des CDS:
“people on the business side that may have some data skills, possibly from a math or even social science degree – and putting them to work exploring and analyzing data.”
Was bewegt Kritiker wie Herrn Piatetsky zu ihrer Antihaltung? Ich denke, es ist eine gewisse Verlustangst beim Data Scientist. Doch wird durch den Citizen seine Expertise gestärkt und nicht geschwächt. Weil nämlich diese Fragen immer beantwortet werden müssen (intuitive Analytik-Software hin oder her), und das kann nur der Data Scientist:
- Gibt es einen Bezug der Analysen zum Geschäftsprozess?
- Haben wir die richtigen und qualitativ saubere Daten?
- Können wir die Ergebnisse eindeutig interpretieren?
- Haben wir methodisch korrekt gearbeitet?
Zweiter Test: Sie müssen eine neue Filiale eröffnen. Sie prüfen also den Wettbewerb, Besucherstrom, Kaufkraft in der Region und machen vielleicht noch eine Prognose zur Wirtschaftlichkeit. Alles korrekt und methodisch sauber. Aber am Ende entscheidet der Chef über den Standort. Hätten Sie also gleich die richtige Frage gestellt: „Sagt mal, wie werden bei euch eigentlich Entscheidungen getroffen?“ Und die Antwort wäre gewesen: „Management per Dartpfeil!“, hätten Sie sich viel Mühe gespart. Und das kann nur ein Citizen leisten.
Ich will damit sagen: Natürlich brauchen wir den Data Scientist, der mit seiner Erfahrung und seinem Methodenwissen die Fallstricke der analytischen Datenuntersuchung kennt. Doch diese Multitalente sind ein knappes Gut. Warum also nicht den anderen Weg gehen und den fachliche Experten mehr an die Analytik heranführen? Dafür gibt es seit Kurzem bei SAS das Ausbildungsprogramm zum Data Scientist.
Für mich ist ganz klar: Der Citizen Data Scientist wird mit seinem Fachwissen, seiner Datenaffinität und seiner Neugier eine wichtige Rolle spielen. Wir sind am Anfang einer neuen Ära.
Weitere interessante Links: Data Visualization Techniques
1 Comment
Das Beispiel von Gregor Piatetsky ist mir auch ein bisschen zu drastisch.
Natürlich ist es situationsabhängig, wie umfangreich die Expertise einer Person sein muss, die "mit Daten umgeht".
Piatetsky klingt ein bisschen so, als hätte er Angst, dass die Gatekeeper verschwinden, so wie das Fernsehen Youtube abfällig behandelt hat.
Ich finde, dass es der richtige Weg ist, "Laien" den Umgang mit Daten zu zeigen, statt diesen nur den Top-Experten zu überlassen.