1901 prognostizierte Gottlieb Daimler: „Die weltweite Nachfrage nach Kraftfahrzeugen wird eine Million nicht überschreiten – allein schon aus Mangel an verfügbaren Chauffeuren." Heute fahren die meisten selber und das selbstfahrende Auto scheint auch greifbar nah. Chauffeure braucht heute kein Mensch mehr. Wie sieht das, bei immer mehr Self-Service-Analytics und Machine Learning, für den Data Scientist aus? Eine gewagte Prognose gibt es hier, und warum man sich öfter mal die „Chauffeursfrage“ stellen muss.
Vermutlich hätte sich Herr Daimler nicht in seinen kühnsten Träumen ausmalen können, dass es heute mehr als 1,24* Mrd. registrierte Kraftfahrzeuge weltweit gibt. Den Grund für seine ungeheure Fehleinschätzung liefert der Erfinder des Automobils gleich mit. Er kennt den begrenzenden Faktor in seiner Prognose – den Chauffeur. Wer sich in die Zeit um 1900 zurückversetzt und sich den technischen Stand des Automobils vor Augen hält, der wird schnell einsehen, dass nur ein Chauffeur in der Lage war, als Fahrer, Mechaniker und Navigator das sichere Fortkommen von A nach B zu garantieren. Tja, und von den Chauffeuren gab es einfach zu wenig.
Limitierender Faktor Data Scientist
Mehr als 100 Jahre später, so scheint es, gibt es den Chauffeur 2.0 – der Data Scientist, laut Harvard Business Review angeblich der „Sexiest Job of the 21st Century“, und natürlich wegen der begrenzten personellen Verfügbarkeit heiß und teuer begehrt. Da haben es kleine und mittlere Unternehmen, womöglich mit unattraktivem Standort außerhalb der großen Städte, schwer, gutes Personal zu finden. Denn die Diven der Datenanalyse wollen ihre Fähigkeiten lieber bei Google & Co. als bei Müller GmbH & Co. KG unter Beweis stellen. Heißt das also, Data Science und Advanced Analytics sind nur was für die großen Player und nicht für die kleinen und mittleren Unternehmen? Nicht mehr, und zwar mit Approachable Analytics.
Approachable Analytics: der Startschuss zum selbst Fahren
Mit der Idee, analytische Verfahren und Methoden ohne Programmierkenntnisse einfach und visuell zu nutzen, geht diese Disziplin ins Rennen. Dem Anwender stehen sowohl klassische Business-Intelligence-Funktionen (ich nenne das gerne: zählen, messen, wiegen) als auch hochwertige Analytik (Regressionen, Entscheidungsbäume, Clusteranalysen) zur Verfügung, also genau das, was man braucht, um in das Gebiet der Data Science einzutauchen.
Folgende Mindestanforderungen sollte ein Approachable-Analytics-Werkzeug mitbringen:
- Analysen, Reporting und Analytik
Es sollte die Möglichkeit bestehen, in einer Oberfläche alle 3 Funktionsbereiche nutzen zu können, d. h. interaktiv Daten zu untersuchen, neue Variablen und Kennzahlen abzuleiten, zu filtern, Ausreißer zu erkennen und analytische Methoden auf den Daten anzuwenden und prädiktive Modelle zu erstellen.
- Informationen teilen
Ein wichtiger Punkt ist, dass die Erkenntnisse untereinander geteilt werden können. Dazu zählen neben klassischen Kanälen wie Office und Web natürlich auch mobile Endgeräte.
- Datenmanagement
Anwender müssen in der Lage sein, auf Daten selbstständig zugreifen zu können. Diese auch aus verschiedenen Quellen zu verknüpfen und Berechnungen durchzuführen. Schnittstellen zu diversen internen (ERP, CRM etc.) und externen (Web, Twitter, Google Analytics etc.) Systemen sollten Bestandteil sein. Am besten auch moderne Data-Wrangling-Funktionalitäten beinhalten.
- Skalierbare Infrastruktur
Die Umgebung sollte mit den Anforderungen wachsen können, ohne große IT-Aufwände zu generieren. Zudem wäre es praktisch, auch diverse Cloud-Varianten (z. B. private cloud etc.) zur Verfügung zu haben. Und nicht zu vergessen: Security und Benutzeradministration – das liebt die IT.
Hört sich nach ganz schön vielen Wünschen an, aber wer selbst fahren will, braucht gewissen Komfort und will nicht alle 500 Meter anhalten, weil irgendwas am Motor zickt (siehe Auto um 1900) – oder man ein Python- oder R-Package nachladen muss.
Meine Prognose
Ist damit der Data Scientist abgelöst? Aus heutiger Sicht und mit den derzeitigen technischen Möglichkeiten ein klares „jein“. Die verfügbaren Werkzeuge haben derzeit noch große funktionale Unterschiede. Zwar schreiben alle Anbieter in großen Buchstaben „Analytics“ auf die Verpackung, aber die wenigsten besetzen den Teil mit eigenen Bordmitteln, sondern verweisen hier gerne auf APIs und Schnittstellen zu Open-Source Tools wie R und Python. Zudem ist es bei analytischen Verfahren und prädiktiven Modellen sehr wichtig, die richtige Interpretation und die Güte einschätzen zu können. Tja, und vor Modellierungsfehler ist man auch nicht geschützt. Aber diese neue Generation analytischer Werkzeuge sind ideale Einstiegspunkte für mehr (Big) Data Analytics. Denn jetzt können versierte Fachanwender einfach einen Schritt weiter kommen. Natürlich braucht man etwas Schulung, aber der Zugang zu Analytics ist greifbar und machbar. Man muss nur starten (wollen). Die Chauffeurs-Frage - also die Frage, ob man limitierende Faktoren als gegeben sieht oder eben nicht, gibt hier zusätzlichen Antrieb.
Fazit: Ob der Data Scientist in 10 Jahren noch gebraucht wird steht in den Sternen, aber eines ist sicher: Schalke 04 wird in den nächsten 50 Jahren nicht deutscher Meister in der Bundesliga.
*Quelle https://de.statista.com/statistik/daten/studie/244999/umfrage/weltweiter-pkw-und-nutzfahrzeugbestand/