In diesem Beitrag geht es um Data Operations und welche Stellung diese in Zeiten von IoT haben. Doch beginnen wir von vorne: Es fällt uns oft leichter, uns auf etwas Neues einzulassen, wenn wir mit etwas Vertrautem beginnen. Das ist wohl der Grund dafür, dass Analytics-Beispiele aus dem Sport sehr gut funktionieren. Schließlich sind die meisten aktive oder passive Sportfans. Aus demselben Grund hält der Bereich Automotive immer wieder dafür her, das ganze Ausmaß des Internet of Things (IoT) zu veranschaulichen – als Autofahrer können wir uns den praktischen Nutzen ohne Umwege ausmalen.
Auch SAS demonstriert seine Sichtweise auf das IoT daher am Beispiel Connected Car – mit der ganzen Bandbreite an Umsatzchancen: mehr Sicherheit, weniger Risiko, vorausschauende Wartung, Ersatzteiloptimierung bis hin zu Kundenbindung und Vorteile wie die in Echtzeit unterstützte Suche nach Parkplätzen und Ladestationen sowie Connected-Retail-Optionen. Fachliche Fragen betreffen dabei in der Regel die Herkunft der auszuwertenden Daten, deren Integration und das Algorithmus-Design, aber auch die Pflege der Datenquellen, die Vorbereitung, Qualität und Governance von Daten. (Hier auch ein interessanter Artikel auf www.ingenieurversteher.de zum Thema IoT und wie wichtig die Datenanalyse sein kann.)
Effective Data Science
Unsere Erfahrung mit Kunden zeigt, dass Data Scientists etwa 50 bis 80 Prozent ihrer Arbeitszeit darauf verwenden, Daten vorzubereiten. Der gesunde Menschenverstand sagt, dass das kaum der optimale Einsatz für einen hoch qualifizierten, teuren Data Scientist ist. Wer es geschafft hat, einen der heiß begehrten, guten Data Scientists an Bord zu holen, will wohl kaum, dass er seine knappe Zeit für simple Data Operations einsetzt. Ein darauf spezialisiertes Team kann ihm das abnehmen und damit helfen, das Maximum aus dem Investment in Data Science herauszuholen.
Data Operations sind im Kern mit sechs Herausforderungen konfrontiert: Data Engineering, Datenqualität, Updates, Datenintegration oder Dateninteroperabilität, Datenschutz und Datensicherheit, zusammen mit Compliance mit regulatorischen Anforderungen sowie Datenaustausch.
Nicht alle Daten werden sofort benötigt – und genau darin liegt die Hauptverantwortung der Data Operations: Daten zu bereinigen und zu sichern, so dass alle Abteilungen zu jedem Zeitpunkt darauf zugreifen können. Überlässt man diese Aufgabe den Anwendern, filtern diese mit Sicherheit nur die Daten heraus, die sie selbst gerade brauchen, ohne die Daten zu teilen – und andere müssen wieder von vorne anfangen, was das Unternehmen viel Geld und Ressourcen kostet.
Das Paradoxon aus Verantwortlichkeit und Erreichbarkeit
In einem Unternehmen, das datengetrieben arbeiten will, gehen die Daten auch jeden etwas an. Denn: Nur wenn Daten Teil der Unternehmenskultur sind, gibt es diese in guter Qualität. Es reicht einfach nicht, ein Team zu haben, das dafür verantwortlich ist, den Datenbestand aufzuräumen, wenn es gleichzeitig Leute gibt, denen es egal ist, ob die Daten, die sie eingeben, richtig sind, oder wenn Sensoren unzuverlässig sind.
Data Operations geht über technisches Know-how hinaus. Entscheidend sind Beziehungen und menschliches Gespür. Wissen ist Macht, und ebenso mächtig sind die Daten, die diesem Wissen zugrunde liegen. Das bedeutet, dass die Leute, die die Daten besitzen, sie ungern preisgeben. Gute Data Ops zeichnet aus, dass sie mit Argumenten überzeugen können und gut vernetzt sind, so dass Daten über Abteilungsgrenzen und Silos hinweg geteilt werden.
In der IoT-Ära bedeutet das, auch über Organisationsgrenzen hinweg zu arbeiten, um den Nutzen von Daten entlang der Wertschöpfungskette zu extrahieren.
IoT wird mehr unstudierte Wissenschaftler (Citizen Scientists) hervorbringen
Wenn hinter den Daten gute Data Operations stehen, können Anwender ohne Hilfe der IT eigene Analytics durchführen. Weil der IT-Support jetzt schon hart darum kämpft, mit den Anforderungen mitzuhalten, kann das für Unternehmen ein großer Vorteil sein. Unternehmen sollten sich daher nicht darauf beschränken, Data Scientists einzustellen, sondern mehr Fokus auf Data Operations legen. Wenn die zentrale IT saubere, hochwertige Rohdaten zur Verfügung stellt, können Anwender Self-Service-Analytics-Lösungen nutzen, um Erkenntnisse zu gewinnen. Wir rechnen damit, dass das Internet of Things noch mehr Quereinsteiger zu Data Scientists macht: Experten mit Neugier, Forschergeist und Freude am Unbekannten, Pioniere in Analytics.