Self-Service Data Preparation: Das Self steht für Value!

0

Quetschen Sie Ihre Daten selber aus, anstatt darauf zu warten, dass es ein anderer tut.

Data Preparation wird von Unternehmen bislang oft als Fleißaufgabe gesehen, die man gerne der IT überlässt. Doch weil die Fachabteilungen oftmals nicht lange auf ihre Daten warten wollen, haben dicke SQL-Bücher und Spreadsheet-Anwendungen immer noch Hochkonjunktur in den meisten Büros. Ist das sinnvoll?

Die neuen Fleißaufgaben im Zeitalter der Digitalisierung Click To Tweet

Nein, das ist nicht sinnvoll. Denn die notwendigen Schritte zur Aufbereitung der Daten sind wiederkehrend, trotzdem erfinden wir das Rad immer wieder aufs Neue. Mit SQL, mit aufwendiger Programmierung und vor allem Excel-Formeln, Excel-Formeln, Excel-Formeln.

Warum eigentlich? Macht es auch beim zehnten Mal noch Spaß, alle Leerzeichen aus einem Textfeld zu entfernen? Groß- und Kleinschreibung zu korrigieren? Sich die Finger bei der Suche nach Duplikaten zu brechen und diese dann manuell zu beseitigen? Ich glaube nicht. Und diese Aufgaben sind längst nicht mehr nur Sache der IT. Fachabteilungen müssen sich genauso damit auseinandersetzen.

Was bedeutet das auf Lösungsebene?

Self-Service Data Preparation ist wichtiger denn je. Sie versetzt auch den Fachanwender in die Lage, Daten endlich selbst aufzubereiten und das ohne detaillierte Kenntnisse in SQL oder Datenintegration. Entsprechende Werkzeuge müssen diese Dinge beherrschen und dem Anwender zugänglich machen, mit vordefinierten Routinen und vor allem ohne nennenswerten Trainingsaufwand.

Alle Ortsangaben eines Adressfelds in eine eigene Spalte, alle Postleitzahlen in eine weitere?
Vielleicht auch noch das Geschlecht aus einer Liste von Vornamen automatisch und regionsabhängig ableiten?Alles kein Thema mehr. Aufbereitungsschritte wie diese sind Standard und können heute per Mausklick angewandt werden; sich hier selbst daran zu versuchen und irgendeine Ausnahme sowieso wieder zu vergessen, kostet nur Zeit und Nerven.

Fazit

Es muss ein effizienter, konsistenter und wiederholbarer Datenaufbereitungsprozess geschaffen werden. Sind die richtigen Self-Service-Tools dafür im Einsatz, können Mitarbeiter in den Fachabteilungen selbstständig Erkenntnisse aus den Daten ziehen und die IT kann sich ihren Kernaufgaben widmen. Auf diese Weise wird das gesamte Unternehmen produktiver.

Share

About Author

Rainer Sternecker

Principal Solutions Architect

Rainer Sternecker is Data Management specialist and Principal Solutions Architect at SAS. He blogs about all aspects of the analytical lifecycle - data, discovery and deployment.

Leave A Reply

Back to Top