Was macht ein Data Scientist, wenn er nicht gerade von neuronalen Netzen träumt?

0

Angenommen, ein Chemiker hat eine riesige Menge verschiedener Rohstoffe zur Verfügung. Er hat die Aufgabe aus diesen Rohstoffen ein neues Medikament zu entwickeln. Der Chemiker weiß noch nicht wofür, aber mit Hilfe seines Fachwissens über chemische Stoffe macht er sich daran, kreativ Ideen zu entwickeln. Er fängt an, eine Auswahl zu treffen und diese Rohstoffe immer wieder zu verändern. Er erhitzt sie, er filtert sie, er kombiniert sie und so entstehen neue Stoffe. Aber wie wirken die neuen Stoffe und in welcher Zusammensetzung? Und wie schaut es beim Data Scientist aus?

Ausbildungsprogramm zum Data Scientisten bei SAS - informieren Sie sich !

Während seiner Arbeit zeichnen sich Muster ab und er bekommt eine Idee von der Wirksamkeit seines neuen Medikaments. Er entwickelt zur Überprüfung seiner Ideen verschiedenartige Versuchspläne. In jedem Versuchsplan wird die Wirksamkeit und Zusammensetzung seines Medikaments überprüft. Schließlich hat er ein validiertes Medikament entwickelt, das auf den Markt gebracht werden kann. Aber wer finanziert die Herstellung des Medikaments? Der Chemiker versucht Sponsoren zu finden, wofür er seine Erkenntnisse und Ergebnisse verständlich aufbereiten und überzeugend präsentieren muss.

Der Data Scientist hat keine Rohstoffe zur Verfügung, aber er hat Rohdaten. Jede Menge Rohdaten.  Auch er weiß noch nicht genau, wie er aus den Rohdaten einen Nutzen genieren kann. Aber sein jeweiliges Fachwissen hilft ihm dabei, kreativ zu sein und Ideen zu entwickeln. Er macht sich daran, anhand seiner Ideen eine Auswahl aus den Daten zu treffen. Dabei bekommt er visuelle Unterstützung, die Besonderheiten in den Daten sichtbar machen. Schließlich fängt er an, die ausgewählten Rohdaten zu verändern. Er leitet beispielsweise neue Merkmale aus den Daten ab, oder er verdichtet bzw. filtert sie. Beim Data Scientist zeichnet sich langsam ein Bild ab, wie ein geschäftlicher Nutzen aus den Daten generiert werden kann.  Er überprüft und entwickelt iterativ seine verschiedenen Ideen mit mathematischen Methoden und Algorithmen, bis er einen Zusammenhang in den neuen Informationen gefunden hat, der sich verallgemeinern und gewinnbringend einsetzen lässt. Da seine Erkenntnisse in der Regel völlig neu sind, muss auch er Sponsoren für seine Ideen gewinnen, um diese produktiv um- und einzusetzen.

Aber wo arbeitet der Data Scientist? Es ist ja bekannt, dass so manch kreative Erfindung in einer Garage gemacht wurde – wie das berühmte Beispiel des Microsoft Betriebssystems DOS. Und so wird der Arbeitsplatz des Data Scientist gerne als „Garage“, oder – auch sehr beliebt – „Sandbox“ bezeichnet. Vermutlich in Anlehnung an all die Tierchen, die einem im Big Data Spielezoo so begegnen – es gibt Förmchen in den Ausführungen Elefantenbienchen, gelber Elefant, purpurfarbener Elefant, blauer Elefant, Impala, Falke, Schweinchen, Giraffe, Eichhörnchen,…

Und was hat das nun mit SAS zu tun? Nun, kreativ kann man mit SAS Software selbstverständlich auch sein, aber die SAS Software ist längst erwachsen geworden. SAS hat sich in den bald 40 Jahren stets weiterentwickelt, so dass es mit SAS möglich ist, einen nahtlosen Übergang vom “Labor” zum produktiven Einsatz zu schaffen. Nur so kann der Nutzen aus großen Datenmengen Wirklichkeit werden. Vielleicht gibt es deshalb SAS Förmchen nicht im lieblichen Tierchendesign, sondern schlicht verpackt als Toolset im Big Data Lab für Profis.

Share

About Author

Tamara Fischer

Sr Solutions Architect

Ich bin seit 1. Januar 1998 bei SAS. Nach einer anfänglichen Phase im Consulting unterstütze ich heute im CoE DACH Analytics unseren Vertrieb und unsere Kunden zu fachlichen Fragen rund um unsere analytischen Produkte wie SAS Enterprise Miner, SAS Decision Manager oder SAS Visual Statistics. An der Universität Dortmund habe ich den Diplom Studiengang Statistik absolviert.

Related Posts

Leave A Reply

Back to Top