Ein Data Scientist macht noch lange kein Machine-Learning-Modell!

0

Ich bin bereits zum dritten Mal in San Francisco und wieder mal sehr beeindruckt von der großartigen Architektur der Golden Gate Bridge. Diesmal lasse ich mich mit dem Boot nach Sausalito, auf die andere Seite der Bucht, übersetzen. Das dortige Orts-Museum erzählt dem Besucher von der bewegten Geschichte des Ortes – und natürlich von dem aufwendigen Brückenbau damals. Mein Blick fällt auf eine Aussage und ein Bild des Arbeiters Eddie Souza, der seinerzeit am Bau der Brücke mitgewirkt hat.

… Es war zur Zeit der Depression und jede Menge Männer ohne Arbeit hingen am Brückenzaun rum und warteten nur darauf, dass der eine oder andere von uns gefeuert wurde oder sich verletzte … (Eddie Souza)

Was für ein knochenharter und gefährlicher Job! Den Menschen, die diese Schwerstarbeit erledigten und täglich damit rangen, nicht von der Brücke zu fallen, ist dieses Monument zu verdanken.

Stars im Rampenlicht

Data Scientist
Gedenktafel Golden Gate Bridge San Francisco

Später gehe ich über die Golden Gate Bridge zurück nach San Francisco. In der Mitte der Brücke sehe ich eine große Gedenktafel mit den Namen der bedeutenden Personen, die die Brücke gebaut haben. entdecke ich Eddie Souzas Namen dort? Nein. Keiner der Arbeiter wird dort erwähnt, nur diejenigen, die das Bauwerk geplant und die Konstruktion beaufsichtigt haben. Ich verstehe schon, dass es schwierig wäre, die Namen aller, die jemals daran mitgewirkt haben, hier unterzubringen.

Dank an alle, die am Analytics Lifecycle mitwirken

Allerdings können sich die auf der Tafel verewigten Personen nur deshalb im Ruhm sonnen, weil Menschen wie Eddie ihren Job gemacht haben. Nach einer Weile denke ich über meinen Job nach und die vielen anderen Data Scientists, die im Rampenlicht stehen, weil sie ein gutes, illustratives und interaktives Modell gebaut haben. An dieser Stelle möchte ich all meinen SAS Kollegen und Projektmitarbeitern auf Kundenseite ein großes Dankeschön aussprechen, ohne die dies nicht möglich wäre. Denn sie machen einen extrem wichtigen Job, so dass wir unsere Modelle bauen und vorstellen können und den Analytics Lifecycle ins Laufen bringen.

Machine-Learning-Modelle brauchen Daten

Fangen wir mal von vorne an. Zunächst brauchen wir Daten zu unseren Analysesubjekten, um Modelle zu trainieren. Datenbankadministratoren speichern die Daten in ihren operativen Quellsystemen. Diejenigen, die für Datenintegration zuständig sind, transferieren die Daten aus unterschiedlichen Systemen in Data Marts oder Data Lakes, die über Analyseplattformen zugänglich sind. Data Stewards und Business-Experten gewährleisten die Datenqualität in puncto Vollständigkeit, Konsistenz, Präzision und Aktualität. Sie erstellen nach technischen und geschäftlichen Kriterien Profile aus den Daten, so dass sie bereit zur Auswertung sind.

Die Intelligenz kommt mit der Software

Schließlich brauchen wir Analytics-Software auf unseren Rechnern. System-Administratoren installieren die Software und sorgen dafür, dass immer die aktuelle Version bereitsteht, indem sie regelmäßig Updates und Maintenance-Releases durchführen.

Lizenz-Experten stellen sicher, dass wir die erforderlichen Software-Lizenzen und Vereinbarungen haben, die uns zur Nutzung der Software berechtigen. System-Administratoren sind dafür verantwortlich, dass wir mit unserer Benutzerkennung Zugriff auf die Software haben, gleichzeitig aber nur auf die Daten zugreifen können, die wir nutzen sollten.

Business-Experten sind unsere Sparring-Partner

Jedes einzelne Datum hat seine Geschichte zu erzählen. Wir müssen den Hintergrund und den Ursprung der Daten verstehen, um wirklich relevante Machine-Learning-Modelle zu bauen. Und hierfür sind wir auf Business-Experten angewiesen, die den geschäftlichen Hintergrund der Daten verstehen und um den operativen Prozess wissen, der die Daten generiert. Es sind zudem die Business-Experten, die uns dabei helfen, die Modelle so zu kalibrieren, dass sie im operativen Prozess für Geschäftsentscheidungen herangezogen werden können.

Wer bringt Modelle in die Produktion? Die IT!

Aber mit der Modellerstellung hört der Prozess noch lange nicht auf. Man muss das Modell in Produktion bringen, damit es zuverlässige Vorhersagen ermöglicht, die zu fundierten Geschäftsentscheidungen herangezogen werden können. Wenn wir ein cooles, erfolgversprechendes Modell, eine gute Erklärung für Kundenverhalten oder eine präzise Bedarfsprognose haben, ist das schon eine gute Voraussetzung. Einen Nutzen daraus ziehen können wir aber nur mit Unterstützung durch die IT-Abteilung, die uns dabei hilft, diese analytischen Modelle in das Produktionssystem zu integrieren.

Interesse an direktem Austausch? Die AX 2018 steht vor der Tür!

Data Scientist
Gerhard Svolba auf der Analytics Experience 2018 in Mailand

Wenn ich das nächste Mal Ergebnisse aus Machine-Learning-Modellen, die mit SAS Viya erstellt wurden, präsentiere, wissen Sie: Ich kann den Erfolg nicht für mich alleine verbuchen, denn ich hatte Unterstützung von all den genannten Kollegen, um den analytischen Lifecycle zu durchlaufen und zu den vorgestellten Ergebnissen zu gelangen. Die nächste Gelegenheit dazu: die Analytics Experience vom 22. bis 24. Oktober in Mailand. Ich freue mich, Sie dort zu treffen und mich mit Ihnen auszutauschen, wie Sie Machine-Learning-Modelle erstellen und den gesamten analytischen Lifecycle abdecken.

 

 

 

Share

About Author

Gerhard Svolba

Principal Solutions Architect

Dr. Gerhard Svolba ist Analytic Solutions Architect und Data Scientist bei SAS Institute in Österreich. Er ist in eine Vielzahl von analytischen und Data Science Projekten quer über fachliche Domains wie Demand Forecasting, analytisches CRM, Risikomodellierung und Produktionsqualität involviert. Seine Projekterfahrung reicht von der fachlichen und technischen Konzeption über die Datenaufbereitung und die analytische Modellierung in unterschiedlichen Branchen. Er ist der Autor der SAS Press Bücher Data Preparation for Analytics Using SAS, Data Quality for Analytics Using SAS and “Applying Data Science: Business Case Studies Using SAS”. Als nebenberuflich Lehrender unterrichtet er Data Science Methoden an der Medizinischen Universität Wien, der Universität Wien und an Fachhochschulen. Sie finden auch Beitrage auf: Github und Twitter. ENGLISH: Dr. Gerhard Svolba ist Analytic Solutions Architect und Data Scientist bei SAS Institute in Österreich. Er ist in eine Vielzahl von analytischen und Data Science Projekten quer über fachliche Domains wie Demand Forecasting, analytisches CRM, Risikomodellierung und Produktionsqualität involviert. Seine Projekterfahrung reicht von der fachlichen und technischen Konzeption über die Datenaufbereitung und die analytische Modellierung in unterschiedlichen Branchen. Er ist der Autor der SAS Press Bücher Data Preparation for Analytics Using SAS®, Data Quality for Analytics Using SAS® and “Applying Data Science: Business Case Studies Using SAS”. Als nebenberuflich Lehrender unterrichtet er Data Science Methoden an der Medizinischen Universität Wien, der Universität Wien und an Fachhochschulen. Sie finden auch Beitrage auf: Github und Twitter.

Related Posts

Leave A Reply

Back to Top