Was kann SAS, was Open Source nicht kann?

0

Open Source und SAS – das sind auf den ersten Blick zwei ganz verschiedene Welten. Dabei verfolgt SAS eine ganze Reihe von Initiativen rund um Open Source – insbesondere im Umfeld des Big-Data-Frameworks Hadoop. Ich habe Andreas Gödde zum Nebeneinander und Miteinander der Technologien befragt. Andreas Gödde berät viele Kunden im Bereich Analytics und Datenmanagement – und bezieht eindeutig Stellung.

open source handwritten with related word cloud on blackboard

Andreas, wenn man sich in der Blogosphäre umschaut, scheint SAS nicht unbedingt das Lieblingskind der Community zu sein – insbesondere im Vergleich zu Open-Source-Umgebungen wie Python oder vor allem R. Warum ist das so?
Es stimmt: Manchmal gilt SAS als das Gegenmodell, gelegentlich sogar als „Feindbild“ der Open Source Community. Aus meiner Sicht wird hier aber auch oft mit Projektionen gearbeitet. Weil SAS schon „ewig“ am Markt ist, ist es nicht cool und hip, sich damit zu beschäftigen. Weil SAS kommerzielle Software anbietet und damit Geld verdient, ist es „zu“ teuer. Weil SAS als Statistik-Tool an der Uni schon langweilig war, ist es das heute immer noch. Häufig genug wird die Diskussion aber zu ideologisch und grundsätzlich geführt – und nicht immer auf der gleichen Argumentationsebene.

Welche Ebenen siehst Du denn?
Zum einen gibt es das, was man heute „Data Science“ nennt und im engeren Sinne mit „Modelle entwickeln“, „Algorithmen schreiben“ fassen kann. Wenn wir dort Punkt für Punkt SAS-Prozeduren mit R-Bibliotheken vergleichen, kann schnell der Eindruck entstehen, dass es bei R „viel mehr“ gibt. Das ist aber nur die halbe Wahrheit. Denn häufig werden bestimmte Begriffe schnell in Schubladen gelegt: Google macht Machine Learning, IBM Cognitive Computing. Dass SAS das auch macht und schon lange und vor allem im produktiven Einsatz – das geht schnell unter.

Das wäre also die Ebene der Analytics-Experten, oder?
Genau. Das ist auch der Bereich, in dem SAS eine Menge zu bieten hat: von einer ausgewachsenen und auf Analytics hin designten Programmiersprache bis hin zu zahlreichen Benutzeroberflächen und Werkzeugen für Spezialaufgaben – wie Text Mining, Forecasting oder Optimierung.

Welche Ebenen siehst Du noch?
Analytics ist sehr vielfältig geworden. Da ist zum einen die IT, die auf einer technischen Ebene Dinge wie Datenbereitstellung, Datensicherheit und Governance bereitstellt. Da sind Fachbereiche, die immer analytischer arbeiten und ohne Mathematik-Studium einen besseren Forecast rechnen wollen. Und es gibt immer mehr Entscheider, die ihre Dashboards interaktiver haben und auf neue Zusammenhänge hingewiesen werden wollen. Man könnte auch sagen, dass bei einer Verankerung von analytischer Kultur im gesamten Unternehmen die Stärken von SAS immer stärker zum Tragen kommen.

Sieht SAS denn Open Source als Bedrohung?
Nein, im Gegenteil. SAS fährt die Strategie, Open-Source-Komponenten zu integrieren, den Funktionsumfang von Open Source zu erweitern und die Stärken von SAS aus Open-Source-Sprachen heraus zu nutzen. Im Bereich Datenmanagement (siehe dazu meinen kürzlichen Beitrag) nutzen wir Spark zur schnellen Datenbereitung, für unser SAS Visual Analytics setzen wir auf Hadoop-Cluster als Datenhaltung, wir liefern als einziger Anbieter weltweit Datenqualitätsroutinen für Hadoop-Cluster, arbeiten eng mit Cloudera, Hortonworks und MapR im Bereich Hadoop-Distributionen zusammen, können R-Modelle verwalten und deren Performance mit SAS-Modellen vergleichen, können Java-Programme in SAS-Code einbetten – und so weiter.

Hat sich SAS hier weiterentwickelt?
Auf jeden Fall. Noch vor wenigen Jahren hatten wir hier eine deutlich skeptischere Sicht auf Open Source – weil unsere Kunden auch so dachten. Nun stellen wir fest, dass wir unsere Kunden besser bedienen können, wenn wir eine Koexistenz ermöglichen. Denn die ist ohnehin gesetzt.

Was bleibt denn die Stärke von SAS?
Ich sehe da im Wesentlichen drei Punkte: Beständigkeit, Deployment, Governance.

Was genau meinst du damit?
Beständigkeit: Wenn heute vielleicht Python „modern“ ist, kann es sein, dass in fünf Jahren ein anderes Werkzeug stärker verbreitet ist. SAS hingegen stellt seit 40 Jahren eine Kompatibilität her. Das bedeutet nichts anderes, als dass ich Investitionen in Analytics, die ich heute tätige, zukunftsfähig sichere. Aktuell hat SAS ja eine neue cloud-orientierte Architektur vorgestellt, die das ein weiteres Mal in die Zukunft fortschreibt.

Deployment: Ein analytisches Modell, das ein Experte mit seinen technischen Voraussetzungen häufig auf dem Desktop entwickelt, ist das eine. Etwas anderes ist es, dieses Modell in Produktion zu überführen und dann über große Datenmengen und auf einer anderen Architektur zu skalieren, in der Cloud, in Hadoop, im Stream. SAS ist als Ablaufumgebung auf allen gängigen Plattformen verfügbar.

Governance: Für viele Enthusiasten ist das ein Langweiler-Thema. Für die meisten Unternehmen aber ist es gar nicht anders machbar: Datenverarbeitungsprozesse müssen nachvollziehbar und reproduzierbar bleiben. Das verlangt in vielen Fällen eine Aufsichtsbehörde, aber auch der gesunde Menschenverstand. Noch wichtiger aber: Wenn Analytics wirklich unternehmenskritisch wird, dann fallen sehr viele Modelle an und damit die Frage nach deren Verwaltung, den zugehörigen Metadaten, der Dokumentation von Einsatzszenarien und vielem mehr. SAS weiß aus Hundertausenden von Analytics-Projekten, was alles dazu gehört, um Analytics nachhaltig und so effizient wie möglich zu machen.

Das ist aber nicht das Ende der Diskussion, oder?
Das hoffe ich nicht! Ich würde gerne noch mehr erläutern und argumentieren: warum Hadoop und SAS so gut zusammenpassen, wie unsere neue Architektur SAS Viya in diese Diskussion passt –inklusive RESTful APIs, Schnittstellen zu Python, Lua, Java, R –, welche Kunden von SAS was genau in Kombination von Open Source machen – Nestlé und MunichRe –, was Machine Learning bedeutet et cetera. Ich hoffe auf Kommentare und Anregungen hier im Blog – oder per Nachricht an mich. Gerne verweise ich auch auf den Beitrag "Using SAS & Open Source" meines Kollegen Marcel Lemahieu.

Danke für das Gespräch, Andreas.

Share

About Author

Thomas Keil

Director Marketing

Dr. Thomas Keil is a specialist for the impact of technology on business models and on society in general. He covers topics like Digital transformation, Big Data, Artificial Intelligence & Ethics. Besides his work as Regional Marketing Director at SAS in Germany, Austria and Switzerland he regularly is invited to conferences, workshops and seminars. He serves as advisor to B2B marketing magazines and in program committees of AI-related conferences. Dr. Thomas Keil 2011 came to SAS. Previously, he worked for eight years for the software vendor zetVisions, most recently as Head of Marketing and Head of Channel Sales. Dr. Thomas Keil beschäftigt sich mit den Folgen des technologischen Wandels für Geschäftsmodelle und für gesellschaftliche Veränderungen. Dabei geht es ihm um Themen wie Digitale Transformation, Big Data, Künstliche Intellligenz und ethische Fragestellungen. Neben seiner Arbeit als Regional Marketing Director für SAS in Deutschland, Österreich und der Schweiz ist er regelmäßiger Gast auf Konferenzen, Workshops und Seminaren. Er ist Gutachter im Bereich Fachpublikationen im B2B-Marketing und agiert als Programm-Beirat für Konferenzen in seinem thematischen Umfeld. Dr. Thomas Keil kam 2011 zu SAS. Davor war er acht Jahre für den Softwarehersteller zetVisions tätig, zuletzt als Head of Marketing sowie Head of Channel Sales.

Leave A Reply

Back to Top