SAS Viya trifft auf Open Source und Deep Learning

0

Wie lassen sich leistungsstarke Analytics und Open Source miteinander vereinbaren? Diese Frage beantwortet unser Gastautor Alexander Buchwald von der mayato® GmbH.  

Open Source und kommerzielle Software waren nicht immer die besten Freunde. In Zeiten digitalen Wandels sind jedoch agile Softwareentwicklung und maximale Flexibilität gefragt. Darauf müssen sich Softwarehersteller jeder Couleur einstellen und für ihre Plattformen und Lösungen auch Open-Source-Schnittstellen bereitstellen – egal, um welche Art von Geschäftsanwendung es geht.

SAS Viya trifft auf Open Source und Deep Learning
SAS Viya trifft auf Open Source und Deep Learning

Mit SAS Viya öffnet sich SAS für Open-Source-Programmiersprachen wie Java, Lua, R und Python. Diese können nun unkompliziert in die Plattform integriert werden. So werden die Vorteile gebündelt: SAS als etablierte Programmiersprache einerseits und die Open-Source-Welt, die maximale Flexibilität verspricht, andererseits.

Bei neuesten Data-Science-Anwendungen, wie beispielsweise Image Recognition, ist aktuell die Standardprogrammiersprache Python, also Open Source. In der Praxis ist jedoch oftmals die Integration der Open-Source-Welt in die bestehende IT-Infrastruktur eine Herausforderung: Die Daten müssen performant für die Open-Source-Umgebung verfügbar sein, die Open-Source-Modelle müssen produktiv eingesetzt werden können, und auch für die Administration und Einrichtung der Open-Source-Umgebung sind Ressourcen notwendig.

„SWAT-Force“ für Python und R: Beispiel Image Recognition

SAS Viya bietet genau hierfür eine elegante Lösung. Um die Programmiersprachen Python und R auch in einer bestehenden IT-Infrastruktur nutzen zu können, wurde ein frei verfügbares SWAT (SAS Scripting Wrapper for Analytics Transfer)-Paket entwickelt. Diese Scripting Wrapper erlauben eine Verbindung von einem Python-basierten Jupyter-Notebook mit der SAS Viya-Umgebung und die anschließende Nutzung der in SAS verfügbaren Daten.

Das SWAT-Paket enthält darüber hinaus weitere Funktionen und Routineverfahren für Machine Learning (ML) beziehungsweise Deep Learning. Hier hat sich SAS stark an gängigen Open Source Libraries wie sklearn orientiert und bietet verschiedenste ML-Verfahren wie Gradient Boosting oder auch Datenvorverarbeitungen an, aber auch komplexere Ansätze wie Convolutional Neural Networks (CNN) oder Recurrent Neural Networks (RNN). Darüber hinaus sind verschiedenste Bildvorverarbeitungsschritte für Image Recognition integriert:

Bei Nutzung der SWAT-Funktionen übernimmt SAS im Hintergrund automatisch die Skalierung und die Integration der Rechenprozesse in die verteilte Systemlandschaft. Ähnlich der Idee von Spark skaliert sich somit der (SWAT) Python Code, und es ist kein zusätzlicher Aufwand des Users notwendig, um die Nutzung der SWAT-Funktionen zu skalieren. Diese werden im Hintergrund in sogenannte Cloud Analytic Services (CAS) Actions übersetzt und entsprechend auf die SAS Viya Worker Nodes verteilt. Der Python Code kann bei Verwendung der SWAT-Funktionen somit leicht produktiv gesetzt werden, und die Verteilung der Rechenlast wird von SAS automatisch gesteuert. Des Weiteren haben inhaltsgleiche Skripte – unabhängig von ihrer Programmiersprache (R vs. Python) – die gleiche Laufzeit, was bei gängigen Programmen nicht der Fall ist.

SAS Viya trifft auf Open Source und Deep Learning Click To Tweet

Mit SAS Viya öffnet SAS auch SAS Visual Analytics (VA) für Open-Source-Anwendungen. Die VA-Berichte sind nun alle mit HTML5 umgesetzt, so dass sie einfacher erweitert und auch komplexe Abhängigkeiten hinterlegt werden können. Über den sogenannten Data Driven Content können vordefinierte JavaScript-Visualisierungen, wie D3-Charts oder ganze Formulare, die häufig frei verfügbar sind, in die VA-Berichte eingebunden werden. Auch die Interaktion mit der Datenbank ist unter SAS Viya einfacher als mit flashbasierten Visualisierungen und bietet die Möglichkeit zur Erstellung von Planungsanwendungen. In den VA-Berichten können Tabellen bequem editiert und (Aggregations-)Rechenprozesse gestartet werden. Somit sind die Ergebnisse von Planungsänderungen sofort im VA-Dashboard sichtbar.

SAS Viya als Tor zur Open-Source-Welt

Durch SAS Viya öffnet SAS seine Plattform und Lösungen also umfassend für Open-Source-Anwendungen und ermöglicht deren Integration in bestehende IT-Systeme. Entscheidend ist hier, dass der User sich nicht mehr zwischen SAS oder Open Source entscheiden muss, sondern eine Koexistenz beider Welten geschaffen wird – was maximale Vorteile für den User bietet.

D3-Chart: https://observablehq.com/@d3/hierarchical-edge-bundling

Sie möchten mehr darüber erfahren, wie SAS Viya und Open Source zusammenarbeiten? Gleich vormerken:  SAS Forum Live Stream aus Bonn am 5. Juni ab 9 Uhr.

Über den Autor: Alexander Buchwald arbeitet seit mehr als 6 Jahren für mayato. Er studierte an der Technischen Universität Berlin Wirtschaftsingenieurwesen und Betriebswirtschaft mit Schwerpunkt Chemieingenieurwesen, Statistik und maschinelles Lernen. Zu seinen Aufgaben bei mayato gehören Machine Learning und Data Engineering, insbesondere mit SAS. Er ist Experte darin, Geschäftsprozesse mittels maschinellem Lernen zu optimieren und weiterzuentwickeln.

Share

About Author

Gastbeitrag

Hier bloggen Experten/innen, die eine besondere Sicht auf ein Thema haben, und die nicht unbedingt mit SAS in Verbindung stehen. Mehrheitlich kreisen die Inhalte um Künstliche Intelligenz und wie Unternehmen diese einsetzen können. Aber auch die ethischen und gesellschaftlichen Implikationen können beleuchtet werden. Wenn auch Sie sich angesprochen fühlen, melden Sie sich gerne: andrea.deinert@sas.com oder rufen Sie an +49 (0) 173 70 399 05.

Related Posts

Leave A Reply

Back to Top