In der heutigen Zeit macht es immer weniger Sinn, gigantische Datenmengen über das Netzwerk in ein Auswertetool zur Analyse zu übertragen. Der Geschwindigkeitsvorteil einer hoch performanten statistischen Analyse von riesigen Datenmengen wird durch die lange Datenübertragung dieser riesigen Datenmengen wieder zunichtegemacht. An diesem Punkt müssen andere Technologien angewendet werden, um diesen Flaschenhals zu umgehen. Warum also nicht die Analyse zu den Daten bringen mittels SAS In-Database-Verarbeitung?
Mit den SAS/ACCESS Schnittstellen ist es schon länger möglich, SQL-Code aus SAS heraus per Pass-Through-Anweisung in Datenbanken auszuführen. Hierbei können auch datenbankspezifische SQL-Anweisungen ausgeführt werden. Die i. d. R. kleinen Ergebnismengen können dann über das Netzwerk zur weiteren Verarbeitung übertragen werden oder verbleiben ebenfalls in der Datenbank.
Mittels SQL-Code lassen sich aber anspruchsvolle analytische Abfragen, wie es mit der SAS Abfragesprache möglich ist, nicht umsetzen. Leider verstehen auch die Datenbanken wiederum kein SAS. Um dennoch den heutigen analytischen Anforderungen im Big-Data-Zeitalter gerecht zu werden, wurde die SAS Abfragesprache zum Data Step 2 oder kurz DS2 weiterentwickelt.
Verschiedene sogenannte „Accelarator“-Schnittstellen stehen von SAS zur Verfügung und werden als „Embedded Process“ in der Datenbank installiert. Der Embedded Process fungiert dabei als Übersetzer zwischen SAS und der Datenbank und ermöglicht so die Ausführung von spezifischen SAS Funktionalitäten direkt in der Datenbank:
Scoring Accelerator: Ausführung von Score-Code
Code Accelerator: Ausführung von DS2-Code
DQ Accelerator: Ausführung von Datenqualitätsfunktionen
Welche SAS Accelerators für welche Datenbanken zur Verfügung stehen, kann der folgenden Tabelle entnommen werden:
Weitere Infos hier