Data-Science-Plattformen müssen vielen Anforderungen gerecht werden. Ihre Aufgaben sind relativ genau definiert – und die Erwartungen, die Unternehmen mitbringen, oft sehr hoch. Darüber hinaus sind die Anwendergruppen alles andere als homogen. Dieser Blog erläutert, was insbesondere IT-Entscheider erwarten.
Was ist eine Data-Science-Plattform? Die Antwort ist einfach: Sie dient dazu, Erkenntnisse aus allen Unternehmens-Daten zu gewinnen. Sie soll also das Potenzial haben, mittels analytischer Methoden Einblicke zu liefern, die die zukünftige Unternehmensstrategie (mit)bestimmen. Data-Science-Plattformen bilden darum alle Phasen des analytischen Lebenszyklus ab – Datenmanagement, Erkenntnisgewinn und Implementierung. Die besten Plattformen sind zudem von ihrer technischen Umgebung unabhängig. Das bedeutet, dass sie gleich gut funktionieren, egal, wo sie zum Einsatz kommen.
Erwartungen von IT-Entscheidern
IT-Entscheider haben unterschiedliche Ansprüche an Data-Science-Plattformen. Die folgenden zehn sind am häufigsten:
- Einfache Implementierung. Plattformen sollten sowohl in der Cloud als auch on-premises betrieben werden können. Auch Hybrid-Architekturen sind durchaus gängig, darum ist ein schneller und einfacher Rollout besonders wichtig, denn auch etwaige Änderungen müssen schnell vollzogen werden können.
- Elastizität. Plattformen müssen kosteneffizient und performance-optimal funktionieren und gemäß aktueller Anforderungen wachsen und schrumpfen. Die Kosten-Nutzen-Rechnung muss dauerhaft stimmen, sonst wird wahrscheinlich bald in eine andere Plattform investiert.
- Zuverlässigkeit und Performance. IT-Entscheider müssen sicher sein, dass die Plattform zuverlässig funktioniert – sowohl in Bezug auf Stabilität als auch auf Performanz. Ergebnisse müssen genau dann geliefert werden, wenn sie benötigt werden.
- Betrieb und Automatisierung. IT-Entscheider bevorzugen Plattformen, die einfach zu betreiben sind und die einen hohen Automatisierungsgrad bieten. Oft werden innerhalb von sehr kurzer Zeit unzählige analytische Modelle entwickelt und getestet. Ein entsprechendes Inventar und Model-Management zur Validierung und Produktiv-Setzung sind darum unerlässlich.
- Transparenz, Nachvollziehbarkeit und Monitoring – kurz Governance. Eine zukunftssichere Data-Science-Plattform liefert diese Tools standardmäßig.
- Sicherheit und Compliance. Diese Anforderungen sind eng mit Betrieb und Governance gekoppelt, beinhalten aber auch Datenschutz, Sicherheit, ethische Richtlinien und den Code of Conduct. Diese liegen ebenso im Verantwortungs- beziehungsweise Kontrollbereich der IT. Deshalb muss man sicherstellen, dass die Plattform auch diese Punkte erfüllt.
- Wiederverwendbarkeit und Portabilität. Diese Eigenschaften sind ebenfalls mit Verwaltungsaspekten wie Transparenz und Nachvollziehbarkeit verknüpft. Sie erlauben Nutzern, bestehende Assets (Modelle, Reports, Data-Flows, Code) über Abteilungen und Umgebungen (Datenbank, Data-Lake, Stream) hinweg zu teilen und wiederzuverwenden.
- Offenheit und Integrierbarkeit. Plattformen müssen integrierbar und flexibel um zusätzliche Apps erweiterbar sein. Das gilt auch für Drittanbieter und natürlich Open-Source-Software. Stehen solche Optionen zur Verfügung, verbessert das die Usability und die Funktionalität der Plattform.
- Funktionalität und Self-Service. Plattformen sollten möglichst viele verschiedene Nutzungsmöglichkeiten bieten. Dazu gehören beispielsweise unterschiedliche Algorithmen oder Arbeitsoberflächen, die sich an den Bedürfnissen entsprechender Nutzergruppen orientieren. Insbesondere Self-Service-Oberflächen ist diesbezüglich gerade in aller Munde. Das Aufgabenfeld der IT erweitert sich laufend, deshalb kann sie nicht ständig Sandbox-Projekte betreuen. Damit die IT-Abteilung nicht unnötig belastet wird, sollten Data-Science-Plattformen auch Fachabteilungsnutzern einfache Möglichkeiten zur Datenaufbereitung und Exploration bieten.
- Nutzbarkeit und Accessibility. Eine der wichtigsten Anforderungen an Plattformen: Die Nutzer müssen sie einfach annehmen und nutzen. Das kann leider vor der Implementierung nie mit Sicherheit garantiert werden. Dennoch sollten Entscheider davon ausgehen können, dass die Plattform zugänglich und bedienbar ist, sodass die Anwender darin arbeiten und das finanzielle und zeitliche Investment der IT-Abteilung legitimieren.
Diese Anforderungen gehen teilweise ineinander über. Die tatsächliche Plattformnutzung hängt von vielen Puzzleteilen ab: Neben Performance spielen auch Funktionalität, Verlässlichkeit und Zugänglichkeit eine Hauptrolle. Die Bereiche Verwaltung, Sicherheit und Compliance sind außerdem sehr bedeutend und zudem eng miteinander verzahnt. Trotzdem ist es sinnvoll, alle Komponenten zunächst für sich zu bewerten – das liefert eine klare Beurteilung der einzelnen Bereiche und garantiert im Endeffekt, dass die gewählte Data-Science-Plattform optimal zu den Erwartungen des Unternehmens passt.
Eine offene Analyseplattform erweitert Open-Source-Technologien um Governance und Skalierbarkeit. Erfahren Sie mehr.