Kann ich etwas für Sie tun? Sechs Beispiele für hilfreiche Data-Science-Methoden

0

Der Sales Manager kann sich bezüglich des zu erwartenden Jahresergebnisses doch nicht so in Sicherheit wiegen, wie er dachte.

Hans Huber aus unserem Callcenter hat eine höhere Wahrscheinlichkeit zu kündigen als Petra Hafner aus dem Controlling.

Die Transaktionsverläufe der Kunden 42911, 85022 und 91294 passen ja gar nicht zu deren Vergleichsgruppe. Wie kommt das?

Resultate, Aussagen und Erkenntnisse: genau das, was wir von der Datenanalyse erwarten. Den Altersdurchschnitt pro Kundensegment kann heute praktisch schon jeder ausrechnen. Für wichtige Entscheidungen brauchen wir aber mehr. Werfen wir doch einmal den Blick auf Erkenntnisse, die wir ausschließlich durch Data-Science-Methoden erhalten.

In meinem letzten Blog habe ich vorgestellt, welche Vorteile Advanced Analytics und Data-Science-Methoden bringen. In diesem Blog gehen wir einen Schritt weiter und werfen einen Blick auf Beispiele, wo diese Methoden Ihnen relevante Einblicke bringen.

Genau hier ist es passiert!

Zeitverläufe spiegeln Entwicklungen und Trends in Ihren Geschäftsprozessen und im Verhalten Ihrer Kunden wider. Data-Science-Methoden erlauben Ihnen herauszufinden, zu welchen Zeitpunkten sich der Zeitverlauf markant ändert. Und welche Einzelwerte weit vom erwarteten Wert entfernt sind und so als Ausreißer bezeichnet werden können. „Die Häufung der Ereignisse im Monat März sind auffällig“, „Warum ändern die Kunden Ihr Verhalten hier?“.

Unsere Daten sprechen zu uns

Mit Unsupervised-Machine-Learning-Methoden wie der Assoziationsanalyse ist es möglich, Zusammenhänge nach unterschiedlichen, vorher nicht explizit festgelegten Gesichtspunkten zu entdecken. Diese Methoden finden automatisch Regeln wie „nur 2,6 % der Sportwagen werden von Männern gefahren“. Und das ist um mehr als das 15fache weniger als man auf Basis der Geschlechtsverteilung und der Sportwagenhäufigkeit erwartet hätte.“

So erhält man eine Liste von Merkmalskombinationen zu seinen Daten, die nach „Auffälligkeit“ sortiert ist.

Wer hält sich an die Muster?

In der Betrugsanalyse wird häufig das Benford’sche Gesetz angewandt, um Counterparts zu identifizieren, deren Transaktionswerte weit von jenen abweichen, die man bei zufälliger Verteilung erwarten würde. Diese Idee kann auch verallgemeinert werden, indem man saisonale oder regionale Verteilungen vorgibt und die Analyse-Subjekte bzgl. der Anpassung an diese Verteilung ordnet. Man erhält so eine sortierte Liste, die man, beginnend vom Kunden mit der größten Abweichung, abarbeiten kann.

Wird der Sales Manager seinen Job behalten? Mehr Prognosesicherheit mit Monte-Carlo-Simulationen

Entscheidungen und Vorhersagen sind oftmals von einer gewissen Unsicherheit begleitet. Um den erwarteten Outcome besser einordnen zu können, werden häufig Monte-Carlo-Simulationen durchgeführt. Diese geben zum Beispiel ein Bild zur erwarteten Verteilung der Outcome-Werte und bieten deutlich bessere Einblicke als das Berechnen des „gewichteten Mittelwerts“.

 

Auch Fehler lassen sich sinnvoll nutzen

Statistische Vorhersagen treffen den tatsächlichen Wert nicht immer ganz genau, sondern sind auch mit Abweichungen und Fehlern behaftet. Oft wird diese Abweichung als Fehlerrate berechnet und für historische Perioden dokumentiert. Analytische Methoden wie Regressionsverfahren erlauben es aber, hier einen detaillierten Einblick in die Zusammenhänge zu geben und zu lernen, bei welchen Kombinationen von Einflussgrößen die Abweichung besonders groß ist. Diese Erkenntnisse können sowohl in die Erstellung als auch in die Anwendung der Forecasts einfließen.

Kündigt mein Mitarbeiter schon morgen oder erst in einem Jahr?

Bei der Beobachtung von Zeitdauern kann es vorkommen, dass manche Ereignisse bereits stattgefunden haben („beobachtet“ sind), andere Ereignisse aber (noch) nicht stattgefunden haben („zensiert“ sind). Eine mittlere Zeitdauer kann hier nicht mit herkömmlichen Methoden berechnet werden. Die Kaplan-Meier-Methode kann auch Zeitintervalle korrekt verwenden, die nicht vollständig beobachtet sind. So können mittlere Verweildauern von Kunden und Mitarbeitern und das Ereignis-Risiko (Hazard) zu unterschiedlichen Zeitpunkten geschätzt werden.

Weitere Beispiele und Details zu diesen Themen finden Sie in meinem Buch „Applying Data Science – Business Case Studies Using SAS“ – und in meinen nächsten Blogs.

Share

About Author

Gerhard Svolba

Principal Solutions Architect

Dr. Gerhard Svolba ist Analytic Solutions Architect und Data Scientist bei SAS Institute in Österreich. Er ist in eine Vielzahl von analytischen und Data Science Projekten quer über fachliche Domains wie Demand Forecasting, analytisches CRM, Risikomodellierung und Produktionsqualität involviert. Seine Projekterfahrung reicht von der fachlichen und technischen Konzeption über die Datenaufbereitung und die analytische Modellierung in unterschiedlichen Branchen. Er ist der Autor der SAS Press Bücher Data Preparation for Analytics Using SAS, Data Quality for Analytics Using SAS and “Applying Data Science: Business Case Studies Using SAS”. Als nebenberuflich Lehrender unterrichtet er Data Science Methoden an der Medizinischen Universität Wien, der Universität Wien und an Fachhochschulen. Sie finden auch Beitrage auf: Github und Twitter. ENGLISH: Dr. Gerhard Svolba ist Analytic Solutions Architect und Data Scientist bei SAS Institute in Österreich. Er ist in eine Vielzahl von analytischen und Data Science Projekten quer über fachliche Domains wie Demand Forecasting, analytisches CRM, Risikomodellierung und Produktionsqualität involviert. Seine Projekterfahrung reicht von der fachlichen und technischen Konzeption über die Datenaufbereitung und die analytische Modellierung in unterschiedlichen Branchen. Er ist der Autor der SAS Press Bücher Data Preparation for Analytics Using SAS®, Data Quality for Analytics Using SAS® and “Applying Data Science: Business Case Studies Using SAS”. Als nebenberuflich Lehrender unterrichtet er Data Science Methoden an der Medizinischen Universität Wien, der Universität Wien und an Fachhochschulen. Sie finden auch Beitrage auf: Github und Twitter.

Leave A Reply

Back to Top