Diesen Sommer war ich in Griechenland und habe dort auch das Orakel von Delphi im Tempel des Apollon besucht. Unser Tourguide erzählte uns, dass das Orakel vom siebten Jahrhundert v. Chr. bis zum vierten Jahrhundert n. Chr. für Prophezeiungen konsultiert wurde. Das ist beeindruckend: Es ist vermutlich die erste und möglicherweise einzige „Prediction Engine“, die 1100 Jahre lang erfolgreich in Betrieb war – und je länger ich den Tempel betrachtete, desto mehr Parallelen zu Machine Learning kamen mir in den Sinn.
Wie funktioniert die erste dokumentierte „Predictive Engine“?
Sehen wir uns das Ritual etwas genauer an: Ratsuchende reisten zum Orakel und mussten zunächst Auskunft über Inhalt und Art ihrer Fragen geben – ganz ähnlich wie bei der Datenbereinigung heute. Anschließend wurden dem Orakel Geschenke überbracht. Wohl die erste Version von Results-as-a-Service, bei dem pro Anfrage bezahlt wird. Die Fragen richteten die Ratsuchenden an Pythia, eine Priesterin, die auf einem Dreifuß saß und Dämpfe aus einer Spalte im Boden des Tempels inhalierte. Die Dämpfe versetzten die Priesterin in einen anderen Bewusstseinszustand, so dass sie schließlich mithilfe übernatürlicher Kräfte Antworten auf die Fragen der Ratsuchenden geben konnte.
Jede Vorhersage ist in gewissem Maße unsicher – egal, ob sie nach Regeln von speziell dafür vorgesehenen Systemen, auf Basis von Machine-Learning-Modellen oder vom Orakel von Delphi getroffen wurde. #PredictiveAnalytics #ML Click To TweetKonfidenzintervall: die Unsicherheit der Prognosen angehen
Jede Vorhersage ist in gewissem Maße unsicher – egal, ob sie nach Regeln von speziell dafür vorgesehenen Systemen, auf Basis von Machine-Learning-Modellen oder vom Orakel von Delphi getroffen wurde. Wir Data Scientists quantifizieren diese Unsicherheit, indem wir Konfidenzintervalle um den erwarteten Wert berechnen. Dafür nutzen wir die Variabilität der bekannten Verteilung oder Ergebnisse von Monte-Carlo-Simulationen. Mit den Intervallen können wir bewerten, wie breit das Spektrum ist, in dem der Wert liegen kann.
Umgang mit Unsicherheit nach Pythias Art
Das Orakel von Delphi war recht geschickt, wenn es darum ging, falsche Vorhersagen zu vermeiden. Ein Beispiel: Krösus, König von Lydien, wollte einst vom Orakel wissen, ob er das persische Reich angreifen oder besser eine Allianz anstreben sollte. Er erhielt die Antwort, dass ein Angriff die Zerstörung eines Königreichs zur Folge hätte. Krösus, der die Ambiguität der Vorhersage nicht verstand, zog in den Kampf und wurde von Kyros, dem persischen Herrscher, besiegt – das zerstörte Königreich war sein eigenes. Und das Orakel von Delphi hatte letztlich recht!
Übertragen wir das Prinzip auf heute: „Die Marketingkampagne wird zu überraschenden Verkaufszahlen führen.“ Dabei kann ein Flop genauso „überraschend“ sein wie ein Verkaufshit – in beiden Fällen wäre die Vorhersage also zutreffend. Selbstverständlich können wir heute nicht nach diesem Prinzip vorgehen und Vorhersagen bewusst vage halten. Aber: Eine gewisse Unschärfe in der Prognose ist eben nicht neu und auch kein Nebeneffekt von Machine-Learning-Modellen. Unsicherheiten gab es schon immer, nur der Umgang mit ihnen war unterschiedlich.
Übertragung der Prognosen in Geschäftssprache
Und noch etwas fällt auf: Die finalen Prophezeiungen stammten nicht von Pythia selbst. Pythia artikulierte in ihrem (übersinnlichen) Bewusstseinszustand nur unverständliche Laute. Andere Priester mussten diese erst in sinnvolle, daktylische Hexameter „übersetzen“.
Und genau hier liegt eine weitere Parallele: Auch durch Machine Learning generierte Vorhersagen müssen in eine für Fachanwender verständliche Sprache übertragen werden. Das ist ein nicht zu vernachlässigender Schritt, wenn diese Prognosen tatsächlich zur Entscheidungsfindung dienen sollen.
Fun Fact: Parallelverarbeitung in der Antike
Übrigens: Mit zunehmender Bekanntheit reisten immer mehr Menschen nach Delphi, um Rat beim Orakel zu suchen, und eine Pythia reichte nicht mehr aus, um die Zahl der Anfragen zu „bearbeiten“. Also platzierte man drei Pythias über der Spalte, aus der die Dämpfe austraten, und konnte so mehreren Ratsuchenden gleichzeitig helfen, um das erhöhte Arbeitspensum der „Prediction Engine“ zu bewältigen – quasi die erste Parallelverarbeitung in der Geschichte.