Maschinelles Lernen wird mehr und mehr zum Mainstream. Was früher eine reine Domäne der wissenschaftlichen Forschung von wenigen Technologieunternehmen war, findet zunehmend Eingang in Produkte und Lösungen auch in traditionellen Branchen.
Maschinelles Lernen nutzt mathematische (und/oder statistische) Modelle, um aus Datenbeständen zu lernen. „Lernen“ bedeutet in diesem Kontext die Annäherung an Kurven oder Hyperebenen, und zwar ohne die üblichen statistischen Überlegungen bzgl. der zugrunde liegenden Verteilungen oder der Unterschiede zwischen verschiedenen Stichproben in Betracht zu ziehen. Die Methoden des maschinellen Lernens gehen mit diesen Aufgaben in einer anderen Weise um.
Vor diesem Hintergrund mag es überraschen, dass solche Modelle des maschinellen Lernens durchaus in der Lage sind, präzise Prognosen für neue Daten zu erstellen – sogar dann, wenn die untersuchten Eigenschaften nur sehr selten vorkommen oder einen nichtlinearen Charakter haben.
Genau aus diesem Grund nutzen insbesondere Unternehmen aus Finanzdienstleistung, Handel, Logistik oder der Sicherheitsbranchen diese selbstlernenden Methoden. Eignen sich Machine Learning Methoden auch für Ihre Fragestellungen?
Das hängt stark von der Zielsetzung ab. Wer maschinelles Lernen mit traditionelleren, regressionsbasierten Methoden vergleicht, wird feststellen, dass die meisten Modelle des maschinellen Lernens nur schwer interpretiert werden können. Deshalb eignet sich maschinelles Lernen eher für Anwendungen, in denen die reine Prognosegenauigkeit wichtiger ist, als die Interpretation der Modelle. Maschinelles Lernen kommt auch dann in Frage, wenn die Datenquellen mehr Variablen als Datensätze, viele korrelierte Variablen, unstrukturierte Daten oder auch nichtlineare Effekte enthalten.
Predictive modeling auf der Basis von maschinellem Lernen entscheidet sich grundsätzlich vom herkömmlichen Prozess, bei dem Wissen mit Hilfe eines Regressionsmodells gewonnen wird. Manche Fachleute haben Bedenken, Faktoren wie die Verifizierung von Annahmen oder die Interpretatierbarkeit zugunsten der Prognosegenauigkeit aufzugeben.
Meine Empfehlung: Trauen Sie sich! Versuchen Sie erst gar nicht, die undurchdringlichen Zusammenhänge von neuronalen Netzen im Detail nachzuvollziehen. Stellen Sie nur sicher, dass die Generalisierbarkeit Ihres Modells auf andere Daten gewahrt bleibt. Zerbrechen Sie sich nicht den Kopf über jeden einzelnen Ast eines Entscheidungsbaums, sondern trainieren Sie lieber viele Entscheidungsbäume und nutzen Sie die Ergebnisse als „Random Forest“. Ich könnte noch viele weitere Beispiele nennen – aber viel eleganter als ich die Unterschiede zwischen maschinellem Lernen und Statistik hier darlege, hat dies Leo Breiman bereits 2001 in seinem bahnbrechenden Aufsatz “Statistical Modeling: The Two Cultures” beschrieben. Wenn Sie sich für die grundlegenden Ideen des maschinellen Lernens interessieren, dann sollten Sie diesen Text lesen.
Wenn Sie sich für mehr Details zum Thema interessieren, möchte ich Ihnen auch das Webinar „Machine Learning: Principles and Practice“ meines Kollegen Patrick Hall empfehlen. In diesem Webinar umreißt er einige grundlegende Prinzipien des maschinellen Lernens und zeigt anhand von Beispielen, wie sich diese Methode in der Praxis einsetzen lässt. Es werden Webinare folgenden, die sich einzelnen Techniken des maschinellen Lernens widmen.