Trendanalyse - Christkind ist Data Scientist (SAS Adventskalender 12. Türchen)

0

tuer12_blog

Das Christkind kann sich nun bald bei SAS als Data Scientist bewerben. Was dem Christkind gestern noch als unlösbar erschien, ist für es jetzt ein Klacks. Beispiel: Die richtigen Geschenke für Kinder zu finden, die sich nichts wünschen …  Da es das nun drauf hat, kann es an die Verfeinerung gehen. Jetzt will es analysieren, über welche Produkte sich Kinder wie unterhalten! Es will herausfinden, was 2014 in war und was war es in 2015. Und es will die Trends für 2016 herausfinden!

Das Christkind hat eine Idee. Dieses Jahr will es jedem Kind noch eine besondere Freude machen. Ein Überraschungsgeschenk! Ein Geschenk, an das die Kinder beim Wünschen noch gar nicht dachten, das sie aber schon sehr bald gerne haben wollen würden. Das wär’s doch! Es braucht also eine Trendanalyse, wie sie Spielzeugfirmen nutzen, um ihr Angebot zu spezifizieren.

Die schauen damit auch in die Zukunft. So wissen sie, dass letztes Jahr zwar der Minecraft in war, es dieses Jahr aber der Quadrocopter oder Drohnen sein werden. Und natürlich, dass Star Wars wieder ein Thema sein wird. Diese Informationen verstecken sich natürlich in den Nachrichten, die sich die Kinder schreiben, das weiß das Christkind schon. Das heißt, das Christkind ist mit den Texten noch nicht durch. Textanalyse macht aber auch echt Spaß! Es gibt so viele Facetten. Heute geht es um Themen-Findung und darum, wie welche Themen in Texten bewertet werden. Es will aus den Texten erkennen können, wie über die Themen geredet wird. So eine Art „Wetten Dass“ - Wettthema …. Wetten, ich kann aus deinem Text erkennen, was du über welches Thema denkst?

Es schaut sich die Text-Analytics-Maschine vom Mümeschmi noch mal genau an und probiert einfach mal die restlichen Knöpfchen aus. Auf einem Knopf steht „Erkennung von Texten“ und auf einem anderen „Tonalitätsanalyse“ - das klingt doch vielversprechend. Das Christkind drückt und bekommt mal wieder Angst vor dem, was es sieht! Wo ist denn nur die Anleitung vom Mümeschmi? Ich muss langsam mal verstehen, was in dieser seltsamen Maschine vor sich geht. Das Christkind blättert sich durch das Büchlein. Hier ist es beschrieben:

Die Texte werden zuerst in ihre einzelnen Bestandteile, sprich in einzelne Begriffe zerlegt. Ein Begriff kann dabei ein einzelnes Wort oder auch fest zusammen hängende Wörter wie „a priori“ sein. Aha – hab ich verstanden…Anschließend fliegen Begriffe, die keinen Erklärungsgehalt haben (z.B. der, sein, haben, und, …) gleich mal raus.Das ergibt Sinn…

Dann wird geschaut, welche Gruppe von Begriffen in den Texten häufig gemeinsam auftreten und gleichzeitig selten mit anderen Begriffen vorkommen. So eine Gruppe ist dann ein Thema.

Interessant… Oh – hierzu gibt es ein Beispiel!

Analysiert man z.B. Tweets mit den Begriffen christmas und gift, so findet der Algorithmus automatisiert u.a. folgendes Thema:

12.12

Das Christkind lacht! Typisch Menschen, „beer“, „great gifts“ und „mensjournal“ nennen sie immer gemeinsam!Innerhalb eines Themas sind einzelne Begriffe mehr oder weniger wichtig, was mit der  unterschiedlichen Größe der Begriffe dargestellt wird. Das ist gut! Diese Maschine vom Mümeschmi macht mir immer mehr Spaß! Kinder twittern zwar nicht unbedingt, aber dafür habe ich ja andere Texte. Oh – es  geht noch weiter!

Wie wir hier sehen, hat das Thema sogar eine Tonalität zugeschrieben bekommen. Jetzt wird es spannend. Ich will ja nicht etwas verschenken, worüber die Kinder zwar reden, aber negativ. Aber wie kommt diese Maschine denn darauf?

Es gibt bestimmte Schlüsselwörter und Phrasen, die positiv oder negativ sind. „Problem“ ist z.B. negativ, „hervorragend“ und „großes Lob“ positiv. Mit kontext-sensitiven Regeln können innerhalb eines Textes verschiedene Unternehmen mit ihren jeweiligen genannten Produkten verknüpft werden. Anschließend können der Kombination aus Unternehmen und Produkten eine eigene Tonalität zugewiesen werden, indem die positiven und negativen Schlüsselwörter und Phrasen im Kontext von den Produkten gewichtet werden.

Perfekt! So kann aus einem Text von Emily erkannt werden, dass sie Furby und Monster High mittlerweile doof, aber Disney Violetta total toll findet. Genau das brauche ich!

Ob jetzt aber jedes Kind einfach dasselbe Überraschungsgeschenk bekommen sollte, oder auf was das Christkind bei der Zuteilung achten wird, das sehen wir, wenn die Engel sich wieder an die Arbeit machen.

Share

About Author

Nicole Tschauder

Solutions Architect

Dr. Nicole Tschauder ist bei SAS im Competence Center Analytics tätig. Als Analytics Expert beschäftigt sie sich dort schwerpunktmäßig mit Predictive Analytics im Bereich Manufacturing sowie mit dem Thema „Analytics für Einsteiger“. Sie ist seit ca. 3 Jahren bei SAS. Vor dieser Zeit war sie an Technischen Universitäten als Mathematikerin mit Schwerpunkt Natur- und Ingenieurwissenschaften tätig und hat heute einen Lehrauftrag für Statistik an der Fachhochschule Ludwigshafen.

Leave A Reply

Back to Top