Textanalyse - was ist ein Ber ? (SAS Adventskalender 10.Tür)

0

tuer10_blog

Wer es von Ihnen, liebe Leser, bis hierhin geschafft hat, herzlichen Glückwunsch! Und auch vielen Dank an die Engel, denn die rackern sich gerade ganz schön ab. Während wir uns innerlich auf den 24. Dezember vorbereiten und gemütlicher werden, drehen die Engel nochmals richtig auf. Heute überführt ein Algorithmus ein Kind in seine Eltern. Und heute macht sich das Christkind nochmal stark für eine gute Mitarbeiterbewertung. Und wir stellen die Frage: Textanalyse - was ist ein Ber ?

Die Wunschzettel flattern aus allen Kanälen ein. Die eingeteilten Engel freuen sich natürlich darüber, sie arbeiten, was das Zeug hält, aber die Sache gerät ins Stocken. Wünsche werden zwar in Windeseile gelesen, einem Kind zugeordnet und abgelegt. Die Engel schaffen und schaffen… aber irgendwie kommen sie nicht nach…

Liegt es am Alter der Engel? Werden die Wünsche der Kinder immer komplexer? Was auch immer dahinter stecken mag, das Christkind beobachtet mit sorgenvoller Miene, wie sie sich abmühen und abrackern. HALT: Das kann so nicht weitergehen!

Pling: Da fällt dem Christkind der Herr Mümeschmi ein. Hatte der nicht eine Text-Analytics-Lösung? Sprach der nicht in einem Nebensatz das hier: <<Damit kannst du auch Kommentare auswerten (s. Türchen 4)>>.

Na klar, dafür wurden doch aus den Texten automatisch geeignete Wörter extrahiert, da war der Mümeschmi doch total beseelt von! Das ist die Lösung. Müsste doch eigentlich ganz leicht sein, denn immerhin bestehen die Wunschzettel ja schon aus einzelnen Wörtern.

Das Christkind ruft: Bringt mir alle Wunschzettel her, die werfen jetzt in die Text-Analytics-Maschine, die mir der Einzelhändler als Ansichtsexemplar mitgegeben hat! Gesagt, getan. Deckel auf, Zettel rein, warten …… Die Maschine rattert nicht, sie brummt nicht, sie wackelt nicht, sie leuchtet nur ganz dezent an einer Stelle, sie liefert still und ruhig erste Ergebnisse und man ist schockiert:
10_12

Das Christkind schaut sich das Ergebnis an und beginnt, vor sich her zu schimpfen: „Na super! Wie soll uns das denn bitte weiter helfen?!? Das ist doch Mist. Fußbal und Fußball ist doch wohl dasselbe, und wenn sich Leo aus Dortmund 'ne Pocke wünscht,  meint er auch einen Fußball. Herrgott noch mal, das weiß doch jeder meiner Engel!!! Motzig rollt das Christkind die 30 Meter lange Papyrusrolle zusammen. Ich muss auf die Erde zu Herrn Mümeschmi. Das soll er mir mal erklären, warum er das so toll findet.“

„Herr Mümeschmi, schauen Sie doch mal hier. Ich habe versucht mit Ihrer tollen Text-Analytics-Maschine automatisiert die Wünsche der Kinder aus den Wunschzetteln herauszulesen. Und das kam dabei heraus. Hilft mir das? Nein!“

Der M: „Liebes Christkind, hast du denn die Wortstammbildung, die Schreibfehler- und die Synonymerkennung angewendet? Kennst du diese drei Verfahren überhaupt?
Es: „Ne, woher auch?“

„Pass auf“, Herr Mümeschmi beginnt mit seinem Vortrag, diesmal aber schläft das Christkind nicht ein. Es ist zu 100% bei der Sache. Es denkt an die anstehende Arbeitgeberbewertung und möchte gute Noten von seinen Engeln bekommen. Es liegt ihm also viel an der Arbeitserleichterung seiner Künstlertruppe und dass diese mit ihrem Arbeitsplatz zufrieden ist. Der Mümeschmi beginnt wie folgt: „Die Basis aller drei Verfahren ist das Finden einer Eltern-Kind-Beziehung (Parent-Child – Beziehung). Das Wort, das als Kind (Child) definiert ist, wird durch das Wort, das als Mutter (Parent) deklariert ist, ersetzt.

Fangen wir mit der Wortstammbildung an: Aus Ohrringe (Child) wird Ohrring (Parent) und aus Pferdchen (Child) wird Pferd (Parent). Um diese Funktion bei der Maschine einzustellen, musst du nur auf dieses Knöpfchen hier drücken, da, schau, hier - der Rest geht automatisch.

Und bei der Rechtschreibung überführt der Algorithmus quasi ein Kind in seine Eltern.“

Christkind: „Er macht was?!?!?“ Der M:  „Ja, der Algorithmus schaut, wie viele Schritte er braucht, um irgendein Wort (Child) in ein Wort aus dem Wörterbuch in der Maschine (Parent) zu überführen. Dann wird aus Fehrd Pferd, aus Ber Bär, aus Fußbal Fußball usw usf. Auch das macht deine Text-Analytics-Maschine von alleine.“

Christkind: „Und wie geht das bei den Synonymen?“

Der M: „Hier musst du ein wenig vorarbeiten. Du musst definieren, welches Wort das Synonym und welches das Parent-Wort ist. Du legst einmal für alle Zeiten fest, dass mit Pocke ein Fußball gemeint ist, mit Hottehüh ein Pferd und mit Teddy, Teddybär und Kuschelbär immer ein Bär gemeint ist, und alles läuft automatisch.“ Das Christkind ist mäßig beeindruckt. Kinder drücken sich ja nicht immer exakt aus. Es muss die Babysprache, die Jugendsprache, Kinder- und Kleinkindersprache jetzt erst mal definieren und mit der Erwachsenensprache abgleichen. Aber es reist trotzdem zufriedener zurück und freut sich schon auf eine tolle Bewertung, weil es sich so um seine Mitarbeiter kümmert.

Und so sieht das dann aus:
10_12_2

Perfekt!!! Die Engel jubeln und das Christkind ist erleichtert: Puh – das haben wir ja gut hinbekommen. Vielen Dank an die Erde und Herrn Mümeschmi!

Und was ist mit den Kindern, die sich gar nicht mehr trauen, einen Wunsch zu äußern, weil der Nikolaus ständig mit ihnen schimpft? Keine Angst, auch dafür hat das Christkind eine Lösung. Auch deren Wünsche werden berücksichtigt. Dazu lesen wir morgen mehr…

Share

About Author

Nicole Tschauder

Solutions Architect

Dr. Nicole Tschauder ist bei SAS im Competence Center Analytics tätig. Als Analytics Expert beschäftigt sie sich dort schwerpunktmäßig mit Predictive Analytics im Bereich Manufacturing sowie mit dem Thema „Analytics für Einsteiger“. Sie ist seit ca. 3 Jahren bei SAS. Vor dieser Zeit war sie an Technischen Universitäten als Mathematikerin mit Schwerpunkt Natur- und Ingenieurwissenschaften tätig und hat heute einen Lehrauftrag für Statistik an der Fachhochschule Ludwigshafen.

Leave A Reply

Back to Top