Einfachere Datenaufbereitung – weniger Langeweile

0

Am 24. März wurde Release 12 der statistischen Desktop Software von SAS Institute veröffentlicht. Neben erweiterten statistischen Analysemöglichkeiten und Datenaufbereitung, die man schließlich von solcher Software erwartet, haben die Entwickler um John Sall einige Hilfsfunktionen eingebaut, die wenig spektakulär daherkommen aber wesentlich zur Erleichterung der Arbeit mit Daten beitragen können. Die Schätzungen darüber, wieviel der gesamten Analysezeit für Datenaufbereitung verwendet wird reichen von 40% bis 90%, Konsens ist aber, dass dieser Anteil wesentlich ist und dass niemand diese Arbeit gerne macht. Nehmen wir die Arbeit mit Textfeldern.

Unterschiedliche Schreibweisen, Datenerfassung unter Zeitdruck, verschieden Abkürzungen, alles führt zu unterschiedlichen Einträgen für dieselbe Sache. Die Standardisierung der Groß-/Kleinschreibung, oder das Eliminieren überflüssiger Leerzeichen passieren per Mausklick. Die Funktion zum neu Kodieren findet diese unterschiedlichen Schreibweisen, gruppiert sie und eröffnet die Möglichkeit, einen einheitlichen Begriff zu verwenden. Wie sensibel oder umfassend JMP die Gruppen bilden soll kann der Anwender in einem Dialog vorgeben.

Wenn bei einer Umfrage Menschen gebeten werden Dinge aufzulisten, z.B. welche Analysesoftware sie einsetzen, dann werden die Antworten meist als Komma getrennte Liste aufgenommen. Wenn die Reihenfolge keine Wertigkeit darstellt, dann sind die beiden nebenstehend aufgeführten Listen gleichwertig, würden bei einer Auszählung aber unterschiedliche behandelt. Mit der „Text in Spalten“ Funktion kann man die einzelnen Elemente trennen und in alphabetischer Reihenfolge wieder zusammenfügen. Dann sind beide Einträge gleichbedeutend.

Ausreißer können Datenanalysen massiv beeinflussen. Aber es ist oft schwierig zu entscheiden, ob eine Beobachtung, die etwas weiter weg vom Mittelwert liegt, nun tatsächlich eine atypische Beobachtung darstellt oder durchaus im Rahmen der angestellten Messungen möglich ist. JMP12 stellt nun ein komplettes Schaltpult zum Erkennen von Ausreißern zur Verfügung. Hat man einmal ein angepasstes Verfahren erarbeitet, stehen verschiedenen Optionen zur Behandlung der Werte zur Verfügung, die von farblicher Markierung bis zum vollständigen Ausschluss reichen.

 

Ich möchte an dieser Stelle nur auf einige der neuen Helferlein eingehen. Im ersten Bild sehen Sie die Liste der nun verfügbaren Funktionen. Sie wollen sich auch die Arbeit erleichtern, oder sind einfach neugierig geworden? Schauen Sie mal nach: jmp.com

 

 

Tags
Share

About Author

Bernd Heinen

Sr Systems Engineer JMP

Mehr Informationen über JMP finden Sie hier: www.jmp.com/de

Leave A Reply

Back to Top