Σ ξ ζ       statistik hilfe

statistik hilfe: do it yourself

Datentabellen

zurück

Datenerfassung in Tabellenform

Der Tabellenaufbau

Für eine effektive Auswertung erhobener Daten ist es, nicht nur in Fragebogenauswertungen, von entscheidender Bedeutung, die Tabelle der Daten sinnvoll aufzubauen. Für jede Größe wird genau eine Tabellenspalte verwendet. Jede Tabellenspalte trägt genau einen Tabellenkopf, der die verwendete Größe eindeutig, sinnvoll und verständlich bezeichnet.

Umlaute und Bezeichnungen, die länger als 12 Zeichen sind, sind zu vermeiden. Dies kann zu Darstellungsproblemen – insbesondere in Grafiken – führen.

Mehrdeutigkeiten sind in jedem Falle zu vermeiden. Ein häufiger Fehler in diesem Zusammenhang sei zunächst dargestellt:

Beispiel: Die Obstpreise vor und nach einem bestimmten politischen Ereignis seien zu untersuchen. Die Messgrößen seien also die Obstart, der Preis und der Zeitpunkt der Preiserhebung.

Ein typisches, falsches Vorgehen wäre dann ein Tabellenaufbau

Obstart Preis
vorher nachher
Apfel 2,00 3,00
Birne 5,00 6,00

Der erste Fehler findet sich in den mehrfachen Tabellenköpfen. Die Zusammenfassung mehrerer Kopfzeilen zu einer Zeile behebt diesen Fehler:

Obstart Preis vorher Preis nachher
Apfel 2,00 3,00
Birne 5,00 6,00

Hier wird dann noch fälschlich die Größe 'Preis' auf zwei Spalten verteilt, die Größe 'Zeit' hingegen fortgelassen. Da die Zeit hier als qualitative Größe mit den Ausprägungen {vorher; nachher} oder als quantitative Größe verstanden werden kann, gibt es zwei Möglichkeiten, eine Datenspalte 'Zeit' zu gestalten. Die quantiative Sicht ermöglicht jedoch – insbesondere in zukünftigen weiteren Messungen – mehr Auswertungsmöglichkeiten und wird daher bevorzugt.

Damit ergeben sich dann korrekt die drei Datenspalten:

Obstart Preis Zeit [Jahr]
Apfel 2,00 13
Apfel 3,00 14
Birne 5,00 13
Birne 6,00 14

Eine Alternative, die die Zeit nur qualitativ verwendet – und daher nicht empfohlen wird – wäre die Darstellung:

Obstart Preis Zeit
Apfel 2,00 v
Apfel 3,00 n
Birne 5,00 v
Birne 6,00 n

Der Tabelleninhalt

Auch der Inhalt einer jeden Tabellenzelle muss eindeutig sein. Dabei ist es unerheblich, ob der Inhalt eine quantitative oder eine qualitative Größe ist.

Ein Beispiel eines inkorrekten Inhalts sei etwa in einer Tabelle von Empfindungen nach einer Freizeitaktivität dargestellt:

Freizeitaktivität Empfindung
Shopping Hunger, Durst
Fallschirmspringen
Wandern Hunger

Hier werden zwei Empfindungen in einer Spalte genannt. Damit gibt es mehrdeutige Tabelleninhalte, die nicht sinnvoll auswertbar sind!

Auch hier wird wieder je eine Spalte für eine Empfindung erstellt. Natürlich dürfen auch Begriffe zu einem Oberbegriff zusammen gefasst werden. So können etwa Begriffe wie 'langes Schlafen' und 'lange Ausruhen' in bestimmten Fragestellungen als 'Erholen' zusammen gefasst werden...

Für das Beispiel der Empfindungen ergeben sich hier zwei Spalten, deren Inhalte mit {'ja', 'nein', leer} gefüllt sein können (leer würde dann für 'keine Daten' stehen):

Freizeitaktivität Hunger Durst
Shopping ja ja
Fallschirmspringen nein nein
Wandern ja nein

Anmerkung: Ein Eintrag 'ja' wird gelegentlich auch durch eine '1' codiert. Ein 'nein' kann auch über eine '0' codiert werden. Die Verwendung von Zahlen in logischen Aussagen ist aber nicht empfehlenswert, da es zu Fehlinterpretationen kommen kann. Es kann fälschlich zum Anschein einer numerischen Eigenschaft kommen. Logische Zustände {'ja', 'nein'} sind aber Klasseneigenschaften, also qualitative Daten.

hmm, zurück
ok, weiter


Ein Beispiel dafür, wie eine bereits bestehende Datentabelle in die richtige Form gebracht werden kann, findet sich hier.