Datenerfassung in Tabellenform
Der Tabellenaufbau
Für eine effektive Auswertung erhobener Daten ist es, nicht nur in Fragebogenauswertungen, von entscheidender Bedeutung, die Tabelle der Daten sinnvoll aufzubauen. Für jede Größe wird genau eine Tabellenspalte verwendet. Jede Tabellenspalte trägt genau einen Tabellenkopf, der die verwendete Größe eindeutig, sinnvoll und verständlich bezeichnet.
Umlaute und Bezeichnungen, die länger als 12 Zeichen sind, sind zu vermeiden. Dies kann zu Darstellungsproblemen – insbesondere in Grafiken – führen.
Mehrdeutigkeiten sind in jedem Falle zu vermeiden. Ein häufiger Fehler in diesem Zusammenhang sei zunächst dargestellt:
Beispiel: Die Obstpreise vor und nach einem bestimmten politischen Ereignis seien zu untersuchen. Die Messgrößen seien also die Obstart, der Preis und der Zeitpunkt der Preiserhebung.
Ein typisches, falsches Vorgehen wäre dann ein Tabellenaufbau
Obstart | Preis | |
vorher | nachher | |
Apfel | 2,00 | 3,00 |
Birne | 5,00 | 6,00 |
Der erste Fehler findet sich in den mehrfachen Tabellenköpfen. Die Zusammenfassung mehrerer Kopfzeilen zu einer Zeile behebt diesen Fehler:
Obstart | Preis vorher | Preis nachher |
Apfel | 2,00 | 3,00 |
Birne | 5,00 | 6,00 |
Hier wird dann noch fälschlich die Größe 'Preis' auf zwei Spalten verteilt, die Größe 'Zeit' hingegen fortgelassen. Da die Zeit hier als qualitative Größe mit den Ausprägungen {vorher; nachher} oder als quantitative Größe verstanden werden kann, gibt es zwei Möglichkeiten, eine Datenspalte 'Zeit' zu gestalten. Die quantiative Sicht ermöglicht jedoch – insbesondere in zukünftigen weiteren Messungen – mehr Auswertungsmöglichkeiten und wird daher bevorzugt.
Damit ergeben sich dann korrekt die drei Datenspalten:
Obstart | Preis | Zeit [Jahr] |
Apfel | 2,00 | 13 |
Apfel | 3,00 | 14 |
Birne | 5,00 | 13 |
Birne | 6,00 | 14 |
Eine Alternative, die die Zeit nur qualitativ verwendet – und daher nicht empfohlen wird – wäre die Darstellung:
Obstart | Preis | Zeit |
Apfel | 2,00 | v |
Apfel | 3,00 | n |
Birne | 5,00 | v |
Birne | 6,00 | n |
Der Tabelleninhalt
Auch der Inhalt einer jeden Tabellenzelle muss eindeutig sein. Dabei ist es unerheblich, ob der Inhalt eine quantitative oder eine qualitative Größe ist.
Ein Beispiel eines inkorrekten Inhalts sei etwa in einer Tabelle von Empfindungen nach einer Freizeitaktivität dargestellt:
Freizeitaktivität | Empfindung |
Shopping | Hunger, Durst |
Fallschirmspringen | |
Wandern | Hunger |
Hier werden zwei Empfindungen in einer Spalte genannt. Damit gibt es mehrdeutige Tabelleninhalte, die nicht sinnvoll auswertbar sind!
Auch hier wird wieder je eine Spalte für eine Empfindung erstellt. Natürlich dürfen auch Begriffe zu einem Oberbegriff zusammen gefasst werden. So können etwa Begriffe wie 'langes Schlafen' und 'lange Ausruhen' in bestimmten Fragestellungen als 'Erholen' zusammen gefasst werden...
Für das Beispiel der Empfindungen ergeben sich hier zwei Spalten, deren Inhalte mit {'ja', 'nein', leer} gefüllt sein können (leer würde dann für 'keine Daten' stehen):
Freizeitaktivität | Hunger | Durst |
Shopping | ja | ja |
Fallschirmspringen | nein | nein |
Wandern | ja | nein |
Anmerkung: Ein Eintrag 'ja' wird gelegentlich auch durch eine '1' codiert. Ein 'nein' kann auch über eine '0' codiert werden. Die Verwendung von Zahlen in logischen Aussagen ist aber nicht empfehlenswert, da es zu Fehlinterpretationen kommen kann. Es kann fälschlich zum Anschein einer numerischen Eigenschaft kommen. Logische Zustände {'ja', 'nein'} sind aber Klasseneigenschaften, also qualitative Daten.
Ein Beispiel dafür, wie eine bereits bestehende Datentabelle in die richtige Form gebracht werden kann, findet sich hier.