Σ ξ ζ       statistik hilfe & info

statistik hilfe: Interpretation

ANOVA

ANOVA Varianztests

Werden Messungen verglichen, so stellt sich die Frage nach Gleichheit oder Unterschiedlichkeit dieser Messungen...

Der Vergleich zwischen mehreren Datenklassen wird in den ANOVA-Klassentests (Analysis Of Variance) durchgeführt. Eine verbreitete deutschsprachige Bezeichnung hierfür ist Varianzanalyse.

Die grafische Darstellung eines ANOVA-Tests

In der Grafischen Darstellung einer Untersuchung auf Unterschiede oder Gleichheit mehrerer Datenklassen werden stets Balkendiagramme verwendet. Ein jeder Balken stellt dabei die gemessene quantitative Eigenschaft durch seine Höhe (als Mittelwert) dar. Sofern die Daten mehrfach gemessen wurden, lässt sich auch eine Standardabweichung angeben. Diese Standardabweichung misst den Streubereich der Daten, sie wird in kleinen Zusatzbalken dargestellt. (In einfacheren Grafiken wird an Stelle eines Zusatzbalkens auch nur ein Strich verwendet).

Achtung: Die Streuung der Daten wird als Standardabweichung (Quadratwurzel aus der Varianz) angegeben, dies ist nicht der Bereich einer tatsächlichen Datenstreuung, sie ist vielmehr ein (sinnvolles) mathematisches Maß der Datenstreuung.

Es liegen ca. 68% der Daten innerhalb der einfachen Standardabweichung um den Mittelwert. Innerhalb der zweifachen Standardabweichung finden sich dann ca. 95% der Daten.

Eine korrekte Datenerhebung wird hier vorausgesetzt. Ein Chi-Quadrat-Test auf korrekte Zufallsverteilung der Daten ist also vorab sinnvoll. Mindestens jedoch ist für eine jede Datenklasse zu prüfen, ob das Quadrat der Standardabweichung (die Varianz) kleiner oder gleich dem Mittelwert ist – für größere Standardabweichungen sind die Daten sicher nicht zufallsverteilt und daher als unzureichend erhoben anzusehen! (Der Beweis findet sich hier)

Lassen sich keine Unterschiede in benachbarten – und zu vergleichenden – Klassen nachweisen, so wird in der grafischen Darstellung ein verbindender horizontaler Balken (als Symbol der Gleichheit) verwendet. Lassen sich hingegen keine Gleichheiten nachweisen (d.h.: die Unterschiedlichkeit muss angenommen werden), wird ein solcher verbindender Balken nicht verwendet.

Im Beispielgrafen sind die Klassen A–C sowie B–D zu gemeinsamen Klassen gruppiert. Es sind also die Datenklassen A–C als nicht unterschiedlich sowie die Datenklassen B–D als nicht unterschiedlich anzusehen. Zwischen diesen beiden Gruppierungen A–C und B–D bestehen dagegen Unterschiede.

Die mathematische Darstellung eines ANOVA-Tests

In der Datenanalyse wird – sofern möglich – eine Tabelle der zusammengefassten Daten angegeben. Dazu gehören dann die Mittelwerte (mean) und die Standardabweichungen (std. dev.) sowie (als Beleg einer korrekten Datenerfassung) noch die Summe der Datenabweichungsquadrate (SS) und die Datenanzahl (n).

Hinweis: Gelegentlich finden sich auch noch einige Testgrößen mit angegeben. Einige verbreitete Programme bezeichnen hier fälschlich eine Datengruppenabweichung error als Signifikanz. Dies ist aber ein kosmetisches Problem und kann ignoriert werden.

Mittels dieser Datenzusammenfassung lassen sich jedenfalls die Klassen zusammen fassen (oder auch nicht). Es ergibt sich eine Neugruppierung. Die Angabe dieser Datenzusammenfassung gehört in die Dokumentation der Untersuchung, im Allgemeinen findet sie sich also im Dokumentanhang.

Die unterschiedlichen Verfahren der ANOVA-Tests

Lassen sich keine Standardabweichungen angeben, da zu wenig Messdaten zur Verfügung stehen, bleibt nur der STUDENT-t-Test zur Analyse der Daten. (Der t-Test ist kein ANOVA-Test, da er die Abweichungen der Daten von ihren Mittelwerten nicht auswertet)

Sind die Standardabweichungen angebbar, existieren mehrere Verfahren der Analyse. Diese Verfahren unterscheiden sich in ihrer Zuverlässigkeit.

Der FISHER-(Klassen)-Test ist ebenso, wie der t-Test problematisch in der Anwendung auf viele Klassen. Je größer die Anzahl der Klassen ist, um so geringer wird die Aussagesicherheit. Sinnvoll einsetzbar ist dieser Test für den Vergleich von 2 oder 3 Klassen.

Die Tests nach DUNCAN oder NEWMAN-KEULS sind als paarweise Tests für größere Klassenanzahlen sehr viel sicherer. Der DUNCAN-Test tendiert dazu, irrtümlich Unterschiede zu finden und der NEWMAN-KEULS-Test tendiert dazu, irtümlich keine Unterschiede zu finden.

In medizinischen Studien werden zumeist, etwa zum Nachweis der Wirksamkeit neuer Medikamente, DUNCAN-Tests verwendet. Es sollen schließlich die 'besseren' Eigenschaften aufgezeigt werden...

Die Wahl zwischen den DUNCAN- oder NEWMAN-KEULS-Tests ist also eine Frage nach den Wünschen des Fragestellers!


Eine ausführliche Besprechung dieser Verfahren findet sich in meinem Lehrbuch Statistik und Wahrscheinlichkeit – leicht gemacht auf den Seiten 110ff.