Σ ξ ζ       statistik-hilfe & info

statistik hilfe: Hintergrundwissen

Tests auf Zufallsverteilung

Verfahren zum Testen auf Zufallsverteilung

Der Sinn einer Untersuchung auf Zufallsverteilung

Die Stochastik beschäftigt sich mit der Betrachtung 'großer' Mengen, denn für diese gilt das Gesetz der großen Anzahl: Alle Daten einer Menge (gleich welcher Art sie auch seien mögen) gruppieren sich so um einen Wert, dass mit zunehmenden Abstand von diesem Wert ein gemessenes Datum mit geringerer Häufigkeit gemessen wird. Hierauf bauen dann die Berechnungen von Mittelwerten etc. auf.

Die (relative) Häufigkeit, mit der ein bestimmtes Messdatum auftritt, lässt sich mittels einer Wahrscheinlichkeitsfunktion beschreiben. Dabei unterscheiden sich diese Wahrscheinlichkeitsfunktionen zwar in ihren Details, sie weisen aber stets eine Glockenform auf, da mit zunehmendem Abstand eines Messwertes von einem wahrscheinlichsten Messwert, die Wahrscheinlichkeit stets abnimmt.

Werden nun beispielweise 2 Personen befragt, ob ihnen eine bestimmte Schokolade geschmacklich gefällt, so kann aus den Antworten nicht auf den Rest der Menschheit geschlossen werden. Zum Einen ist 2 keine 'große' Zahl und zum Anderen wäre hier nicht klar, welche Wahrscheinlichkeitsfunktion dieser Untersuchung zu Grunde liegt.

Eine Untersuchung mit den Mitteln der Statistik (als analysierender Teil der Stochastik) erfordert also eine ausreichende Anzahl Daten und die Klärung, ob die Daten einer Wahrscheinlichkeitsfunktion zugeordnet werden können.

Anmerkung: In den meisten Fragestellungen werden nur die binomiale Verteilungsfunktion (für diskrete Daten) oder die GAUSS-Verteilungsfunktion (für stetige Daten) verwendet. Dieses wird begrifflich – nicht ganz korrekt – als Normalverteilung zusammengefasst.

Prüfung auf Zufallsverteilung in wissenschaftlicher Form

Zur Prüfung auf eine Zufallsverteilung der Daten wird eine geeignete Zufallsfunktion betrachtet und die vorhandenen Daten mit den theoretisch zu erwartenden Daten (aus der Wahrscheinlichkeitsfunktion errechnet) verglichen. Hieraus wird eine Prüfgröße gebildet, die dann wiederum mit einer zu erwartenden Größe verglichen wird... Schließlich wird die Zufallsverteilung bestätigt oder widerlegt.

Der Vergleich gemessener Daten mit den theoretisch zu erwartenden Daten erfolgt durch eine Differenzbildung dieser Daten und eine weitere Zusammenfassung der Differenzen. Diese 'Rechenvorschriften' sind als Chi-Quadrat-Test, oder in vereinfachter Form als STUDENT-t-Test bekannt.

Eine ausreichende Anzahl wird hierbei vorausgesetzt, sie ist schließlich die Grundlage einer wissenschaftlichen Auswertung.

Prüfung auf Zufallsverteilung – auf die Schnelle

In einem industrieellen Produktionsprozess ist eine Qualitätssicherung unerlässlich.
Die Überprüfung der Zusammensetzung eines Substanzgemisches (etwa einer Backmischung) kann aber durchaus aufwendig sein, insbesondere falls es eine Vielzahl von Inhaltsstoffen zu untersuchen gilt. In einem derartigen Fall ist nicht die wissenschaftliche Untersuchung – mit der schließenden Folgerung auf sämtliche Gemischprodukte – gefordert. Es wird vielmehr die korrekte Probenentnahme aus der gerade betrachteten (Produktions-) Menge gefordert.

Eine Prüfung, ob die erhobenen Daten bezüglich der gerade betrachteten Menge hinreichend zufallsverteilt sind – unter Verzicht auf die Allgemeingültigkeit – ist hier angebracht.

Für diese Situation, mit betrachteten Teilmengen von weniger als 35 Datensätzen wurden entsprechende Testverfahren entwickelt. Hier ist insbesondere der KOLMOGOROW-SMIRNOV-Test (K-S-Test) im Gebrauch.

Achtung: Derartige Testverfahren sind für wissenschaftliche Untersuchungen ungeeignet, ihre Aussagen sind nicht allgemeingültig sondern auf den untersuchten Fall beschränkt!

$