Teil 2 - Prüfgrösse U resp. U'
Nun wissen wir, wie sich die beiden Extremfälle in der gemeinsamen Rangreihe der Daten zeigen:
Dieser Sachverhalt bringt uns auf die Idee, die Gleichmässigkeit der Verteilung der Daten in der gemeinsamen Rangreihe für
die Beschreibung der Unterschiedlichkeit der Daten in den beiden Stichproben zu benutzen. In der Forschungspraxis kommen die
beiden Extremfälle nun aber praktisch nie vor. In der Regel sind die Daten in der gemeinsamen Rangreihe nur mehr oder weniger
gleichmässig verteilt. Gesucht ist also ein Mass für die Gleichmässigkeit der Verteilung der Daten in der gemeinsamen Rangreihe. Mann und Whitney hatten die Idee, die "Anzahl Rangplatzüberschreitungen" und die "Anzahl Rangplatzunterschreitungen" als
Mass heranzuziehen, und definierten so die Prüfgrösse U resp. U'.
Zur "Anzahl Rangplatzüberschreitungen" gelangt man, indem man in der gemeinsamen Rangreihe für jede Person der Stichprobe
A auszählt, wieviele Personen der Stichprobe B vor ihr liegen. Summiert man diese Rangplatzüberschreitungen über alle Personen
der Stichprobe A, so erhält man die gesuchte Prüfgrösse, die U genannt wird.
Zur Bestimmung der "Anzahl Rangplatzunterschreitungen" verfährt man in analoger Weise. Für jede Person aus der Stichprobe A wird ausgezählt, wieviele Personen der Stichprobe B
hinter ihr liegen. Zählt man diese Rangplatzunterschreitungen aller Personen der Stichprobe A zusammen, so erhält man die
"Anzahl Rangplatzunterschreitungen". Diese Kenngrösse bezeichnet man mit U'.
Ohne auf die Beweisführung einzugehen, glauben wir den Statistikern, dass U' auch aus U berechnet werden kann:
U' = nA * nB - U, wobei nA die Grösse der Stichprobe A und nB diejenige der Stichprobe B bezeichnet.
Als erstes wollen wir U und U' für die beiden besprochenen Extremfälle bestimmen:
Minimaler Unterschied in den Stichproben:
a1 wird von einem Rang aus B übertroffen | 1 Überschreitung |
a2 wird von zwei Rängen aus B übertroffen | 2 Überschreitungen |
a3 wird von drei Rängen aus B übertroffen | 3 Überschreitungen |
Total "Anzahl Rangplatzüberschreitungen" | U = 6 Überschreitungen |
Total "Anzahl Rangplatzunterschreitungen" | U' = 3 * 4 - 6 = 6 |
Maximaler Unterschied in den Stichproben:
a1 wird von keinem Rang aus B übertroffen | 0 Überschreitungen |
a2 wird von keinem Rang aus B übertroffen | 0 Überschreitungen |
a3 wird von keinem Rang aus B übertroffen | 0 Überschreitungen |
Total "Anzahl Rangplatzüberschreitungen" | U = 0 Überschreitungen |
Total "Anzahl Rangplatzunterschreitungen" | U' = 3 * 4 - 0 = 12 |
Die Unterschiedlichkeit von zwei Rangverteilungen kann also mit zwei verschiedenen Kennzahlen, mit U und U' beschrieben werden.
Zur Vereinheitlichung und - so werden wir später sehen - zur Vereinfachung der vorhandenen Tabellen haben sich die Statistiker
darauf geeinigt, dass U als Prüfgrösse dient, falls U kleiner als U' ist. Ansonsten ist U' die Prüfgrösse.
Als nächstes wollen wir U und U' für einen in der Realität üblichen Fall bestimmen. Hierfür können uns die Daten unseres Skirennens
dienen.
FAQ (Klicken auf die Box schliesst diese wieder.)