Teil 2 - Prüfgrösse U resp. U'

Nun wissen wir, wie sich die beiden Extremfälle in der gemeinsamen Rangreihe der Daten zeigen:

Extrem grosser Unterschied in den Stichprobendaten:
Keine Vermischung der Daten in der gemeinsamen Rangreihe

Extrem geringer Unterschied in den Stichprobendaten:
Praktisch gleichmässige Verteilung der Daten in der gemeinsamen Rangreihe

Dieser Sachverhalt bringt uns auf die Idee, die Gleichmässigkeit der Verteilung der Daten in der gemeinsamen Rangreihe für die Beschreibung der Unterschiedlichkeit der Daten in den beiden Stichproben zu benutzen. In der Forschungspraxis kommen die beiden Extremfälle nun aber praktisch nie vor. In der Regel sind die Daten in der gemeinsamen Rangreihe nur mehr oder weniger gleichmässig verteilt. Gesucht ist also ein Mass für die Gleichmässigkeit der Verteilung der Daten in der gemeinsamen Rangreihe. Mann und Whitney hatten die Idee, die "Anzahl Rangplatzüberschreitungen" und die "Anzahl Rangplatzunterschreitungen" als Mass heranzuziehen, und definierten so die Prüfgrösse U resp. U'.

Zur "Anzahl Rangplatzüberschreitungen" gelangt man, indem man in der gemeinsamen Rangreihe für jede Person der Stichprobe A auszählt, wieviele Personen der Stichprobe B vor ihr liegen. Summiert man diese Rangplatzüberschreitungen über alle Personen der Stichprobe A, so erhält man die gesuchte Prüfgrösse, die U genannt wird.

Zur Bestimmung der "Anzahl Rangplatzunterschreitungen" verfährt man in analoger Weise. Für jede Person aus der Stichprobe A wird ausgezählt, wieviele Personen der Stichprobe B hinter ihr liegen. Zählt man diese Rangplatzunterschreitungen aller Personen der Stichprobe A zusammen, so erhält man die "Anzahl Rangplatzunterschreitungen". Diese Kenngrösse bezeichnet man mit U'.

Ohne auf die Beweisführung einzugehen, glauben wir den Statistikern, dass U' auch aus U berechnet werden kann:
U' = nA * nB - U, wobei nA die Grösse der Stichprobe A und nB diejenige der Stichprobe B bezeichnet.

Als erstes wollen wir U und U' für die beiden besprochenen Extremfälle bestimmen:

Minimaler Unterschied in den Stichproben:

a1 wird von einem Rang aus B übertroffen 1 Überschreitung
a2 wird von zwei Rängen aus B übertroffen 2 Überschreitungen
a3 wird von drei Rängen aus B übertroffen 3 Überschreitungen
Total "Anzahl Rangplatzüberschreitungen" U = 6 Überschreitungen
Total "Anzahl Rangplatzunterschreitungen" U' = 3 * 4 - 6 = 6



Maximaler Unterschied in den Stichproben:

a1 wird von keinem Rang aus B übertroffen 0 Überschreitungen
a2 wird von keinem Rang aus B übertroffen 0 Überschreitungen
a3 wird von keinem Rang aus B übertroffen 0 Überschreitungen
Total "Anzahl Rangplatzüberschreitungen" U = 0 Überschreitungen
Total "Anzahl Rangplatzunterschreitungen" U' = 3 * 4 - 0 = 12



Die Unterschiedlichkeit von zwei Rangverteilungen kann also mit zwei verschiedenen Kennzahlen, mit U und U' beschrieben werden. Zur Vereinheitlichung und - so werden wir später sehen - zur Vereinfachung der vorhandenen Tabellen haben sich die Statistiker darauf geeinigt, dass U als Prüfgrösse dient, falls U kleiner als U' ist. Ansonsten ist U' die Prüfgrösse.

Als nächstes wollen wir U und U' für einen in der Realität üblichen Fall bestimmen. Hierfür können uns die Daten unseres Skirennens dienen.

FAQ (Klicken auf die Box schliesst diese wieder.)