5. Prüfverteilung und Übertretungswahrscheinlichkeit

Bei Gültigkeit von H0 ist die Verteilung der Prüfgrösse, d.h. die Prüfverteilung bekannt. Je nach der Grösse der beiden Stichproben müssen zwei Fälle unterschieden werden.

Prüfverteilung

  • Für grosse Stichproben, d.h. in diesem Fall, wenn (nA + nB) > 50, ist die Prüfgrösse mit den Parametern und normalverteilt.
  • Für kleine Stichproben, d.h. wenn (nA + nB) ≤ 50, ist die Prüfgrösse mit den Parametern und t-verteilt. In diesem Fall muss vorausgesetzt werden, dass das Merkmal in den hinter den Stichproben stehenden Populationen normalverteilt ist.

Wir wollen uns dies schrittweise veranschaulichen:

Somit kennen wir die Form der Prüfverteilung. Was uns noch fehlt, sind die Parameter und der Prüfverteilung und – bei kleinen Stichproben - der Freiheitsgrad df, der die spezifische t-Verteilung festlegt.

Wir folgen den Überlegungen der Statistiker:

Mit dem F-Test entscheiden wir als erstes, ob homogene oder inhomogene Varianzen vorliegen; dann schätzen wir die Standardabweichung der Prüfverteilung mit der entsprechenden Schätzformel. Die Schätzformeln sind in verschiedenen Lehrbüchern unterschiedlich dargestellt. Sie führen aber alle zum selben Resultat.

Achtung: Die Schätzformeln basieren auf sog. Punktschätzungen der Populationsvarianzen aus den Stichprobenvarianzen. Da diese Punktschätzungen ein normalverteiltes Merkmal in den Populationen voraussetzen, wird hier implizit auch für grosse Stichproben die Voraussetzung eines normalverteilten Merkmals in den Populationen eingeführt.

Damit sind die Form und die Parameter der Prüfverteilung bekannt. Dies bedeutet, dass wir wissen, wie die Prüfgrösse verteilt ist, wenn die Arbeitshypothese H0 gültig ist, d.h. wenn die Stichproben aus Populationen stammen, in denen das Merkmal mit identischem Mittelwert verteilt ist.

Überschreitungswahrscheinlichkeit

Ordnen wir nun den konkreten Ausprägungsgrad unserer Prüfgrösse in die Prüfverteilung ein, so lässt sich abschätzen, mit welcher Wahrscheinlichkeit dieser Ausprägungsgrad zufällig erreicht oder überschritten wird.

Wir haben eine ungerichtete Alternativhypothese H1 formuliert, weil wir uns für die Zufälligkeit des absoluten Unterschieds in den Stichprobenmittelwerten interessieren. Dies bedeutet, dass das Vorzeichen der Prüfgrösse in diesem Fall keine Bedeutung hat und damit die zweiseitige Überschreitungswahrscheinlichkeit bestimmt werden muss.

Zur Bestimmung der Überschreitungswahrscheinlichkeit stehen uns nur die Tabellen zur z- und t-Verteilung zur Verfügung. Um diese zu nutzen, muss die Prüfgrösse in die entsprechende Verteilung transformiert werden.

Mit der Überschreitungswahrscheinlichkeit p kennen wir die Wahrscheinlichkeit, mit der der absolute Unterschied zwischen den beiden Stichprobenmittelwerten und zufällig entstanden sein kann.

Ist p sehr klein, so ist es sehr unwahrscheinlich, dass die Stichproben aus Populationen mit identischen Mittelwerten stammen. Wir verwerfen H0 zugunsten von H1.

Ist p hingegen gross, so ist nicht auszuschliessen, dass die beiden Stichproben aus Populationen mit identischen Mittelwerten stammen. Wir behalten H0 bei.

Was nun ‚sehr klein’ und ‚gross’ bedeutet, beurteilen wir wie immer anhand der Signifikanzniveaus.