4. Verteilung von Chi-Quadrat
In Übung 1 wurde festgestellt, dass Chi-Quadrat einen Wert zwischen null und einem Vielfachen von N (Zahl der Fälle der Untersuchung) annehmen kann – in Abhängigkeit von N, von der Verteilung der Daten in der Kreuztabelle und der Grösse der Kreuztabelle. In unserem vorherigen Beispiel (Schritt 2 und 4) haben wir für Chi-Quadrat einen Wert von 3.4979 ermittelt. Ist dies ein grosser oder ein kleiner Wert? Was sagt er aus?
katholisch | nicht katholisch | |
---|---|---|
CVP-Wähler | 16 | 6 |
andere | 13 | 15 |
Chi-Quadrat: 3.4979 |
- Bei vollkommen gleichmässiger Verteilung der Fälle in der Kreuztabelle wäre Chi-Quadrat=0.
- Der ermittelte Wert von Chi-Quadrat in unserem Beispiel ist jedoch 3.4979 und verweist auf eine Abweichung von einer vollkommen gleichmässigen Verteilung der Fälle (offenbar wählen Katholiken mehrheitlich tatsächlich die CVP – nicht-katholische Befragte wählen eher andere Parteien als die CVP).
- Es stellt sich aber dennoch die Frage, wie bedeutungsvoll die festgestellte Abweichung des berechneten Chi-Quadrat-Wertes von null ist. Können wir die Null-Hypothese "kein Zusammenhang" zurückweisen? Wir formulieren diese Frage nun in einer Weise, auf die uns die Statistik eine Antwort liefern kann:
- Wie wahrscheinlich ist es, einen Wert von 3.4979 für Chi-Quadrat (in einer 2x2-Kreuztabelle) durch schiere Zufälle bei der Stichprobenauswahl zu erhalten, wenn tatsächlich kein Zusammenhang zwischen den interessierenden Variablen besteht?
Glücklicherweise hat Chi-Quadrat wie andere statistische Kennzahlen auch eine typische sampling distribution, also eine Stichprobenkennwertverteilung. D.h. wir wissen, mit welcher Wahrscheinlichkeit entsprechende Werte von Chi-Quadrat rein zufällig zustande kommen, ohne dass ein Zusammenhang zwischen den interessierenden Variablen besteht.
Für den Fall einer 2x2-Kreuztabelle sieht diese Verteilung wie folgt aus (senkrecht die Wahrscheinlichkeit, waagerecht die entsprechenden Werte von Chi-Quadrat):
Aus dieser Standard-Verteilung für 2x2-Tabellen ist ersichtlich:
- Zunehmende Werte von Chi-Quadrat werden zunehmend unwahrscheinlicher.
- Ein Wert von Chi-Quadrat=3.84 tritt mit einer Wahrscheinlichkeit von 5% (p=0.05) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 3.84 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 5%.
- Ein Wert von Chi-Quadrat=6.63 tritt mit einer Wahrscheinlichkeit von 1% (p=0.01) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 6.63 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 1%.
- Ein Wert von Chi-Quadrat=7.88 tritt mit einer Wahrscheinlichkeit von 0.5% (p=0.005) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 7.88 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 0.5%.