7. Standardfehler und Signifikanz
Die Bestimmung des Standardfehlers und der Signifikanz dient der Feststellung der Verlässlichkeit des Modells. Dies ist deshalb notwendig, weil der Regressionskoeffizient b1 und der Determinationskoeffizient R2 üblicherweise anhand von Stichproben berechnet werden.
Wie weit darf man den Resultaten trauen?
Für die Signifikanz von R2 gilt dasselbe wie für die
Signifikanz von r. (Klicken auf die Box schliesst diese wieder.)
Auch hier kann die F-Statistik zum testen der Signifikanz verwendet werden:
Wieder wird F für eine unabhängige Variable und n-2 Freiheitsgrade indiziert. Und wieder kann anhand der Tabelle der F-Werte geprüft werden, ob der kritische Wert für das gewählte Signifikanzniveau erreicht wird oder nicht.
Was den sog. Standardfehler des Regressionskoeffizienten b1 betrifft, sind dagegen einige weitere Überlegungen notwendig:
- Üblicherweise liegen nicht alle Datenpunkte auf der Regressionslinie. Vielmehr gibt es Fehler e (für error). Dies sind die senkrechten Abstände zwischen den Datenpunkten Y und den korrespondierenden Punkten auf der Regressionslinie, deren aufsummierte Quadrate SSE (sum of squared errors) bei der Positionierung der Regressionslinie zu minimieren sind.
- Wenn wir SSE durch die um 2 reduzierte Anzahl der Fälle der Untersuchung
(n-2) teilen, erhalten wir den sog. Standardfehler
der Schätzung MSE (mean squared
error):
- Den Standardfehler des Regressionskoeffizienten SE(b1) erhält man
nun, wenn man den Standardfehler der Schätzung MSE durch die Wurzel der
Abweichungsquadrate von X (also SSx) teilt. Als Gleichung:
- Der Standardfehler von b1 gibt zunächst einen Anhalt zur Streuung, d.h. zur Bandbreite der erwarteten Werte, wenn dieselben Berechnungen mit anderen Stichproben durchgeführt würden. Er sollte also klein sein.
- Darüber hinaus geht es bei Signifikanztests aber immer um die Frage, mit
welcher Berechtigung sich die sog. Null-Hypothese (kein Zusammenhang
zwischen X und Y) verwerfen lässt. "Kein Zusammenhang" würden bedeuten, dass
der Regressionskoeffizient null wäre (b1=0). Eine Faustregel besagt, dass b1 am besten drei oder mehr Standardfehler
grösser als null sein sollte:
b1 > 3SE(b1) - Genauer arbeitet der sog. t-Test: Hier wird der berechnete Wert des
Regressionskoeffizienten in Beziehung zu seinem Standardfehler gesetzt.
Auch hier kann man aufgrund einer Tafel kontrollieren, ob der sog. kritische Wert für das gewählte Signifikanzniveau erreicht wird.
Beispiel:
b=9, SE(b1)=3, t=3 wäre bei n=16 auf dem Niveau von 0.1% bei 14 Freiheitsgraden (df=n-2=14) für einen zweiseitigen Test noch knapp signifikant. Kritischer Wert ist t=2.624; vgl. dazu Blalock (1960) S. 559.