7. Standardfehler und Signifikanz

Die Bestimmung des Standardfehlers und der Signifikanz dient der Feststellung der Verlässlichkeit des Modells. Dies ist deshalb notwendig, weil der Regressionskoeffizient b1 und der Determinationskoeffizient R2 üblicherweise anhand von Stichproben berechnet werden.

Wie weit darf man den Resultaten trauen?

Für die Signifikanz von R2 gilt dasselbe wie für die

Signifikanz von r. (Klicken auf die Box schliesst diese wieder.)

Auch hier kann die F-Statistik zum testen der Signifikanz verwendet werden:

Wieder wird F für eine unabhängige Variable und n-2 Freiheitsgrade indiziert. Und wieder kann anhand der Tabelle der F-Werte geprüft werden, ob der kritische Wert für das gewählte Signifikanzniveau erreicht wird oder nicht.

Was den sog. Standardfehler des Regressionskoeffizienten b1 betrifft, sind dagegen einige weitere Überlegungen notwendig:

  • Üblicherweise liegen nicht alle Datenpunkte auf der Regressionslinie. Vielmehr gibt es Fehler e (für error). Dies sind die senkrechten Abstände zwischen den Datenpunkten Y und den korrespondierenden Punkten auf der Regressionslinie, deren aufsummierte Quadrate SSE (sum of squared errors) bei der Positionierung der Regressionslinie zu minimieren sind.
  • Wenn wir SSE durch die um 2 reduzierte Anzahl der Fälle der Untersuchung (n-2) teilen, erhalten wir den sog. Standardfehler der Schätzung MSE (mean squared error):
  • Den Standardfehler des Regressionskoeffizienten SE(b1) erhält man nun, wenn man den Standardfehler der Schätzung MSE durch die Wurzel der Abweichungsquadrate von X (also SSx) teilt. Als Gleichung:
  • Der Standardfehler von b1 gibt zunächst einen Anhalt zur Streuung, d.h. zur Bandbreite der erwarteten Werte, wenn dieselben Berechnungen mit anderen Stichproben durchgeführt würden. Er sollte also klein sein.
  • Darüber hinaus geht es bei Signifikanztests aber immer um die Frage, mit welcher Berechtigung sich die sog. Null-Hypothese (kein Zusammenhang zwischen X und Y) verwerfen lässt. "Kein Zusammenhang" würden bedeuten, dass der Regressionskoeffizient null wäre (b1=0). Eine Faustregel besagt, dass b1 am besten drei oder mehr Standardfehler grösser als null sein sollte:

    b1 > 3SE(b1)

  • Genauer arbeitet der sog. t-Test: Hier wird der berechnete Wert des Regressionskoeffizienten in Beziehung zu seinem Standardfehler gesetzt.

Auch hier kann man aufgrund einer Tafel kontrollieren, ob der sog. kritische Wert für das gewählte Signifikanzniveau erreicht wird.

Beispiel:

b=9, SE(b1)=3, t=3 wäre bei n=16 auf dem Niveau von 0.1% bei 14 Freiheitsgraden (df=n-2=14) für einen zweiseitigen Test noch knapp signifikant. Kritischer Wert ist t=2.624; vgl. dazu Blalock (1960) S. 559.