6. Erklärte Varianz - Qualität des Modells

Auf dem vorherigen Rechenblatt wurde neben dem Korrelationskoeffizienten r der sog. Determinationskoeffizient (oder auch Bestimmtheitskoeffizient bzw. Bestimmtheitsmass) berechnet, der als R2 definiert ist.

Im Falle der bivariaten Regression (nur eine unabhängige Variable) ist der Determinationskoeffizient schlicht das Quadrat des Korrelationskoeffizienten r.

Allgemein gibt der Determinationskoeffizient an, welcher Anteil der Abweichungsquadrate der abhängigen Variable SSy oder auch der Varianz1 von Y durch die Modellgleichung (kurz: Modell) erklärt wird, und zwar in Bruchteilen von 1. Multipliziert man diesen Wert mit 100, kann man diesen Anteil auch in % ausdrücken, also etwa:

R2 = 0.9 = 90%

R2 sagt also etwas aus über die Güte des Modells aus.

Für die im Modell "erklärten" Abweichungsquadrate (SSexpl ) gilt dabei folgendes:

SSexpl = R2 · SSy = SSy - SSE

Entsprechendes gilt für die Varianzen:

varexpl = R2 · vary = vary - vare

Anmerkung:

Die Varianz ist (im Falle einer Stichprobe von Daten) definiert als Quadratsumme SS geteilt durch die Anzahl Fälle minus eins (n-1). Für die Varianz von Y gilt also vary = SSy /(n-1). Die erklärte Varianz ist entsprechend varexpl = SSexpl /(n-1). Für die Varianz der Fehler e gilt var e = SSE/(n-1).