5. Verteilung der Stichprobenanteilswerte

An dieser Stelle greifen wir noch einmal das Beispiel der Studierenden an der Universität Zürich auf, um das Konzept einer Stichprobenkennwerteverteilung anhand einer Computersimulation zu illustrieren.

Für die Population der Studierenden an der Universität Zürich ist die Geschlechterverteilung bekannt: Im Wintersemester 2002/03 waren von der insgesamt eingeschriebenen Studierenden 52,41% Frauen. Wir generieren also zunächst am Computer eine Modellpopulation, welche das entsprechende Geschlechterverhältnis an der Universität Zürich abbilden soll.

Zunächst soll gezeigt werden, dass aus unterschiedlichen Stichproben zum Teil sehr unterschiedliche Stichprobenanteilswerte resultieren. Aus den ersten fünf Zufallsstichproben vom Umfang n=500 resultierten die folgenden Werte für den geschätzten Frauenanteil:

Stichprobe Frauenanteil
Nr.1 49,8 %
Nr.2 52,8 %
Nr.3 53,2 %
Nr.4 53,8 %
Nr.5 52,2 %

Zum Vergleich: Der tatsächliche Frauenanteil in der Population beträgt 52,41 %.

Stichprobe Frauenanteil
Uni ZH 52,41 %

Aus der Tabelle ist ersichtlich, dass für die ersten fünf Zufallsstichproben jeweils ein anderer Anteilswert resultiert, und dass diese fünf Stichprobenanteilswerte unterschiedlich nahe am tatsächlichen Populationsanteilswert liegen.
Wir führen nun dieselbe Prozedur am Computer für 1'000 Zufallsstichproben mit jeweils einem Stichprobenumfang von n = 500 durch. Stellt man die Verteilung der 500 Stichprobenanteilswerte grafisch dar, erhält man die Stichprobenverteilung des Anteilswertes.

Aus der Grafik wird folgendes ersichtlich:

  • Die Verteilung der unterschiedlichen Stichprobenanteilswerte weist annähernd die Form einer Normalverteilung auf, wie die hinterlegte Normalverteilungskurve andeutet.
  • Die unterschiedlichen Stichprobenanteilswerte sind um den tatsächlichen Populationswert von 52,41 % zentriert.
  • Stichprobenkennwerte, welche "nahe" am tatsächlichen Populationskennwert liegen, sind wahrscheinlicher als Stichprobenkennwerte, welche "nicht nahe" am wahren Kennwert liegen. Wie der Grafik zu entnehmen ist, treten Stichprobenkennwerte kleiner als 0.45 oder grösser als 0.60 beispielsweise nur sehr selten auf.