4. Gedankenexperiment

Welche Rückschlüsse lassen sich nun anhand von Stichprobendaten auf die zugrundeliegende Population ziehen? Der Schlüssel zum Verständnis dieses Rückschlüsses liegt in einem Gedankenexperiment.

Wir gehen zunächst von der kontrafaktischen Annahme aus, dass wir die Verteilung eines Merkmales (und damit auch alle seine Momente der Verteilung wie beispielsweise das arithmetische Mittel oder die Varianz) in der Population vom Umfang N kennen. Wir stellen uns nun die folgende Frage: Was passiert, wenn man aus dieser Population nun sehr viele Stichproben derselben Grösse zieht und für jede Stichprobe denselben Kennwert berechnet?

Wir ziehen nun also theoretisch unendlich viele Stichproben vom jeweils gleichen Umfang n. Für jede einzelne Stichprobe bildet man den interessierenden Kennwert (z.B. das arithmetische Mittel). Da sich bei jedem erneuten Ziehen einer Stichprobe die Zusammensetzung der Beobachtungen in aller Regel unterscheidet, erhält man für jede Stichprobe einen unterschiedlichen Stichprobenkennwert. Alle diese unterschiedlichen Stichprobenkennwerte bilden nun ihrerseits selbst eine Verteilung, die sogenannte Stichprobenkennwerteverteilung. Diese Verteilung bildet ab, wie der interessierende Kennwert nach der Zusammensetzung der Stichprobe variiert.

Falls sich nun diese Stichprobenkennwerteverteilung über eine Verteilung mit einer bekannten Wahrscheinlichkeitsdichtefunktion beschreiben lässt, lässt die Kenntnis dieser Verteilung folgendes zu:

  • Es lässt sich eine Aussage darüber machen, mit welcher Wahrscheinlichkeit ein bestimmter Stichprobenkennwert anzutreffen ist.
  • Die Kenntnis der Stichprobenkennwerteverteilung wird es erlauben, anhand eines einzelnen Stichprobenkennwertes Aussagen darüber zu machen, innerhalb welchen Wertebereiches der unbekannte Populationskennwert mit einer bestimmten Wahrscheinlichkeit zu erwarten ist.

Bevor wir also die praktisch relevante Frage beantworten können, welche Rückschlüsse sich anhand einer einzelnen Stichprobe auf die Population ziehen lassen, müssen wir die Frage nach der Stichprobenkennwerteverteilung beantworten.

Wir werden im folgenden den obigen Gedankengang für den Anteils- und den Mittelwert anhand von verschiedenen Computersimulationen illustrieren. Für andere Kennwerte existiert ebenfalls eine entsprechende Kennwerteverteilung, deren Herleitung auf demselben Gedanengang beruht.