5. Optimale Stichprobengrösse
In jedem entscheidungsstatistischen Verfahren sind - wie in unserem Beispiel - auf Grund inhaltlicher Überlegungen sowohl die Effektgrösse als auch das - und -Fehler-Risiko festgelegt. Das einzige, was wir verändern können, ist der Umfang unserer Untersuchung, d.h. die Grösse n der untersuchten Stichprobe.
Zu diesem Thema haben wir in der Einführung zum Lernschritt eine Erkenntnis gewonnen: Wir stellten fest, dass die Signifikanz der Differenz zwischen einem Stichproben- und einem Populationsmittelwert von der Stichprobengrösse n abhängig ist. Bei genügend grosser Stichprobe werden auch kleinste Differenzen, die inhaltlich absolut irrelevant sein können, signifikant.
Als erstes nahmen wir diese Erkenntnis zum Anlass, um eine spezifische Alternativhypothese und damit die Effektgrösse einzuführen. Jetzt nutzen wir dieses Wissen, um dem Gedankengang unseres Statistikers wenigstens im Grundsatz folgen zu können. Er erklärt uns folgendes:
Bei festgelegter Effektgrösse und vorgewähltem - und -Fehler-Risiko existiert ein sogenannter optimaler Stichprobenumfang nopt, mit dem zwischen H0 und H1 eindeutig entschieden werden kann. Für den idealisierten Fall, den wir bisher zur Vereinfachung immer angenommen haben, und der davon ausgeht, dass sich die Verteilungen des Merkmals unter H0 und H1 nur im Mittelwert unterscheiden, für diesen idealisierten Fall lässt sich nopt wie folgt berechnen:
Wir schenken unserem Statistiker Vertrauen und verweisen Interessierte für die Herleitung dieser Beziehung auf die Fachliteratur (z.B. Bortz, Kap. 4.8).
Diese einfache Formel gilt wie gesagt für den idealisierten Fall. Für die Prüfung realer Daten sind leider für jedes Prüfverfahren aufwendige Korrekturen notwendig, so dass man sich in der Forschungspraxis wiederum mit tabellarischen Zusammenstellungen behilft. Diese nennen zu jedem Prüfverfahren für verschiedene Effektgrössen, fest gewähltes -Fehler-Risiko und fest gewählte Teststärke (1-) die optimalen Stichprobengrössen.
Diese Angaben dienen in der Praxis als Richtgrössen.
Sie finden eine solche Tabelle unter "Effektgrösse und optimaler Stichprobenumfang", diese ist der Fachliteratur entnommen (z.B. (Bortz 1995) , Kap. 9; (Bortz 1999) , Kap. 5).
Wenn Sie jetzt einen Blick auf diese Tabelle werfen, so werden Sie auch die Angaben zu 'nopt' verstehen.
Bevor wir mit diesem Wissen unser Beispiel ein letztes Mal aufgreifen, muss noch einmal festgehalten werden, was unter dem etwas vagen Begriff optimaler Stichprobenumfang zu verstehen ist:
Der optimale Stichprobenumfang nopt gibt an, wie gross eine Stichprobe gewählt werden muss, damit bei vorgewählter Effektgrösse und festgelegten - und -Fehler-Risiken eindeutig zwischen der Arbeitshypothese H0 und der spezifischen Alternativhypothese H1 entschieden werden kann.
Für die Planung einer Untersuchung ist dies eine wichtige Information, möchte man doch einerseits den Untersuchungsaufwand, d.h. den Umfang der zu untersuchenden Stichprobe in Grenzen halten, andererseits aber auch sicherstellen, dass auf Grund der erhobenen Daten eine eindeutige statistische Entscheidung möglich ist.
Zur Veranschaulichung greifen wir unser Einführungs-Beispiel ein letztes Mal auf und bestimmen die Grösse der zu untersuchenden Stichprobe, mit der eindeutig zwischen der Arbeits- und Alternativhypothese entschieden werden kann.
Wir möchten eine Stichprobe verhaltensauffälliger Kinder bezüglich ihrer mittleren Leistung in einem Agilitätstest mit dem in der Eichpopulation ermittelten Populationsmittelwert vergleichen. Dem Testmanual entnehmen wir für die betreffende Altersgruppe: Die Leistungen im Agilitätstest sind mit den Parametern = 150, = 10 normalverteilt. Von einem Sonderpädagogen und Kenner des Agilitätstests wissen wir zudem, dass eine sinnvolle inhaltliche Interpretation eines höheren Leistungsmittelwertes in der Stichprobe nur möglich ist, wenn diese aus einer Population stammt, deren Mittelwert um mindestens 3 Punkte über demjenigen der Eichpopulation liegt. Unsere Untersuchung muss also so angelegt sein, dass zwischen den folgenden Hypothesen eindeutig entschieden werden kann:
Arbeitshypothese H0:
Spezifische Alternativhypothese H1:
Damit ist die Effektgrösse esoll definiert:
Wir möchten für unsere Entscheidung ein -Fehler-Risiko von 5% zulassen, d.h. wir begnügen uns bei der Ablehnung von H0 mit einer Irrtumswahrscheinlichkeit von 5%. Das -Fehler-Risiko legen wir den Gepflogenheiten entsprechend bei 20% fest, womit sich eine Teststärke (1- ) von 80% ergibt. Dies bedeutet, dass wir einen tatsächlich höheren Leistungsmittelwert in der Stichprobe mit einer Wahrscheinlichkeit von 80% aufdecken werden.
Nun stellt sich die Frage, wieviele verhaltensauffällige Kinder untersucht werden müssen, damit wir eindeutig zwischen der Arbeitshypothese H0 und der spezifischen Alternativhypothese H1 entscheiden können.
Da wir in diesem Beispiel von idealisierten Bedingungen ausgehen und annehmen, dass sich die Eichpopulation und die hinter der Stichprobe stehende Population verhaltensauffälliger Kinder nur im Leistungsmittelwert, aber nicht in der Varianz unterscheiden, benutzen wir für die Bestimmung der optimalen Stichprobengrösse nopt die obenstehende Formel und kommen zu folgendem Schluss:
Wird also eine Stichprobe von 69 Kindern untersucht, so kann auf dem 5% Signifikanzniveau eindeutig zwischen H0 und H1 entschieden werden.