21. Zahlenorakel

Bestimmte Zeitungen widmeten sich in besonderer Weise der Voraussage der Präsidentschaftswahlen über Probeabstimmungen. Sie veröffentlichten Talons in den Zeitungen, die ausgeschnitten und eingesandt werden konnten. Um die Stichprobe über die engeren Klientel der Zeitungen hinaus zu erweitern, wurden beispielsweise auch Adressen von Telefon- und Autoverzeichnissen gesammelt. Die Zeitschrift Literary Digest sammelte die wahrscheinlich umfassendste Adressdatei. Sie umfasste 1895 bereits 350'000 Adressen und 1932 fanden sich gar über 32'000'0000 Anschriften. Für die Wahlen 1928 sollen nicht weniger als 18 Millionen "Wahlzettel" verschickt worden sein. Literary Digest vermochte 1928 wie auch die Jahre zuvor die Wahlresultate auch hinreichend präzise vorauszusagen, so etwa prognostizierte sie dem Kandidaten Hoover 63.2% der Stimme und er gewann schlussendlich mit 58.8 % der Stimmen. Literary Digest stand deshalb im Ruf, besonders seriös und zuverlässig zu sein.

Die Blammage

1936 allerdings wandelte sich der bisherige Erfolg in ein Blamage. Zwar waren wiederum über 10 Millionen Stimmzettel verschickt worden und schlussendlich ganze 2.3 Millionen wurden ausgewerten. Literary Digest sagte aber dem falschen Kandidaten den Sieg voraus: es sollte Alfred Landon mit 57 % der Stimmen gewinnen, de facto erhielt er aber nur 38.5%. Das Ergebnis des Siegers Roosevelt wurde gar mit über 20 % verschätzt. Die Blamage vervollständigte die Tatsache, dass eine zuvor verspottete Peson mit ihrem American Institute of Public Opinion mit nur wenigen Tausend Stimmen den Sieg Roosevelts richtig voraussagen konnte: George H. Gallup, der als Erfinder der modernen Meinungsforschung gilt, Mehr noch, Gallup, und das musste für die Öffentlichkeit wie ein technisches Wunder klingen, hatte gar das Versagen der Literary Digest, die im übrigen nach diesem Ereignis ihr Erscheinen einstellen musste, ebenfalls vorher gesagt.

Das Projekt des Public Opinoin Polling

George H. Gallup, der Publizistikwissenschaftler (wie seine Tätigkeit wohl heute am ehesten umschrieben werden könnte). Hatte schon seit den früheren dreissiger Jahren mit der bekannt werdenden Stichprobentheorie experimentiert. 1935 präsentierte er sein Verfahren in einem Artikel der Washington Post der Öffentlichkeit.

Washington Post stellte auch das Stichprobenverfahren vor: es ist nichts anderes als Kiaers Verfahren des representative Sampling. Die wahrscheinlichkeitstheoretische Fundierung war nocht nicht konzeptionell in das Stichprobenverfahren eingelagert, sondern wahrscheinlichkeitstheoretische Berechnungen wurden nur durchgeführt, als ob es sich um eine reine Zufallsstichprobe handelt (es geht das Gerücht, das zuweilen heute noch so verfahren wird). Wiederum kommt die Miniaturvorstellung der repräsentativen Stichprobe zum Zug: "The poll reported today and every poll conducted by the American Institute of Public Opinion is a national election on a small scale."

Gallup verfuhr so, dass er die amerikanische Gesellschaft a priori nach demografischen und ökonomischen Merkmalen in sogenannte cross sections einteilte (soziologisch könnte man von einer Art in die statistische Ordnung übersetzte Milieutheorie sprechen), darauf auchtete, dass in seiner Stichprobe eine genügende Anzahl von jeder Cross section erfasst sind. Auf diese Weise, in Verbindung mit Volkszählungsdaten, lässt sich der Meinungs-Anteil in den Stichproben auf die Gesamtbevölkerung hochrechnen.

Der Irrtum der Literary Digest

Aufgrund dieses Stichprobenverfahren erkannte Gallup, dass Literary Digest hinsichtlich der Wahlprognosen 1936 fehl liegen musste. Die Stichprobe von Literary Digest umfasste die polemisch so genannte tel-auto-Öffentlichkeit, Zeitungsabonennente und InhaberInnen von Automobilen und Telefonanschlüssen. All dies vergegenständlichte dazumals klare Schichtmerkmale, weshalb das Sample von Literary Digest eindeutig auf die Mittleren und oberen Schichten fokussierte. Dies war für die Prognose solange kein Problem, als Schichtmerkmale nicht entscheidend waren für die Wahlpräferenen, sondern andere Kategorien (beispielsweise der amerikanische Osten versus die ehemaligen Südstaaten). Doch im Zuge der 30er Jahre verschärfte sich die Weltwirtschaftskrise und Roosevelt trat mit einem einmaligen Reformprogramm in den Wahlkampf, weshalb er von den ökonomischen defavorisierten Schichten klar bevorzugt wurde. So sollen Arbeitslose mit bis zu 80% Roosevelt gewält haben, während die obersten Einkommenskategorien lediglich mit ungefähr 30 Prozent für Roosevelts Partei stimmten.
Dieser Kampf zwischen "haves" und "have-nots" ist Literary Digest rein strukturell entgangen, konnte gar nicht erkannt werden. Ohne geplante Stichprobe konnte Literary Digest konnte nur zählen und die Qualität seiner Stichprobe nicht beurteilen (und genau dies gilt auch für die heutigen Formen der straw polls).

Ein wissenschaftlicher Durchbruch?

Freilich, dieses Ereignis als wissenschaftlicher Durchbruch der quantitativen Sozialwissenschaften zu feiern, ist riskant. Zunächst gilt zu bemerken, dass Literary Digest über mehrere Jahrzehte hinaus durchaus präzise Aussagen zu liefern vermochte, also "repräsentative Samples" zu erstellen vermochte. Des weiteren ist zu bemerken, dass auch Gallups Methode mehr auf politischer Erfahrung denn auf statistischer Logik beruhte. Seine Miniaturgesellschaft beruhte auf der Annhame, dass, wenn cross sections korrekterweise so gewählt werden, die hauptsächlichen Berufs- und Einkommensgruppen repräsentiert sind, alle anderen Eigenschaften und Meinugnen in der amerikanischen Bevölkerung ebenfalls richtig "repräsentiert" sind - was eine heikle, aber in der Stichprobentheorie in ähnlicher Form immer noch vorherrschende Vorannahme bildet. Gallup musste jedenfalls erfahren, dass diese Annahe, dass eine adäquate Abbildung bestimmter Merkmalsverteilungen in der Stichprobe (Berufsgruppen, Geschlecht, Alter) keineswegs bedeutet, dass andere (wie Meinungen) ebenfalls richtig abgebildet werden, als sein Verfahren in den Präsidentschaftswahlen 1948 eine ähnliche Schlappe erlebte wie Literary Digest, ohne dass bis heute bekannt wäre, weshalb. Die Meinungsforschung jedenfalls hat überlebt -- freilich hin und wieder auch ihre Fehleinschätzungen (vgl. den einleitdenden Spiegel-Artikel), denn die Wahlforschung ist eine der wenigen sozialwissenschaftlichen Stichprobenverfahren, deren Adäquatheit nach den Wahlen tatsächlich zu Tage treten vermag.

Repräsentativität

21. Zahlenorakel

Die Blammage

Das Projekt des Public Opinoin Polling

Der Irrtum der Literary Digest

Ein wissenschaftlicher Durchbruch?