1. Kontingenztafeln
Interessieren von einer Person, oder allgemeiner gesprochen, von einem System die Ausprägungen von zwei Merkmalen, so sprechen wir von bivariaten Datenerhebungen und bivariaten Datensätzen. Bivariate Datensätze umfassen immer gepaarte Daten, da immer zwei Merkmalsausprägungen von einer Person/einem System stammen und damit zusammengehören.
Probanden Nr. | Merkmal A: Schuhgrösse | Merkmal B: Körperlänge |
1 | 42 | 182 |
2 | 37 | 153 |
3 | 39 | 170 |
etc. | ... | ... |
Wollen wir die in einer Stichprobe erhobenen bivariaten Daten übersichtlich darstellen, so ist dies, unabhängig davon, auf
welchem Skalenniveau die Merkmale eingeschätzt wurden, anhand von Tabellen, sogenannten Kontingenztafeln, möglich. Kontingenztafeln
werden auch als k×l-Felder-Tafeln bezeichnet wobei k die Anzahl Ausprägungskategorien des Merkmals A und l die Anzahl Ausprägungskategorien
des Merkmals B bezeichnet.
Kategorisieren wir die Daten unseres Beispiels, so könnte eine Kontingenztafel wie folgt aussehen:
B: Körpergrösse in cm | ||||||
A: Schuhgrösse | <150 | 151-160 | 161-170 | 171-180 | 181-190 | >190 |
<36 | 44 | 52 | 42 | 33 | 62 | 0 |
36-38 | 32 | 66 | 76 | 43 | 17 | 0 |
39-41 | 11 | 16 | 84 | 53 | 32 | 5 |
41-43 | 0 | 2 | 31 | 66 | 59 | 21 |
>43 | 1 | 19 | 18 | 55 | 42 | 25 |
Mit der gewählten Kategorisierung haben wir eine 5×6-Felder-Tafel definiert. In den Feldern dieser Tabelle, man spricht auch
von Zellen, stehen die absoluten oder relativen Häufigkeiten, mit denen die einzelnen Kombinationen von Merkmalsausprägungen
beobachtet wurden. Unserem Beispiel, das die absoluten Häufigkeiten nennt, entnehmen wir, dass die Kombination "Schuhgrösse
39-41" und "Körpergrösse 171-180" für 53 Personen unserer Stichprobe zutrifft.
Wir merken uns:
Beispiel einer Kontingenztafel für ein dichotom und ein nominal skaliertes Merkmal (Klicken auf die Box schliesst diese wieder.)