
_Statistik
TH Deggendorf
28.02.2024
Verfahren für Häufigkeitsdaten (meist auf nominalem Skalenniveau)
Forschungshypothese H1: Die beiden Variablen sind abhängig (= nicht unabhängig).
Teststatistik:
mit
 n\(_{ij}\): Tatsächliche Anzahl Fälle in Kategorie ij
 E\(_{ij}\): Erwartete Fälle in Kategorie ij
 \(k, m\): Anzahl Zeilen bzw. Spalten 
 n: Gesamte Anzahl
Berechnung der Erwartungen E\(_{ij}\)
mit
 n\(_{•j}\): Summe Anzahl über alle Zeilen
 n\(_{i•}\): Summe Anzahl über alle Spalten
\(\chi²\)-Verteilung

Beispiel Kreuztabelle
| NR | R | ||
|---|---|---|---|
| w | 90 | 10 | 100 | 
| m | 80 | 20 | 100 | 
| 170 | 30 | 200 | 
Freiheitsgrade: \(\textit{df} = (m - 1)(k - 1)\)
Vierfeldertest: \(\textit{df} = (2-1)(2-1) = 1\)
Entscheidung:
Effektstärke: Cramer’s V 
\(V = \sqrt{\frac{\chi²}{n(k - 1)}}\), 
mit k = min(Kategorienzahl)
\(\chi²\)-Verteilung

| df | Kritische_Werte | 
|---|---|
| 1 | 3.841459 | 
| 2 | 5.991465 | 
| 3 | 7.814728 | 
| 4 | 9.487729 | 
| 5 | 11.070498 | 
| 6 | 12.591587 | 
| 7 | 14.067140 | 
| 8 | 15.507313 | 
| 9 | 16.918978 | 
| 10 | 18.307038 | 
| 11 | 19.675138 | 
| 12 | 21.026070 | 
| 13 | 22.362033 | 
| 14 | 23.684791 | 
| 15 | 24.995790 | 
| 16 | 26.296228 | 
| 17 | 27.587112 | 
| 18 | 28.869299 | 
| 19 | 30.143527 | 
| 20 | 31.410433 | 
| 21 | 32.670573 | 
| 22 | 33.924439 | 
| 23 | 35.172462 | 
| 24 | 36.415028 | 
| 25 | 37.652484 | 
| 26 | 38.885139 | 
| 27 | 40.113272 | 
| 28 | 41.337138 | 
| 29 | 42.556968 | 
| 30 | 43.772972 | 







    Pearson's Chi-squared test
data:  vierfelder
X-squared = 2.6667, df = 1, p-value = 0.1025
Cramer V 
  0.1155 
