8 Signifikanztestung

Emma wurde nach der Visualisierung der Unterschiede zwischen den beiden Altersgruppen aufgefordert, die sichtbaren Differenzen nun auch mit einem Signifikanztest zu untersuchen. Für die Parteienpräferenz erstellt Emma eine Kreuztabelle, zu der dann auch die Ergebnisse des Chi²-Tests angezeigt werden.

Dafür benötigt sie wieder das Paket sjPlot. Dieses wurde bereits installiert und kann daher wieder aktiviert werden. Sie definiert dann den Datensatz mit dem gearbeitet werden soll und erzeugt mit dem Befehl sjt.xtab() eine Kreuztabelle. Sie gibt die Variablen ein, die geprüft werden sollen. Als Spaltenvariable der Kreuztabelle wählt Emma die Variable “age-group”; für die Zeilen der Kreuztabelle die Variable “pv01”. Außerdem lässt sie sich die Spalten-Prozente (also die prozentualen Häufigkeiten in Bezug auf die Altersgruppen) einblenden. Das Ergebnis öffnet sich im Viewer im rechten unteren Fenster in RStudio.

library(sjPlot)
attach (ALLBUS_21_Analyse) #Zugriff auf den Datensatz
sjt.xtab (pv01, age_group, show.col.prc = TRUE) #Erzeugung einer Kreuztabelle mit Signifikanztestung
BEFR.: WAHLABSICHT
BUNDESTAGSWAHL
Altersgruppen Total
18-25jährige älter als 25 Jahre
CDU-CSU 30
10.5 %
1006
27 %
1036
25.9 %
SPD 31
10.9 %
564
15.2 %
595
14.8 %
FDP 44
15.4 %
430
11.6 %
474
11.8 %
DIE GRUENEN 93
32.6 %
848
22.8 %
941
23.5 %
DIE LINKE 29
10.2 %
275
7.4 %
304
7.6 %
AFD 18
6.3 %
252
6.8 %
270
6.7 %
ANDERE PARTEI 22
7.7 %
141
3.8 %
163
4.1 %
WUERDE NICHT WAEHLEN 18
6.3 %
206
5.5 %
224
5.6 %
Total 285
100 %
3722
100 %
4007
100 %
χ2=58.592 · df=7 · Cramer’s V=0.121 · p=0.000

Es zeigen sich signifikante Differenzen zwischen den Altersgruppen bezüglich der Parteienpräferenz (ablesbar am p-Wert unter der Kreuztabelle; dieser ist deutlich kleiner als ein Signifikanznivau von z.B. 5%). So ist anhand der Kreuztabelle zu erkennen, dass DIE GRÜNEN, DIE LINKE und die FDP von der jüngeren Altersgruppe stärker präferiert werden als von der älteren Altersgruppe. Diese wählt wiederum in höherem Maße die etablierten Volksparteien (CDU-CSU, SPD).

In einem zweiten Schritt überprüft Emma jetzt auch die Ergebnisse für das politische Interesse. Da dieses ordinalskaliert ist, nutzt Sie einen Wilcoxon-Mann-Whitney-Test (auch: Mann-Whitney-U-Test, U-Test, Wilcoxon-Rangsummentest).

Dafür nutzt sie den Befehl:

wilcox.test().

Für den Test muss sie angeben, welche beiden Variablen sie testen möchte. Wichtig ist, dass sie zuerst die abhängige Variable, also “pa02a” und dann die Gruppenvariable, also “age_group” eingibt. Anschließend gibt sie noch an auf welchen Datensatz sich der Test beziehen soll. In unserem Fall der zuvor erstellte Datensatz “ALLBUS_21_Analyse”.

wilcox.test(pa02a~ age_group, #abhängige Variable, Gruppenvariable
                   data = ALLBUS_21_Analyse)  #Datensatz
#> 
#>  Wilcoxon rank sum test with continuity correction
#> 
#> data:  pa02a by age_group
#> W = 1040282, p-value = 0.0003701
#> alternative hypothesis: true location shift is not equal to 0

Das Ergebnis zeigt, dass die im Säulendiagramm sichtbaren Unterschiede im politischen Interesse zwischen den Altersgruppen auch statistisch signifikant sind.

Damit hat Emma alle geplanten Analysen des Datensatzes abgeschlossen und kann nun ihre Ergebnisse in der Abschlussarbeit verschriftlichen…