8 Signifikanztestung
Emma wurde nach der Visualisierung der Unterschiede zwischen den beiden Altersgruppen aufgefordert, die sichtbaren Differenzen nun auch mit einem Signifikanztest zu untersuchen. Für die Parteienpräferenz erstellt Emma eine Kreuztabelle, zu der dann auch die Ergebnisse des Chi²-Tests angezeigt werden.
Dafür benötigt sie wieder das Paket sjPlot. Dieses wurde bereits installiert und kann daher wieder aktiviert werden. Sie definiert dann den Datensatz mit dem gearbeitet werden soll und erzeugt mit dem Befehl sjt.xtab() eine Kreuztabelle. Sie gibt die Variablen ein, die geprüft werden sollen. Als Spaltenvariable der Kreuztabelle wählt Emma die Variable “age-group”; für die Zeilen der Kreuztabelle die Variable “pv01”. Außerdem lässt sie sich die Spalten-Prozente (also die prozentualen Häufigkeiten in Bezug auf die Altersgruppen) einblenden. Das Ergebnis öffnet sich im Viewer im rechten unteren Fenster in RStudio.
library(sjPlot)
attach (ALLBUS_21_Analyse) #Zugriff auf den Datensatz
sjt.xtab (pv01, age_group, show.col.prc = TRUE) #Erzeugung einer Kreuztabelle mit Signifikanztestung
BEFR.: WAHLABSICHT BUNDESTAGSWAHL |
Altersgruppen | Total | |
---|---|---|---|
18-25jährige | älter als 25 Jahre | ||
CDU-CSU |
30 10.5 % |
1006 27 % |
1036 25.9 % |
SPD |
31 10.9 % |
564 15.2 % |
595 14.8 % |
FDP |
44 15.4 % |
430 11.6 % |
474 11.8 % |
DIE GRUENEN |
93 32.6 % |
848 22.8 % |
941 23.5 % |
DIE LINKE |
29 10.2 % |
275 7.4 % |
304 7.6 % |
AFD |
18 6.3 % |
252 6.8 % |
270 6.7 % |
ANDERE PARTEI |
22 7.7 % |
141 3.8 % |
163 4.1 % |
WUERDE NICHT WAEHLEN |
18 6.3 % |
206 5.5 % |
224 5.6 % |
Total |
285 100 % |
3722 100 % |
4007 100 % |
χ2=58.592 · df=7 · Cramer’s V=0.121 · p=0.000 |
Es zeigen sich signifikante Differenzen zwischen den Altersgruppen bezüglich der Parteienpräferenz (ablesbar am p-Wert unter der Kreuztabelle; dieser ist deutlich kleiner als ein Signifikanznivau von z.B. 5%). So ist anhand der Kreuztabelle zu erkennen, dass DIE GRÜNEN, DIE LINKE und die FDP von der jüngeren Altersgruppe stärker präferiert werden als von der älteren Altersgruppe. Diese wählt wiederum in höherem Maße die etablierten Volksparteien (CDU-CSU, SPD).
In einem zweiten Schritt überprüft Emma jetzt auch die Ergebnisse für das politische Interesse. Da dieses ordinalskaliert ist, nutzt Sie einen Wilcoxon-Mann-Whitney-Test (auch: Mann-Whitney-U-Test, U-Test, Wilcoxon-Rangsummentest).
Dafür nutzt sie den Befehl:
wilcox.test().
Für den Test muss sie angeben, welche beiden Variablen sie testen möchte. Wichtig ist, dass sie zuerst die abhängige Variable, also “pa02a” und dann die Gruppenvariable, also “age_group” eingibt. Anschließend gibt sie noch an auf welchen Datensatz sich der Test beziehen soll. In unserem Fall der zuvor erstellte Datensatz “ALLBUS_21_Analyse”.
wilcox.test(pa02a~ age_group, #abhängige Variable, Gruppenvariable
data = ALLBUS_21_Analyse) #Datensatz
#>
#> Wilcoxon rank sum test with continuity correction
#>
#> data: pa02a by age_group
#> W = 1040282, p-value = 0.0003701
#> alternative hypothesis: true location shift is not equal to 0
Das Ergebnis zeigt, dass die im Säulendiagramm sichtbaren Unterschiede im politischen Interesse zwischen den Altersgruppen auch statistisch signifikant sind.
Damit hat Emma alle geplanten Analysen des Datensatzes abgeschlossen und kann nun ihre Ergebnisse in der Abschlussarbeit verschriftlichen…