6.5 Übersicht Arbeitsdatensatz

An dieser Stelle sollten Sie sich nun bereits einmal mit diesem eigens für den Kurs erstellten Arbeitsdatensatz vertraut machen. Dieser entstammt einem aktuellen Forschungsprojekt aus dem Arbeitsbereich KMW I am Institut für Sozialwissenschaften der HHU Düsseldorf.

Zunächst einmal geben wir uns mit dem Befehl Befehl head() für die ersten sechs Fälle8 die Werte für alle Variablen im Datensatz aus.

head(daten_latente_konstrukte)
##   einstellung_eu pol_int1 pol_int2 pol_int3 ta1 ta2 ta3 ta4 wissen1 wissen2 wissen3 wissen4 wissen5 wissen6 wissen7 wissen8
## 1              4        2        3        3   2   2   2   2       1       1       1       2       1       1       2       1
## 2              4        3        2        2   3   3   1   2      NA       2      NA       2       2       2      NA       1
## 3              3        5        4        4   4   3   2   3       1       2       1       2       1       2       2       1
## 5              3        5        4        3   5   5   5   4       1       1       1       2       2       1       2       1
## 6              4        5        5        5   4   5   5   5       1       2       2       2       2       1       2       1
## 8              3        4        3        3   4   4   3   3       1       2       2       2       2       1       2       1
##   wissen9 il1 il2 il3 tl1 tl2 tl3 tl4 tl5 tl6 zielerreichung1 zielerreichung2 zielerreichung3 zielerreichung4 OL1 OL2 OL3
## 1       1   2   2   2   3   3   3   4   4   4               4               4               3               3   4   4   4
## 2       1   4   3   3   4   4   4   4   4   4               5               5               4               3   5   5   5
## 3       1   2   3   3   2   2   2   2   3   3               3               2               2               3   3   2   1
## 5       1   1   1   1   1   1   1   1   1   1               5              NA               1               5   5   1   1
## 6       1   2   3   2   3   3   3   4   4   4               3               3               4               4   4   3   2
## 8       1   3   3   3   4   4   4   4   4   4               4               4               4               4   4   4   3
##   protest1 protest2 protest3 protest4 SD01 SD04_01 SD22_01 SD11 SD11_10 ZG01 polinteresse technikakzeptanz alter gender
## 1        4        2        2        3    2    1986       4    8       0    1          2.7              2.0    32      1
## 2        1        1        1        1    1    1981       1    8       0    1          2.3              2.2    37      0
## 3        5        3        4        5    2    1963       6    4       0    1          4.3              3.0    55      1
## 5        5        5        5        5    2    1986       6    4       0    1          4.0              4.8    32      1
## 6        2        2        2        3    2    1964       8    8       0    1          5.0              4.8    54      1
## 8        3        3        3        3    2    1964       7    8       0    1          3.3              3.5    54      1
##   wissen bildung bildung2 wissen_dichotom
## 1      8       8        2               1
## 2      4       8        2               0
## 3      6       4        1               0
## 5      9       4        1               1
## 6      7       8        2               1
## 8      7       8        2               1

Wie Sie sehen gibt es dort eine ganze Menge Variablen, von denen wir jedoch nicht immer alle benötigen werden.

Für diesen Datensatz wurden die folgenden Konstrukte erhoben:

  • Das Konstrukt Interesse an medialer Politikberichterstattung mit 3 Indikatorvariablen.
    • Variablen pol_int1, pol_int2 und pol_int3 im Datensatz
  • Das Konstrukt Technikakzeptanz mit 4 Indikatorvariablen
    • Variablen ta1, ta2, ta3 und ta4 im Datensatz
  • Das Konstrukt Input-Legitimität mit
    • Variablen il1, il2 und il3 im Datensatz
  • Das Konstrukt Wissen über die EU mit einem Wissenstest mit 9 Fragen zur Europäischen Union
    • Variablen wissen1 bis wissen9

Auf die einzelnen Konstrukte selbst sind wir teilweise bereits in Abschnitt zu den Konstrukten in der politischen Kommunikationsforschung einmal eingegangen.

Zudem finden sich natürlich Variablen zur Soziodemographie im Datensatz (Variablen alter, gender und bildung), die wir uns nachfolgend einmal genauer anschauen, um einen Eindruck von der Stichprobe zu gewinnen.Zunächst führen wir daher, auch zur Übung, ein paar einfache Analysen zum Sample durch.

#Informationen zur Altersvariable
summary(daten_latente_konstrukte$alter)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      18      34      50      48      60      83
#Visuelle Darstellung der Alters-Verteilung mit Barchart
alter_auszaehlung <- table(daten_latente_konstrukte$alter)

barplot(alter_auszaehlung, xlab="Alter der Befragten")

#Informationen zur Gendervariable

gender_auszaehlung <- table(daten_latente_konstrukte$gender) 

gender_group <- c("weiblich", "männlich")

barplot(gender_auszaehlung,
        names.arg = gender_group,
        xlab="Geschlecht")


  1. Wie auch im SPSS-Datensatz üblich findet sich im Wide-Format ein Fall pro Zeile.↩︎