Kapitel 3 Hypotesetest (for én gruppe)

3.1 Emne i dette kapitel

Vi skal i dette kapitel se på hvilke specifikke konklusioner vi kan drage om en variabel. Det gør vi ved at opstille en metode bestående af 5 trin, der giver mulighed for at formulere og efterprøve forskellige påstande om en variabel.

Idéen er først at formulere en teoretisk model, der giver en generel beskrivelse af variablen (Trin 1: “Antagelser”), og dernæst på baggrund af modellen formulere en specifik påstand om variablen (Trin 2: “Hypoteser”).

Herefter kan vi efterprøve påstanden ved at sammenholde vores datamateriale med, hvordan variablen ifølge den teoretiske model burde opføre sig, hvis ellers den formulerede påstand er korrekt (Trin 3: “Teststørrelse”).

Ved at se på om der er stor eller lille forskel på datamateriale og model (Trin 4: “P-værdi”), kan vi slutteligt konkludere, om der er belæg for den formulerede påstand eller ej (Trin 5: “Konklusion”).

Eksempel: Ølsalg

Ser vi på prisen for 1 stk. Grøn Tuborg (33 cl glasflaske) i supermarkedskæden Føtex, så kunne et eksempel på en konklusion om denne variabel være:

Den forventede pris på 1 stk. Grøn Tuborg i Føtex er 3,50 kr.

Spørgsmålet er, om vores datamateriale bestående af 157 ugentlige observationer af prisen på Grøn Tuborg i Føtex understøtter denne påstand? Eller om datamaterialet måske snarere indikerer, at påstanden er forkert?

Vi har tidligere set, at vores bedste gæt på den forventede pris på Grøn Tuborg i Føtex er \(\hat\mu\) = 3,44 kr. Det gæt er imidlertid behæftet med usikkerhed og afhængig af størrelsen af denne usikkerhed er spørgsmålet, hvad vi reelt kan sige om vores forventning til prisen på Grøn Tuborg?

Hvilke påstande om forventningen til prisen på Grøn Tuborg er i overensstemmelse med vores datamateriale? Er der eksempelvis på baggrund af datamaterialets 157 observationer belæg for at hævde, at den forventede pris på Grøn Tuborg…

er 3,40 kr.?
er højst 3,60 kr.?
er mindst 3,40 kr.?

Det vi skal se på i dette kapitel er, hvordan vi kan afgøre, om der er belæg for en given påstand - i dette eksempel om forventningen til prisen på Grøn Tuborg - på baggrund af observationerne i vores datamateriale.

Eksempel: Skat

I spørgeskemaundersøgelsen om velfærd og skat har vi tidligere set på svarene på spørgsmålet “Er topskatten for høj?” Et eksempel på en konklusion om denne variabel kunne være:

Andelen af danskere, der mener at topskatten er for høj, er 35%

Spørgsmålet er, om vores datamateriale bestående af svar fra 975 personer understøtter denne påstand? Eller om datamaterialet måske snarere indikerer, at påstanden er forkert?

Vi har tidligere set, at vores bedste gæt på andelen af befolkningen, der mener topskatten er for høj, er \(\hat p\) = 35,5%. Det gæt er imidlertid behæftet med usikkerhed, og afhængig af størrelsen af denne usikkerhed er spørgsmålet, hvad vi reelt kan sige om andelen af befolkningen, der mener at topskatten er for høj?

Hvilke påstande om denne andel er i overensstemmelse med vores datamateriale? Er der eksempelvis på baggrund af datamaterialets 975 observationer belæg for at hævde, at andelen af befolkningen, der mener topskatten er for høj…

er 30%?
er højst 40%?
er mindst 30%?

Det vi skal se på i dette kapitel er, hvordan vi kan afgøre, om der er belæg for en given påstand - i dette eksempel om andelen af befolkningen, der mener topskatten er for høj - på baggrund af observationerne i vores datamateriale.