3.2 Metoden bag hypotesetest
Hypotesetest om en middelværdi μ i en normalfordeling og hypotesetest om en andel p i en binomialfordeling foregår efter nøjagtig samme metode. Vi beskriver derfor i dette afsnit for overskueligheden skyld blot metoden med udgangspunkt i test af hypoteser om middelværdien μ.
Når vi skal undersøge en påstand om den forventede værdi μ af en normalfordelt variabel N(μ,σ), tager vi udgangspunkt i et datamateriale bestående af n observationer. Formålet er – på baggrund af datamaterialet – at undersøge en specifik påstand om den ukendte middelværdi μ.
Metoden kaldes hypotesetest om μ og består af følgende 5 trin:
- Trin 1: “Antagelser” (“assumptions”)
- Trin 2: “Hypoteser” (“hypotheses”)
- Trin 3: “Teststørrelse” (“test statistic”)
- Trin 4: “P-værdi” (“P-value”)
- Trin 5: “Konklusion” (“conclusion”)
Eksempel: Ølsalg
Lad os her, som illustration af metoden, gennemgå hvordan vi kan undersøge påstanden om, at den forventede pris μ på Grøn Tuborg i Føtex er 3,50 kr.
3.2.1 Trin 1: Antagelser
Vi antager, at vores datamateriale består af n indbyrdes uafhængige observationer, der alle stammer fra den samme normalfordeling N(μ,σ).
I praksis kan vi undersøge om denne antagelse er rimelig ved at tegne et histogram og et normalfraktildiagram af datamaterialet og se på, om figurerne indikerer overensstemelse med normalfordelingen.
Eksempel: Ølsalg
Vi antager her, at de 157 ugentlige observationer af prisen på Grøn Tuborg i Føtex er indbyrdes uafhængige og alle kan beskrives af den samme normalfordeling N(μ,σ).
Som vi har set i afsnit 1.2 viser et histogram af de 157 prisobservationer, at normalfordelingen med en vis rimelighed kan bruges til beskrivelse af prisen på Grøn Tuborg i Føtex.
3.2.2 Trin 2: Hypoteser
Den påstand vi ønsker at undersøge om den ukendte middelværdi μ udtrykker vi ved hjælp af den såkaldte nulhypotese H0 (“null hypothesis”).
Hypoteser formuleres altid i par, dvs. at nulhypotesen altid suppleres af en såkaldt alternativhypotese Ha (“alternative hypothesis”), som udtrykker det modsatte af nulhypotesen. Så snart man har formuleret sin nulhypotese, så er alternativhypotesen automatisk givet som “det modsatte af nulhypotesen”.
Idéen er nu, at enten er datamaterialet i overensstemmelse med nulhypotesen, eller også er det i overensstemmelse med alternativhypotesen. Hvorvidt det ene eller det andet er tilfældet afgør vi ved at se på en såkaldt teststørrelse.
Eksempel: Ølsalg
Påstanden om, at den forventede pris μ på Grøn Tuborg i Føtex er 3,50 kr., kan vi udtrykke ved at angive henholdsvis nul- og alternativhypotese som H0:μ=3,50Ha:μ≠3,50 Nulhypotesen (H0) udtrykker vores påstand om den forventede pris på Grøn Tuborg, mens alternativhypotesen (Ha) udtrykker det modsatte af vores påstand.
3.2.3 Trin 3: Teststørrelse
Teststørrelsen bruger vi til at sammenligne vores datamateriale med den formulerede påstand H0. Vi ønsker at vurdere, om datamaterialet ser ud til at være i overensstemmelse med påstanden eller ej.
Som teststørrelse bruger vi udtrykket Z=ˆμ−μˆσ√n Her repræsenterer ˆμ} det bedste gæt på værdien af den ukendte middelværdi baseret på datamaterialet, mens μ repræsenterer den sande (men ukendte) middelværdi baseret på den formulerede påstand.
Vi tænker dermed på tælleren ˆμ−μ i teststørrelsen Z som et mål for om datamateriale og påstand er i overensstemmelse med hinanden eller ej:
ˆμ−μ="datamaterialets gæt på μ"−"den påståede værdi af μ"
Hvis påstanden H0 er sand (falsk), vil vi forvente, at ˆμ og μ ligger forholdsvis tæt på (langt fra) hinanden.
En lille (stor) værdi af Z er derfor udtryk for, at der er lille (stor) forskel på vores datamateriale og den formulerede påstand.
Normeringen ˆσ√n i vores teststørrelse Z=ˆμ−μˆσ√n kan man tænke på som en teknisk bekvemmelighed, der gør, at vi ved hvilken fordeling, der beskriver teststørrelsen Z, og at vi dermed kan regne sandsynligheder ud om Z.
For at vurdere om den beregnede værdi af teststørrelsen Z er lille eller stor, dvs. om datamaterialet er i god eller dårlig overenstemmelse med påstanden H0, har vi behov for at kunne afgøre, hvornår en værdi af Z skal opfattes som “lille” henholdsvis “stor”. Det gør vi ved hjælp af den såkaldte P-værdi.
Eksempel: Ølsalg
I tilfældet med prisen på Grøn Tuborg i Føtex estimeres normalfordelingens parametre til ˆμ=3,44kr.ˆσ=0,23kr. på baggrund af et datamateriale bestående af n=157 observationer.Figur 3.1: Nøgletal for Grøn Tuborg i Føtex
Under forudsætning af at nulhypotesen
H0:μ=3,50
er sand, kan værdien af teststørrelsen beregnes til
Z=ˆμ−μ0ˆσ√n=3,44−3,500,23√157=−3,37
3.2.4 Trin 4: P-værdi
Hvis vi antager, at påstanden H0 er korrekt, så har vi set i kapitel 1, at teststørrelsen Z er beskrevet ved en t-fordeling med n−1 frihedsgrader.
Dermed kan vi under antagelse af at påstanden H0 er sand beregne sandsynligheden for, at et datamateriale vil være i dårligere overensstemmelse med påstanden H0 (som målt ved teststørrelsen Z) end tilfældet er med vores observerede datamateriale.
Denne sandsynlighed – kaldet P-værdien – vil vi herefter bruge som mål for, om datamaterialet ser ud til at være i overensstemmelse med påstanden H0 eller ej. P-værdien kaldes også for signifikanssandsynligheden.
Hvis P-værdien er stor (lille), betyder det, at der er stor (lille) sandsynlighed for at observere et datamateriale, som er i dårligere overensstemmelse med påstanden H0 end tilfældet er med vores datamateriale.
Med andre ord: En stor (lille) P-værdi betyder, at det er meget sandsynligt (usandsynligt) at observere et datamateriale, der passer dårligere med påstanden H0 end vores givne datamateriale under forudsætning af at påstanden H0 rent faktisk er korrekt. Meget tyder derfor på, at påstanden H0 nok er (ikke er) korrekt.
Derfor vil vi opfatte en stor (lille) P-værdi som evidens for (imod) påstanden H0.
Eksempel: Ølsalg
I tilfældet med prisen på Grøn Tuborg i Føtex er teststørrelsen Z beskrevet ved en t-fordeling med n−1 = 156 frihedsgrader.
Teststørrelsen blev beregnet til -3,37 og på baggrund af det kan P-værdien beregnes til 0,09% (vi skal senere i dette kapitel se, præcis hvordan P-værdien beregnes).
3.2.5 Trin 5: Konklusion
På baggrund af indholdet af trin 1 – trin 4 ovenfor kan vi afgøre, hvorvidt vores datamateriale underbygger påstanden formuleret i form af nulhypotesen H0 eller ej.
Som praktisk beslutningsregel vil vi sammenholde den beregnede P-værdi med et på forhånd valgt signifikansniveau α} (“significance level”). Typisk bruger vi α=5%.
Hvis P-værdien er…
- mindre end α vil vi ikke tro på, at påstanden H0 er sand. Vi vil derfor forkaste påstanden H0 og i stedet tro på, at alternativhypotesen Ha er sand
- større end α vil vi ikke afvise, at påstanden H0 kan være sand. Vi vil derfor ikke forkaste påstanden H0
Eksempel: Ølsalg
Hvis vi anvender et signifikansniveau på α=5%, vil vi forkaste nulhypotesen H0 (fordi P-værdi = 0,09% < 5% = α) H0:μ=3,50 dvs. forkaste at den forventede pris på Grøn Tuborg i Føtex er 3,50 kr. Vi vil i stedet tro på indholdet af alternativhypotesen Ha:μ≠3,50 dvs. tro på at den forventede pris på Grøn Tuborg i Føtex ikke er 3,50 kr.
På baggrund af det udførte hypotesetest er konklusionen, at der ikke på baggrund af vores datamateriale bestående af 157 ugentlige observationer af prisen på Grøn Tuborg i Føtex er belæg for en påstand om, at den forventede pris på Grøn Tuborg i Føtex er 3,50 kr.
Et naturligt opfølgende spørgsmål at stille sig selv er, hvilke påstande der så *er belæg for på baggrund af datamaterialet?!
Udover at prøve at lave hypotesetest med andre værdier end lige 3,50 i nulhypotesen H0, så findes der også andre måder at formulere nulhypotesen på end den, vi indtil videre har set på, og andre hypoteser kan muligvis give os andre indsigter i, hvad der er belæg for at hævde på baggrund af vores datamateriale.