3.3 Normalfordeling
3.3.1 Hypotesetest om μ
3.3.1.1 Formulering af hypoteser
Hver gang man laver et hypotesetest om μ, skal man igennem alle fem trin (jf. afsnit 3.2). Indholdet af trin 1, trin 3 og trin 5 er dog altid det samme.
Der findes imidlertid forskellige måder at formulere sine hypoteser på (trin 2), og valget af hypotese påvirker også beregningen af P-værdien (trin 4). Derfor kan der være forskel på indholdet af trin 2 og tirn 4 afhængig af præcis hvilket hypotesetest om μ, man ønsker at lave.
Inden vi ser nærmere på de forskellige mulige hypoteser og de tilhørende beregninger af P-værdier, så lad os først lige opsummere de tre trin 1, 3 og 5, der altid er de samme.
Hypotesetest om μ – Trin 1, 3, 5
Trin 1: Antagelser X1,...,Xn er indbyrdes uafhængige observationer af en variabel, der er normalfordelt N(μ,σ).
Trin 3: Teststørrelse Test af nulhypotesen H0 udføres ved hjælp af teststørrelsen Z=ˆμ−μ0ˆσ√n hvor μ0 er talværdien specificeret i nulhypotesen H0. Under forudsætning af at nulhypotesen H0 er sand, er teststørrelsen Z beskrevet ved en t-fordeling med n−1 frihedsgrader.
Trin 5: Konklusion Hvis P-værdien er…
- mindre end signifikansniveauet α forkaster vi nulhypotesen H0
- større end signifikansniveauet α forkaster vi ikke nulhypotesen H0
Som nævnt kan hypoteser (nul- og alternativ) formuleres på flere forskellige måder. Vi skal her se på tre forskellige muligheder.
Hypotesetest om μ – Trin 2
Når vi laver hypotesetest om μ, vil vi altid anvende én ud af tre nedenstående formuleringer af nulhypotesen H0 og alternativhypotesen Ha:
- Nulhypotese om at middelværdien er lig μ0: H0:μ=μ0ogHa:μ≠μ0
- Nulhypotese om at middelværdien er mindre end μ0:: H0:μ≤μ0ogHa:μ>μ0
- Nulhypotese om at middelværdien er større end μ0: H0:μ≥μ0ogHa:μ<μ0
Bemærk at:
- μ0 er blot notation for den talværdi, man ønsker at undersøge i forbindelse med sit hypotesetest
- ≠ betyder “forskellig fra”. Udtrykket μ≠μ0 betyder således, at enten er μ>μ0 eller også er μ<μ0
- Test af nulhypotesen H0:μ=μ0 (dvs. hvor Ha:μ≠μ0) kaldes for et 2-sidet test (“two-tailed test”), mens de to øvrige kaldes for 1-sidet test (“one-tailed”)
- Ved et 2-sidet test ser man på afvigelser fra nulhypotesen til begge (dvs. 2) sider i alternativhypotesen (Ha:μ≠μ0), mens man ved et 1-sidet test kun ser på afvigelser fra nulhypotesen til den ene side (dvs. enten Ha:μ>μ0 eller Ha:μ<μ0)
- I formuleringen af en nulhypotese om μ der involverer ulighedstegn, er det ligegyldigt, om man erstatter ≤ med < og tilsvarende erstatter ≥ med >. Det vil sige at det er ligegyldigt, om man skriver
H0:μ≤μ0ogHa:μ>μ0
eller
H0:μ<μ0ogHa:μ≥μ0
og tilsvarende er det ligegyldigt, om man skriver
H0:μ≥μ0ogHa:μ<μ0 eller H0:μ>μ0ogHa:μ≤μ0
3.3.1.2 Beregning af P-værdi
For at kunne drage en konklusion i et hypotesetest (i trin 5) kræver det, at vi først har beregnet en P-værdi (i trin 4).
Beregning af P-værdien bygger – uanset valget af hypotese – på den værdi af teststørrelsen Z=(ˆμ−μ0)/(ˆσ/√n), vi har beregnet i trin 3.
P-værdien bruges til at vurdere, om datamaterialet er foreneligt med nulhypotesen H0. Det gøres ved at se på, hvor stor sandsynligheden er for at observere noget, der er mere i modstrid med nulhypotesen H0 end vores datamateriale er.
P-værdien beregnes derfor som sandsynligheden for at få en værdi af teststørrelsen Z, der er mere i modstrid med nulhypotesen H0 end værdien af teststørrelsen beregnet på baggrund af datamaterialet.
Hvis P-værdien er lille (stor), er det udtryk for, at datamateriale og nulhypotese stemmer dårligt (fint) overens. Hvordan P-værdien helt specifikt beregnes afhænger af det konkrete valg af nul- og alternativhypotese.
Når P-værdien er beregnet, kan man drage konklusionen på hypotesetestet. Hvis den beregnede P-værdi er lille…
- er det tegn på, at det er en meget usædvanlig værdi af vores teststørrelse, vi har beregnet på baggrund af datamaterialet (under forudsætning af at nulhypotesen H0 er sand)
- virker det rimeligt at tro, at nulhypotesen nok ikke er sand
- vil vi i trin 5 vælge at forkaste nulhypotesen H0, såfremt P-værdien er lille nok (= mindre end det valgte signifikansniveau α)
Hvis den beregnede P-værdi er stor…
- er det tegn på, at det ikke er en usædvanlig værdi af vores teststørrelse, vi har beregnet på baggrund af datamaterialet (under forudsætning af at nulhypotesen H0 er sand)
- virker det rimeligt at tro, at nulhypotesen nok er sand
- vil vi i trin 5 vælge ikke at forkaste nulhypotesen H0, såfremt P-værdien er stor nok (= større end det valgte signifikansniveau α)
Test af H0:μ=μ0_
HVIS nulhypotesen H0 er sand…
- vil vi regne med, at vores estimat ˆμ ligger tæt på talværdien μ0, og at teststørrelsen Z=(ˆμ−μ0)/(ˆσ/√n) derfor ligger tæt på 0
- vil store positive eller negative værdier af teststørrelsen Z være i modstrid med nulhypotesen H0
- beregner vi P-værdien som sandsynligheden for, at teststørrelsen Z ligger længere væk fra 0 (i enten positiv eller negativ retning) end værdien beregnet ud fra datamaterialet.
Eksempel: Ølsalg
Vi ser fortsat på prisen for 1 stk. Grøn Tuborg (33 cl glasflaske) i supermarkedskæden Føtex, der kan beskrives ved en normalfordeling med estimerede parametre ˆμ =3,44 og ˆσ = 0,23 baseret på n=157 observationer.
Hvis vi betragter hypoteserne H0:μ=3,48Ha:μ≠3,48 (dvs. μ0=3,48) så svarer det til at undersøge, om den forventede pris kan antages at være 3,48 kr. eller om den ikke kan.
Under forudsætning af at nulhypotesen H0 er sand kan teststørrelsen beregnes til z=ˆμ−μ0ˆσ√n=3,44−3,480,230√157=−2,28 Herefter kan P-værdien beregnes som sandsynligheden for at observere noget, der er i dårligere overensstemmelse med H0 end værdien −2,28, dvs. som P(Z>2,28)+P(Z<−2,28)=2,38% hvor Z er beskrevet ved en t-fordeling med n−1=156 frihedsgrader.
Ved et signifikansniveau på α=5% forkaster vi således nulhypotesen H0 (fordi P-værdi=2,38%<5%=α). Der er således ikke på baggrund af datamaterialet belæg for at hævde, at den forventede pris på Grøn Tuborg er 3,48 kr.
Test af H0:μ≤μ0_
HVIS nulhypotesen H0 er sand…
- vil vi regne med, at vores estimat ˆμ er mindre end talværdien μ0, og at teststørrelsen Z=(ˆμ−μ0)/(ˆσ/√n) derfor er mindre end 0
- vil store positive værdier af teststørrelsen Z være i modstrid med nulhypotesen H0
- beregner vi P-værdien som sandsynligheden for, at teststørrelsen Z ligger længere væk fra 0 (i positiv retning) end værdien beregnet ud fra datamaterialet.
Eksempel: Ølsalg
Vi ser fortsat på prisen for 1 stk. Grøn Tuborg (33 cl glasflaske) i supermarkedskæden Føtex, der kan beskrives ved en normalfordeling med estimerede parametre ˆμ=3,44 og ˆσ=0,230 baseret på n=157 observationer.
Hvis vi betragter hypoteserne H0:μ≤3,48Ha:μ>3,48 (dvs. μ0=3,48) så svarer det til at undersøge, om den forventede pris kan antages at være lavere end 3,48 kr. eller om den ikke kan.
Under forudsætning af at nulhypotesen H0 er sand kan teststørrelsen beregnes til z=ˆμ−μ0ˆσ√n=3,44−3,480,230√157=−2,28
Herefter kan P-værdien beregnes som sandsynligheden for at observere noget, der er i dårligere overensstemmelse med H0 end værdien -2,28, dvs. som P(Z>−2,28)=98,81% hvor Z er beskrevet ved en t-fordeling med n−1=156 frihedsgrader.
Ved et signifikansniveau på α=5% forkaster vi således ikke nulhypotesen H0 (fordi P-værdi=98,81%>5%=α. Der er således ikke på baggrund af datamaterialet belæg for at afvise, at den forventede pris på Grøn Tuborg er lavere end 3,48 kr.
Test af H0:μ≥μ0_
HVIS nulhypotesen H0 er sand…
- vil vi regne med, at vores estimat ˆμ er større end talværdien μ0, og at teststørrelsen Z=(ˆμ−μ0)/(ˆσ/√n) derfor er større end 0
- vil store negative værdier af teststørrelsen Z være i modstrid med nulhypotesen H0
- beregner vi P-værdien som sandsynligheden for, at teststørrelsen Z ligger længere væk fra 0 (i *negativ* retning) end værdien beregnet ud fra datamaterialet
Eksempel: Ølsalg
Vi ser fortsat på prisen for 1 stk. Grøn Tuborg (33 cl glasflaske) i supermarkedskæden Føtex, der kan beskrives ved en normalfordeling med estimerede parametre ˆμ = 3,44 og ˆσ =0,23 baseret på n=157 observationer.
Hvis vi betragter hypoteserne H0:μ≥3,48Ha:μ<3,48 (dvs. μ0=3,48) så svarer det til at undersøge, om den forventede pris kan antages at være højere end 3,48 kr. eller om den ikke kan.
Under forudsætning af at nulhypotesen H0 er sand kan teststørrelsen beregnes til z=ˆμ−μ0ˆσ√n=3,44−3,480,230√157=−2,28
Herefter kan P-værdien beregnes som sandsynligheden for at observere noget, der er i dårligere overensstemmelse med H0 end værdien −2,28, dvs. som P(Z<−2,28)=1,19% hvor Z er beskrevet ved en t-fordeling med n−1=156 frihedsgrader.
Ved et signifikansniveau på α=5% forkaster vi således nulhypotesen H0 (fordi P-værdi=1,19%<5%=α). Der er således ikke på baggrund af datamaterialet belæg for at hævde, at den forventede pris på Grøn Tuborg er højere end 3,48 kr.