1.2.2 Konfidensinterval (teori), “my-hat”
1.2.2.1 Transformation
Vi er interesseret i at finde ud af, hvor præcist vores gæt/estimat ˆμ af den ukendte middelværdi μ i normalfordelingen er. For at kunne sige noget om præcisionen af ˆμ er vi nødt til først at finde ud af, hvilken fordeling der kan bruges til at beskrive vores estimat.
Vi ved fra afsnit 1.2.1, at estimatet ˆμ kan beskrives ved hjælp af en normalfordeling ˆμ∼N(μ,σ/√n)
Det kan vi alternativt også skrive som ˆμ−μσ/√n∼N(0,1) på grund af normalfordelingens transformationsegenskab.
Resultat: Transformation fra N(μ,σ) til N(0,1)
Hvis X1,...,Xn er indbyrdes uafhængige normalfordelte variable N(μ,σ), så er Z=ˆμ−μσ√n standardnormalfordelt Z∼N(0,1).
I størrelsen ˆμ−μσ/√n indgår imidlertid to ukendte størrelser – både μ og σ. Hvis vi vil sige noget om estimatet af μ (dvs. ˆμ), er vi nødt til først at fjerne den ukendte størrelse σ.
Det problem løser vi ved at indsætte vores estimat ˆσ for σ, dvs. ved i stedet at se på ˆμ−μˆσ/√n.
Det har imidlertid som konsekvens, at resultatet ovenfor ændrer sig fra ˆμ−μσ/√n∼N(0,1) til i stedet at blive ˆμ−μˆσ/√n∼t(n−1) hvor t(n−1) er den såkaldte t-fordeling} (“t distribution”) med n−1 frihedsgrader (“degrees of freedom”).
Resultat: Transformation fra N(μ,σ) til t
Hvis X1,...,Xn er indbyrdes uafhængige normalfordelte variable N(μ,σ), så er Z=ˆμ−μˆσ√n t-fordelt med n−1 frihedsgrader Z∼t(n−1).
Forskellen på de to resultater ovenfor er, at vi i det nederste resultat erstatter den ukendte teoretiske standardafvigelse σ med vores estimat ˆσ. Det har som konsekvens, at standardnormalfordelingen N(0,1) bliver skiftet ud med t-fordelingen.
Vi ved dermed nu, at vi kan at vores gæt ˆμ på den ukendte middelværdi μ i en normalfordeling kan beskrives ved hjælp af en såkaldt t-fordeling. Når vi lige har lært t-fordeling lidt bedre at kende, kan vi bruge det til at finde et udtryk for præcisionen af vores gæt ˆμ.
1.2.2.2 t-fordelingen
t-fordelingen er vigtig, fordi den beskriver fordelingen af størrelsen ˆμ−μˆσ/√n, og denne størrelse kan – som vi skal se om lidt – sammen med t-fordelingen bruges til at udtale sig om, hvor præcist et estimat ˆμ er.
Men først nogle facts om t-fordelingen. Fordelingen…
- er klokkeformet
- har centrum i 0
- er symmetrisk omkring 0
- har én parameter f, der kaldes “antal frihedsgrader”
- minder meget om standardnormalfordelingen N(0,1) (begge fordelinger er symmetriske, klokkeformede og har centrum i 0)
- har lidt tungere haler end standardnormalfordelingen
- minder mere og mere om standardnormalfordelingen, desto større antallet af frihedsgrader f er (og for passende store værdier af f (> 30) vil t-fordelingen og standardnormalfordelingen for alle praktiske formål være ens)
t-fordelingen er som sagt symmetrisk omkring 0, og det kan vi udnytte. Ser vi eksempelvis på 2,5%-fraktilen i t-fordelingen med f=10 frihedsgrader, som vi ved beregning kan finde til t2,5%(10)=-2,23, så betyder det, at der per definition ligger 2,5% sandsynlighed til venstre for værdien -2,23
og pga. symmetrien også 2,5% sandsynlighed til højre for værdien 2,23
og dermed ligger der 95% sandsynlighed i intervallet [-2,23;;2,23]
Symmetriovervejelserne ovenfor gælder ikke kun i det ovenstående eksempel med f=10. t-fordelingen er nemlig symmetrisk omkring 0 uanset antallet af frihedsgrader f. Det leder til nedenstående generelle overvejelse (tilfældet ovenfor svarer til α=5%).
For 0<α<1 ligger der per definition α/2 sandsynlighed til venstre for α/2-fraktilen tα/2(f)
og pga. symmetrien også α/2 sandsynlighed til højre for værdien −tα/2(f)
og dermed ligger der 1−α sandsynlighed i intervallet [tα/2(f);−tα/2(f)]
1.2.2.3 Præcision af ˆμ
Vi er nu endelig klar til at sige noget om præcisionen af vores middelværdiestimat ˆμ.
Vi ved, at størrelsen ˆμ−μˆσ/√n er beskrevet ved en t-fordeling med n−1 frihedsgrader.
Vi har ovenfor set, hvordan vi i t-fordelingen kan konstruere et interval, som indeholder en vis mængde sandsynlighed.
Ved at bruge disse overvejelser på størrelsen ˆμ−μˆσ/√n kan vi konstruere et interval, som indeholder ˆμ−μˆσ/√n med en vis sandsynlighed.
Ved at flytte lidt rundt på tingene (transformere) kan vi ændre det til et interval, som indeholder ˆμ med en vis sandsynlighed.
Vi får hermed konstrueret et interval som med en vis sandsynlighed indeholder vores middelværdiestimat ˆμ. Intervallet siger dermed noget om, hvor meget eller lidt vi skal forvente, at middelværdiestimatet ˆμ vil variere, dvs. det siger noget om, hvor præcist vores estimat ˆμ er.
Mere formelt, så laver vi følgende overvejelse. For 0<α<1 ligger ˆμ−μˆσ/√n med sandsynlighed 1−α i intervallet [tα/2(n−1);−tα/2(n−1)]
og dermed ligger ˆμ−μ med sandsynlighed 1−α i intervallet [tα/2(n−1)ˆσ/√n;−tα/2(n−1)ˆσ/√n]
og dermed ligger ˆμ med sandsynlighed 1−α i intervallet [μ+tα/2(n−1)ˆσ/√n;μ−tα/2(n−1)ˆσ/√n]
OPSUMMERING:
- Vi har nu fundet frem til det resultat, vi skal bruge til at sige noget om præcisionen af vores middelværdiestimat ˆμ.
- Udgangspunktet er, at vi gerne vil estimere middelværdien μ i en normalfordeling.
- Resultatet siger, at med sandsynlighed 1−α er forskellen mellem den ukendte størrelse μ og vores estimat ˆμ mindre end −2tα/2(n−1)ˆσ/√n (= længden af intervallet [μ+tα/2(n−1)ˆσ/√n;μ−tα/2(n−1)ˆσ/√n]).
- Ved at vælge en værdi af α tæt på 0, bliver 1−α tæt på 1, og dermed siger resultatet, at afstanden mellem den ukendte værdi μ og vores estimat ˆμ med stor sandsynlighed (= 1−α) ligger indenfor en afstand på −2tα/2(n−1)ˆσ/√n af hinanden.