1.2.2 Konfidensinterval (teori), “my-hat”

1.2.2.1 Transformation

Vi er interesseret i at finde ud af, hvor præcist vores gæt/estimat ˆμ af den ukendte middelværdi μ i normalfordelingen er. For at kunne sige noget om præcisionen af ˆμ er vi nødt til først at finde ud af, hvilken fordeling der kan bruges til at beskrive vores estimat.

Vi ved fra afsnit 1.2.1, at estimatet ˆμ kan beskrives ved hjælp af en normalfordeling ˆμN(μ,σ/n)

Det kan vi alternativt også skrive som ˆμμσ/nN(0,1) på grund af normalfordelingens transformationsegenskab.

Resultat: Transformation fra N(μ,σ) til N(0,1)

Hvis X1,...,Xn er indbyrdes uafhængige normalfordelte variable N(μ,σ), så er Z=ˆμμσn standardnormalfordelt ZN(0,1).

I størrelsen ˆμμσ/n indgår imidlertid to ukendte størrelser – både μ og σ. Hvis vi vil sige noget om estimatet af μ (dvs. ˆμ), er vi nødt til først at fjerne den ukendte størrelse σ.

Det problem løser vi ved at indsætte vores estimat ˆσ for σ, dvs. ved i stedet at se på ˆμμˆσ/n.

Det har imidlertid som konsekvens, at resultatet ovenfor ændrer sig fra ˆμμσ/nN(0,1) til i stedet at blive ˆμμˆσ/nt(n1) hvor t(n1) er den såkaldte t-fordeling} (“t distribution”) med n1 frihedsgrader (“degrees of freedom”).

Resultat: Transformation fra N(μ,σ) til t

Hvis X1,...,Xn er indbyrdes uafhængige normalfordelte variable N(μ,σ), så er Z=ˆμμˆσn t-fordelt med n1 frihedsgrader Zt(n1).

Forskellen på de to resultater ovenfor er, at vi i det nederste resultat erstatter den ukendte teoretiske standardafvigelse σ med vores estimat ˆσ. Det har som konsekvens, at standardnormalfordelingen N(0,1) bliver skiftet ud med t-fordelingen.

Vi ved dermed nu, at vi kan at vores gæt ˆμ på den ukendte middelværdi μ i en normalfordeling kan beskrives ved hjælp af en såkaldt t-fordeling. Når vi lige har lært t-fordeling lidt bedre at kende, kan vi bruge det til at finde et udtryk for præcisionen af vores gæt ˆμ.

1.2.2.2 t-fordelingen

t-fordelingen er vigtig, fordi den beskriver fordelingen af størrelsen ˆμμˆσ/n, og denne størrelse kan – som vi skal se om lidt – sammen med t-fordelingen bruges til at udtale sig om, hvor præcist et estimat ˆμ er.

Men først nogle facts om t-fordelingen. Fordelingen…

  • er klokkeformet
  • har centrum i 0
  • er symmetrisk omkring 0
  • har én parameter f, der kaldes “antal frihedsgrader”
  • minder meget om standardnormalfordelingen N(0,1) (begge fordelinger er symmetriske, klokkeformede og har centrum i 0)
  • har lidt tungere haler end standardnormalfordelingen
  • minder mere og mere om standardnormalfordelingen, desto større antallet af frihedsgrader f er (og for passende store værdier af f (> 30) vil t-fordelingen og standardnormalfordelingen for alle praktiske formål være ens)

t-fordelingen er som sagt symmetrisk omkring 0, og det kan vi udnytte. Ser vi eksempelvis på 2,5%-fraktilen i t-fordelingen med f=10 frihedsgrader, som vi ved beregning kan finde til t2,5%(10)=-2,23, så betyder det, at der per definition ligger 2,5% sandsynlighed til venstre for værdien -2,23

og pga. symmetrien også 2,5% sandsynlighed til højre for værdien 2,23

og dermed ligger der 95% sandsynlighed i intervallet [-2,23;;2,23]

Symmetriovervejelserne ovenfor gælder ikke kun i det ovenstående eksempel med f=10. t-fordelingen er nemlig symmetrisk omkring 0 uanset antallet af frihedsgrader f. Det leder til nedenstående generelle overvejelse (tilfældet ovenfor svarer til α=5%).

For 0<α<1 ligger der per definition α/2 sandsynlighed til venstre for α/2-fraktilen tα/2(f)

og pga. symmetrien også α/2 sandsynlighed til højre for værdien tα/2(f)

og dermed ligger der 1α sandsynlighed i intervallet [tα/2(f);tα/2(f)]

1.2.2.3 Præcision af ˆμ

Vi er nu endelig klar til at sige noget om præcisionen af vores middelværdiestimat ˆμ.

Vi ved, at størrelsen ˆμμˆσ/n er beskrevet ved en t-fordeling med n1 frihedsgrader.

Vi har ovenfor set, hvordan vi i t-fordelingen kan konstruere et interval, som indeholder en vis mængde sandsynlighed.

Ved at bruge disse overvejelser på størrelsen ˆμμˆσ/n kan vi konstruere et interval, som indeholder ˆμμˆσ/n med en vis sandsynlighed.

Ved at flytte lidt rundt på tingene (transformere) kan vi ændre det til et interval, som indeholder ˆμ med en vis sandsynlighed.

Vi får hermed konstrueret et interval som med en vis sandsynlighed indeholder vores middelværdiestimat ˆμ. Intervallet siger dermed noget om, hvor meget eller lidt vi skal forvente, at middelværdiestimatet ˆμ vil variere, dvs. det siger noget om, hvor præcist vores estimat ˆμ er.

Mere formelt, så laver vi følgende overvejelse. For 0<α<1 ligger ˆμμˆσ/n med sandsynlighed 1α i intervallet [tα/2(n1);tα/2(n1)]

og dermed ligger ˆμμ med sandsynlighed 1α i intervallet [tα/2(n1)ˆσ/n;tα/2(n1)ˆσ/n]

og dermed ligger ˆμ med sandsynlighed 1α i intervallet [μ+tα/2(n1)ˆσ/n;μtα/2(n1)ˆσ/n]

OPSUMMERING:

  • Vi har nu fundet frem til det resultat, vi skal bruge til at sige noget om præcisionen af vores middelværdiestimat ˆμ.
  • Udgangspunktet er, at vi gerne vil estimere middelværdien μ i en normalfordeling.
  • Resultatet siger, at med sandsynlighed 1α er forskellen mellem den ukendte størrelse μ og vores estimat ˆμ mindre end 2tα/2(n1)ˆσ/n (= længden af intervallet [μ+tα/2(n1)ˆσ/n;μtα/2(n1)ˆσ/n]).
  • Ved at vælge en værdi af α tæt på 0, bliver 1α tæt på 1, og dermed siger resultatet, at afstanden mellem den ukendte værdi μ og vores estimat ˆμ med stor sandsynlighed (= 1α) ligger indenfor en afstand på 2tα/2(n1)ˆσ/n af hinanden.