2.3.2 I praksis
2.3.2.1 Beregning
Når vi skal estimere forskellen p1−p2 mellem andelene af 1’ere i to grupper, hvor hver observation har de to mulige udfald 1 og 0, kan vi bruge det nedenstående resultat til at sige noget om, hvor præcist vores estimat ˆp1−ˆp2 er.
Resultat: Konfidensinterval for p1−p2
Under antagelserne i det foregående afsnit vil forskellen p1−p2 mellem andelene i de to grupper ligge i intervallet [ˆp1−ˆp2+zα/2⋅√ˆp1(1−ˆp1)n1+ˆp2(1−ˆp2)n2;ˆp:1−ˆp2−zα/2⋅√ˆp1(1−ˆp1)n1+ˆp2(1−ˆp2)n2] ca. med sandsynlighed 1−α, hvor zα/2 er α/2-fraktilen i standardnormalfordelingen N(0,1).
Bemærk: For ethvert 0<α<1 er zα/2<0 og dermed −zα/2>0, således at intervallet ovenfor altid er veldefineret.
Eksempel: Skat
Vi ser igen på svarene på spørgsmålet “Er topskatten for høj?” opdelt på henholdsvis mænd og kvinder og beregner nu et konfidensinterval for forskellen mellem andelen, der svarede “Ja” på spørgsmålet, hos de to køn (dvs. vi betegner de mulige udfald med 1=“Ja” og 0=“Nej”).
Sætter vi α=5%, finder vi, at et 95% (=1−α) konfidensinterval for forskellen p1−p2 er givet som =[ˆp1−ˆp2+z2,5%⋅√ˆp1(1−ˆp1)n1+ˆp2(1−ˆp2)n2;ˆp1−ˆp2−z2,5%⋅√ˆp1(1−ˆp1)n1+ˆp2(1−ˆp2)n2]=[0,039;0,158]

Figur 2.7: 95%-konfidensinterval for forskellen i andele
Med 95% sandsynlighed vil den sande forskel mellem andelen af “Ja”-sigere (dem der mener, at topskatten er for høj) blandt mænd og kvinder således ligge mellem 3,9% og 15,8 %.
På tilsvarende vis er eksempelvis et 99%-konfidensinterval givet som [0,020;0,177].

Figur 2.8: 99%-konfidensinterval for forskellen i andele
Med 99% sandsynlighed vil den sande forskel mellem andelen af “Ja”-sigere blandt mænd og kvinder således ligge mellem 2,0% og 17,7%.
Der ser dermed på baggrund af datamaterialet ud til at være tegn på en forskel blandt kønnene på andelen af “Ja”-sigere. En større andel af mænd end af kvinder ser ud til at mene, at topskatten er for høj.
2.3.2.2 Intuition
- Jo flere observationer n1, desto smallere bliver konfidensintervallet, indtil et vist punkt hvorefter intervallets bredde reelt er uændret. Intuitionen er, at jo flere observationer i gruppe 1 (dvs. jo mere information om p1) vi har til rådighed, desto mere præcist er vi i stand til at gætte på værdien af p1 og dermed på værdien af p1−p2. Men uanset hvor meget information vi har fra gruppe 1, er der fortsat usikkerhed om p2 og dermed også om p1−p2.
- Jo højere konfidensniveau 1−α, desto bredere bliver konfidensintervallet. Intuitionen er, at jo mere sikker vi vil være på, at intervallet indeholder den sande værdi p1−p2, desto bredere er vi nødt til at gøre intervallet.