2.3 Binomialfordeling

2.3.1 Fordeling af forskel i to estimerede andele

Vi antager i det følgende, at vi har observationer af den samme variabel fra to forskellige grupper, for nemheds skyld kaldet “gruppe 1” og “gruppe 2” (det er komplet ligegyldigt, hvilken gruppe der betegnes “gruppe 1”, og hvilken der betegnes “gruppe 2”).

Vi antager endvidere, at variablens værdier i hver gruppe har to mulige udfald: 1 og 0, samt at værdierne i de to grupper er indbyrdes uafhængige (dvs. ikke påvirker hinanden).

Med det som udgangspunkt kan vi estimere de ukendte andele af 1’ere (= sandsynlighed for udfaldet 1) i hver gruppe på samme måde, som vi hidtil har gjort (for én gruppe i kapitel 1).

Vi er interesseret i at estimere andelen af 1’ere indenfor hver gruppe og herefter sammenligne de to andele for at se, om der ser ud til at være en forskel mellem de to grupper.

Resultat: Fordeling af ˆp1ˆp2

Antag at…

  • X1,...,Xn1 er indbyrdes uafhængige observationer med to mulige udfald: 1 og 0 (“gruppe 1”)
  • Y1,...,Yn2 er indbyrdes uafhængige observationer med to mulige udfald: 1 og 0 (“gruppe 2”)
  • observationerne X1,...,Xn1 og Y1,...,Yn2 er indbyrdes uafhængige

Vi estimerer sandsynlighederne p1 (for udfaldet 1 i gruppe 1) og p2 (for udfaldet 1 i gruppe 2) ved ˆp1=1n1n1i=1Xiˆp2=1n2n2i=1Yi

Estimatet af forskellen p1p2 mellem sandsynlighederne i de to grupper bliver omtrent normalfordelt ˆp1ˆp2aN(p1p2,p1(1p1)n1+p2(1p2)n2) når n1ˆp1>10 og n1(1ˆp1)>10 og n2ˆp2>10 og n2(1ˆp2)>10.

Forklaring af resultatet:

  • Vi antager, at vi har observationer af én variabel i to forskellige grupper
  • Variablen har to mulige udfald: 1 og 0
  • Datamaterialet består af n1 observationer fra gruppe 1, der alle har sandsynlighed p1 for udfaldet 1, og n2 observationer fra gruppe 2, der alle har sandsynlighed p2 for udfaldet 1
  • Resultatet fortæller, at estimatet ˆp1ˆp2 af forskellen mellem andelen af 1’ere i de to grupper sådan cirka kan beskrives ved en normalfordeling
  • Denne normalfordeling har parametre p1p2 (middelværdi) og p1(1p1)n1+p2(1p2)n2 (standardafvigelse)