2.2 Normalfordeling

2.2.1 Fordeling af forskel i to estimerede middelværdier

Vi antager i det følgende, at vi har observationer af den samme variabel fra to forskellige grupper, for nemheds skyld kaldet “gruppe 1” og “gruppe 2” (det er komplet ligegyldigt, hvilken af de to grupper, der betegnes “gruppe 1”, og hvilken der betegnes “gruppe 2”).

Vi antager endvidere, at variablens værdier i hver gruppe kan beskrives ved en normalfordeling, samt at værdierne i de to grupper er indbyrdes uafhængige (dvs. ikke påvirker hinanden).

Med det som udgangspunkt kan vi estimere de ukendte parametre i normalfordelingen i hver gruppe på samme måde, som vi hidtil har gjort.

Vi er interesseret i at estimere middelværdien af variablen indenfor hver gruppe og herefter sammenligne de to middelværdier for at se, om der ser ud til at være en forskel mellem de to grupper.

Resultat: Fordeling af ˆμ1ˆμ2

Antag at…

  • X1,...,Xn1 er indbyrdes uafhængige observationer, der er normalfordelt N(μ1,σ1) (“gruppe 1”)
  • Y1,...,Yn2 er indbyrdes uafhængige observationer, der er normalfordelt N(μ2,σ2) (“gruppe 2”)
  • observationerne X1,...,Xn1 og Y1,...,Yn2 er indbyrdes uafhængige

Vi estimerer de ukendte parametre i de to normalfordelingerne ved ˆμ1=1n1n1i=1Xiˆσ1=1n11n1i=1(Xiˆμ1)2ˆμ2=1n2n2i=1Yiˆσ2=1n21n2i=1(Yiˆμ2)2

Estimatet af forskellen μ1μ2 mellem middelværdien i de to grupper bliver selv normalfordelt ˆμ1ˆμ2N(μ1μ2,σ21n1+σ21n2)

Forklaring af resultatet:

  • Vi antager, at vi har observationer af én variabel i to forskellige grupper
  • Datamaterialet består af n1 observationer fra gruppe 1, der alle er normalfordelt N(μ1,σ1) og n2 observationer fra gruppe 2, der alle er normalfordelt N(μ2,σ2)
  • Resultatet fortæller, at estimatet ˆμ1ˆμ2 af forskellen mellem middel- værdierne i de to grupper i sig selv kan beskrives ved en normalfordeling
  • Denne normalfordeling har parametre μ1μ2 (middelværdi) og σ21/n1+σ22/n2 (standardafvigelse)
  • Fordi vi ikke kender standardafvigelserne σ1 og σ2 i de to grupper, er vi nødt til at estimere dem
  • Fordi vi estimerer standardafvigelserne σ1 og σ2 ændres fordelingen, der beskriver ˆμ1ˆμ2, fra en normalfordeling til en t-fordeling.

For fuldstændighedens skyld anfører vi nedenfor fordelingen af (det transformerede) estimat ˆμ1ˆμ2, der kan beskrives ved en t-fordeling.

Resultat: Fordeling af ˆμ1ˆμ2 (transformeret)

Under samme antager som i resultatet ovenfor er størrelsen ˆμ1ˆμ2(μ1μ2)ˆσ21n1+ˆσ22n2 beskrevet ved en t-fordeling med f frihedsgrader, hvor f=(ˆσ21n1+ˆσ22n2)21n11(ˆσ21n1)2+1n21(ˆσ22n2)2