Chapter 5 Test de Wald para regresión logística
R de forma predeterminada utiliza la prueba de Wald en la tabla de resumen para un lineal generalizado modelo. Repitamos esa tabla
summary(diabetes.model)
##
## Call:
## glm(formula = type ~ bmi, family = binomial(link = logit), data = Pima.tr)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.5797 -0.9235 -0.6541 1.2506 1.9377
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.11156 0.92806 -4.430 9.41e-06 ***
## bmi 0.10482 0.02738 3.829 0.000129 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 256.41 on 199 degrees of freedom
## Residual deviance: 239.97 on 198 degrees of freedom
## AIC: 243.97
##
## Number of Fisher Scoring iterations: 4
R informa el estadístico de Wald z, que es la raíz cuadrada de la prueba de Wald χ2 discutido en el capítulo 21. Esto se basa en el hecho matemático de que si al cuadrado de la distribución normal estándar Z, se obtiene una distribución chi-cuadrado con df=1.
Las hipótesis son:
H0:β1=0\textupvs.H1:β1≠0
o en términos de odds-ratio θ
H0:θ1=0\textupversusH1:θ1≠0
Observe que el estadístico z dado es la estimación dividida por el error estándar y el p-valor se basa en la distribución normal estándar.
z=^β1S^β1=0.104820.02738=3.849
Existe una relación significativa entre bmi y diabetes tipo II:
Wald z=3.829,p=0.000129
Algunos paquetes de software darán la prueba de chi-cuadrado de Wald en su lugar, que es solo nuestra estadística al cuadrado.
χ2=(^β1Sβ1)2=(0.104820.02738)2=14.656 Dado que esta estadística es chi-cuadrado con df=1, el valor de p es:
1-pchisq(14.656,df=1)
## [1] 0.0001290233
El intervalo de confianza de Wald para β1 se calcula de manera similar a muchos otros intervalos de confianza que hemos visto
β1±z(Sβ1)
Para nuestro al 95% de confianza:
0.10482±1.96×0.02738
0.10482±0.05366
(0.05062,0.15794)
Exponencia este intervalo para obtener un intervalo de confianza para la razón de posibilidades θ
(e0.05062,e0.05062)
Observe que el IC completo para β1 está por encima de cero y, de manera equivalente, el IC completo para θ es por encima de uno. Esto indica una relación significativa.