Chapter 5 Test de Wald para regresión logística
R de forma predeterminada utiliza la prueba de Wald en la tabla de resumen para un lineal generalizado modelo. Repitamos esa tabla
summary(diabetes.model)
##
## Call:
## glm(formula = type ~ bmi, family = binomial(link = logit), data = Pima.tr)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.5797 -0.9235 -0.6541 1.2506 1.9377
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.11156 0.92806 -4.430 9.41e-06 ***
## bmi 0.10482 0.02738 3.829 0.000129 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 256.41 on 199 degrees of freedom
## Residual deviance: 239.97 on 198 degrees of freedom
## AIC: 243.97
##
## Number of Fisher Scoring iterations: 4
R informa el estadístico de Wald \(z\), que es la raíz cuadrada de la prueba de Wald \(\chi^2\) discutido en el capítulo 21. Esto se basa en el hecho matemático de que si al cuadrado de la distribución normal estándar \(Z\), se obtiene una distribución chi-cuadrado con \(df=1\).
Las hipótesis son:
\[\begin{equation} H_0:\beta_{1}=0 \hspace{1cm} \textup{vs.} \hspace{1cm} H_1:\beta_{1}\not= 0 \end{equation}\]
o en términos de odds-ratio \(\theta\)
\[\begin{equation} H_0:\theta_{1}=0 \hspace{1cm} \textup{versus} \hspace{1cm} H_1:\theta_{1}\not= 0 \end{equation}\]
Observe que el estadístico \(z\) dado es la estimación dividida por el error estándar y el p-valor se basa en la distribución normal estándar.
\[z=\frac{\hat{\beta_1}}{S_{\hat{\beta_1}}}=\frac{0.10482}{0.02738}=3.849 \]
Existe una relación significativa entre bmi y diabetes tipo II:
Wald \(z=3.829\),\(p=0.000129\)
Algunos paquetes de software darán la prueba de chi-cuadrado de Wald en su lugar, que es solo nuestra estadística al cuadrado.
\[ \chi^2=\left(\frac{\hat{\beta_1}}{{S_{\beta_1}}}\right)^2=\left(\frac{0.10482}{0.02738}\right)^2=14.656\] Dado que esta estadística es chi-cuadrado con \(df=1\), el valor de \(p\) es:
1-pchisq(14.656,df=1)
## [1] 0.0001290233
El intervalo de confianza de Wald para \(\beta_1\) se calcula de manera similar a muchos otros intervalos de confianza que hemos visto
\[\beta_1 \pm z(S_{\beta_1})\]
Para nuestro al \(95\%\) de confianza:
\[0.10482 \pm 1.96 \times 0.02738 \]
\[0.10482 \pm 0.05366 \]
\[\left( 0.05062,0.15794\right)\]
Exponencia este intervalo para obtener un intervalo de confianza para la razón de posibilidades \(\theta\)
\[\left(e^{0.05062}, e^{0.05062}\right) \]
Observe que el IC completo para \(\beta_1\) está por encima de cero y, de manera equivalente, el IC completo para \(\theta\) es por encima de uno. Esto indica una relación significativa.