Chapter 5 Test de Wald para regresión logística

R de forma predeterminada utiliza la prueba de Wald en la tabla de resumen para un lineal generalizado modelo. Repitamos esa tabla

summary(diabetes.model)
## 
## Call:
## glm(formula = type ~ bmi, family = binomial(link = logit), data = Pima.tr)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.5797  -0.9235  -0.6541   1.2506   1.9377  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -4.11156    0.92806  -4.430 9.41e-06 ***
## bmi          0.10482    0.02738   3.829 0.000129 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 256.41  on 199  degrees of freedom
## Residual deviance: 239.97  on 198  degrees of freedom
## AIC: 243.97
## 
## Number of Fisher Scoring iterations: 4

R informa el estadístico de Wald \(z\), que es la raíz cuadrada de la prueba de Wald \(\chi^2\) discutido en el capítulo 21. Esto se basa en el hecho matemático de que si al cuadrado de la distribución normal estándar \(Z\), se obtiene una distribución chi-cuadrado con \(df=1\).

Las hipótesis son:

\[\begin{equation} H_0:\beta_{1}=0 \hspace{1cm} \textup{vs.} \hspace{1cm} H_1:\beta_{1}\not= 0 \end{equation}\]

o en términos de odds-ratio \(\theta\)

\[\begin{equation} H_0:\theta_{1}=0 \hspace{1cm} \textup{versus} \hspace{1cm} H_1:\theta_{1}\not= 0 \end{equation}\]

Observe que el estadístico \(z\) dado es la estimación dividida por el error estándar y el p-valor se basa en la distribución normal estándar.

\[z=\frac{\hat{\beta_1}}{S_{\hat{\beta_1}}}=\frac{0.10482}{0.02738}=3.849 \]

Existe una relación significativa entre bmi y diabetes tipo II:

Wald \(z=3.829\),\(p=0.000129\)

Algunos paquetes de software darán la prueba de chi-cuadrado de Wald en su lugar, que es solo nuestra estadística al cuadrado.

\[ \chi^2=\left(\frac{\hat{\beta_1}}{{S_{\beta_1}}}\right)^2=\left(\frac{0.10482}{0.02738}\right)^2=14.656\] Dado que esta estadística es chi-cuadrado con \(df=1\), el valor de \(p\) es:

1-pchisq(14.656,df=1)
## [1] 0.0001290233

El intervalo de confianza de Wald para \(\beta_1\) se calcula de manera similar a muchos otros intervalos de confianza que hemos visto

\[\beta_1 \pm z(S_{\beta_1})\]

Para nuestro al \(95\%\) de confianza:

\[0.10482 \pm 1.96 \times 0.02738 \]
\[0.10482 \pm 0.05366 \] \[\left( 0.05062,0.15794\right)\]

Exponencia este intervalo para obtener un intervalo de confianza para la razón de posibilidades \(\theta\)

\[\left(e^{0.05062}, e^{0.05062}\right) \]

Observe que el IC completo para \(\beta_1\) está por encima de cero y, de manera equivalente, el IC completo para \(\theta\) es por encima de uno. Esto indica una relación significativa.