8.7 Para una proporción

\(H_{0}:p=p_{0}\)

\[ T=\frac{\hat{p}-p_{0}}{\sqrt{\frac{p_{0}\cdot(1-p_{0})}{n}}}\ \ \approx \ \ N(0,1). \]

El portavoz del gobierno de BestKorea ha dicho que más de la mitad de la población está de acuerdo con la aplicación del artículo 155 en una república autónoma rebelde. Una televisión independiente (que no independentista) decide realizar una encuesta. De 288 personas encuestadas, 155 son favorables a la aplicación del artículo 155. ¿Ponen en duda estos resultados la publicidad del gobierno?
  • Solución:

Llamamos \(p\)=proporción de personas a favor del 155.

El gobierno afirma que \(p>0.5\), luego, al no llevar el signo =, esta opción irá en la hipótesis alternativa. Así, el test será:

\(H_0: p\leq 0.5\) frente a \(H_1:p>0.5\).

La forma de tomar la decisión de rechazar la hipótesis nula o no es ver si hay mucha diferencia entre lo que dice la muestra y lo que dice la hipótesis nula.

La hipótesis nula dice que la proporción teórica \(p_0\) es 0.5. La muestra nos da una proporción muestral \(\hat{p}=155/288=0.538\). Obviamente, este valor difiere de \(0.5\), pero ¿mucho, poco, regular? Es el mismo caso que se nos planteaba arriba en el ejemplo de la película de James Bond.

La forma de “medir” la diferencia es mediante el estadístico \(T\) que, en este caso, es \[ T=\frac{\hat{p}-p_{0}}{\sqrt{\frac{p_{0}\cdot (1-p_{0})}{n}}}=\frac{0.538-0.5}{\sqrt{\frac{0.5\cdot (1-0.5)}{n}}}=\frac{0.038}{0.029}=1.28 \]

El estadístico que se utiliza sigue una distribución aproximadamente normal, quiere esto decir que el \(p\)-valor no será tan exacto, sino que hay una cierta diferencia, pero nada para asustar.

library(mosaic)
plotDist("norm",  groups = x >1.28  , type="h")

1-pnorm(1.28)
## [1] 0.1003

Observamos que el \(p-\)valor es, aproximadamente, el área a la derecha de 1.28, que es 0.10. En función de ese valor se decide.

Para realizar este test en R, existe el procedimiento siguiente:

prop.test(155, 288, 0.5, alternative="greater")
## 
##  1-sample proportions test with continuity
##  correction
## 
## data:  155 out of 288
## X-squared = 1.5, df = 1, p-value = 0.1
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
##  0.488 1.000
## sample estimates:
##      p 
## 0.5382

Observamos que no sale exactamente lo mismo que lo que hemos realizado nosotros. La cuestión es que el procedimiento que usa R utiliza un estadístico diferente (compara la proporción muestral con la proporción teórica mediante otra fórmula distinta). Al utilizar otra fórmula, la distribución que sigue ese estadístico no es una distribución normal. En este caso, es una distribución Chi-cuadrado. De todos modos, lo que importa es que el \(p-\)valor va a salir igual o muy parecido, que es lo que ocurre.