8.7 Contraste para una proporción
Ahora, consideramos \(p\) la proporción teórica de ocurrencia de un suceso en una población (proporción de voto a un partido, proporción de gente enferma de amor…). Establecemos la siguiente hipótesis nula, de que \(p\) es igual a un número concreto:
\(H_{0}:p=p_{0}\)
El estadístico “pivote” para este contraste es:
\[ T=\frac{\hat{p}-p_{0}}{\sqrt{\frac{p_{0}\cdot(1-p_{0})}{n}}}\ \ \approx \ \ N(0,1). \]
- Solución:
Llamamos \(p\)=proporción de personas a favor del 155
.
El gobierno afirma que \(p>0.5\), luego, al no llevar el signo =
, esta opción irá en la hipótesis alternativa. Así, el test será:
\(H_0: p\leq 0.5\) frente a \(H_1:p>0.5\).
La forma de tomar la decisión de rechazar la hipótesis nula o no es ver si hay mucha diferencia entre lo que dice la muestra y lo que dice la hipótesis nula.
La hipótesis nula dice que la proporción teórica \(p_0\) es \(0.5\). La muestra nos da una proporción muestral \(\hat{p}=155/288=0.538\). Obviamente, este valor difiere de \(0.5\), pero ¿mucho, poco, regular? Es el mismo caso que se nos planteaba arriba en el ejemplo de la película de James Bond.
La forma de “medir” la diferencia es mediante el estadístico \(T\) que, en este caso, es \[ T=\frac{\hat{p}-p_{0}}{\sqrt{\frac{p_{0}\cdot (1-p_{0})}{n}}}=\frac{0.538-0.5}{\sqrt{\frac{0.5\cdot (1-0.5)}{n}}}=\frac{0.038}{0.029}=1.28 \]
El estadístico que se utiliza sigue una distribución aproximadamente normal, quiere esto decir que el \(p\)-valor no será tan exacto, sino que hay una cierta diferencia, pero nada para asustar.
plotDist("norm", groups = x >1.28 , type="h")
1-pnorm(1.28)
## [1] 0.1003
Observamos que el \(p-\)valor es, aproximadamente, el área a la derecha de \(1.28\), que es \(0.1\). En función de ese valor se decide.
Para realizar este test en R, en el paquete básico existe el procedimiento siguiente:
prop.test(155, 288, 0.5, alternative="greater")
##
## 1-sample proportions test with continuity
## correction
##
## data: 155 out of 288
## X-squared = 1.5, df = 1, p-value = 0.1
## alternative hypothesis: true p is greater than 0.5
## 95 percent confidence interval:
## 0.488 1.000
## sample estimates:
## p
## 0.5382
Observamos que no sale exactamente lo mismo que lo que hemos realizado nosotros. La cuestión es que el procedimiento que usa R utiliza un estadístico diferente (compara la proporción muestral con la proporción teórica mediante otra fórmula distinta). Al utilizar otra fórmula, la distribución que sigue ese estadístico no es una distribución normal. En este caso, es una distribución Chi-cuadrado. De todos modos, lo que importa es que el \(p-\)valor va a salir igual o muy parecido, que es lo que ocurre.
Tenemos la opción de usar la función z.test
que se definió en el capítulo anterior:
y= z.test(155,288, p=0.5,alternative="greater")
El \(p\)-valor del test es 0.0974, que es mayor que el nivel habitual de \(0.05\), luego no se podría rechazar la hipótesis nula.