8.1 Prueba U de Mann-Whitney
La prueba U de Mann-Whitney resulta útil si tenemos dos muestras independientes y queremos si hay una diferencia en la magnitud de la variable que estamos estudiando, pero no podemos usar la prueba de t independiente o la prueba de z porque los datos no cumplen con alguno de los requisitos. Para realizar la prueba U de Mann-Whitney ponemos las observaciones de las dos muestras en orden ascendiente y asignamos un rango ordinal de manera que 1 corresponde a la observación de menor magnitud, 2 a la segunda etcétera. Luego nos fijamos en las diferencias entre las observaciones.
La prueba se basa en una comparación de cada observación de una muestra \(x_i\) con cada observación en la segunda muestra \(y_j\). Si las muestras tienen la misma mediana, entones cada observación tiene un 0,5 (50%) de chance de ser mayor o menor que la observación correspondiente de la otra muestra. Por tanto plantea las hipotesis:
\(H_0: P(x_i>y_j)={1\over2}\)
\(H_1: P(x_i>y_j)\neq{1\over2}\)
La prueba U de Mann-Whitney también se conoce con otros nombres: Mann–Whitney–Wilcoxon, Wilcoxon rank-sum test y Wilcoxon–Mann–Whitney. Por ello está disponible en R por medio de la función wilcox.test
.
En este ejemplo vamos a suponer que tenemos datos diagnósticos de cuatro mujeres y cinco hombres. Todos fueron diagnosticados con diabetes y tenemos la edad a la cual se les descubrió la enfermedad. Queremos saber si hay diferencia en la edad entre hombres y mujeres. Los datos son:
Mujeres: {20, 11, 17, 12}.
= c(19, 22, 16, 29, 24)
Hombres = c(20, 11, 17, 12)
Mujeres wilcox.test(Hombres, Mujeres)
##
## Wilcoxon rank sum exact test
##
## data: Hombres and Mujeres
## W = 17, p-value = 0.1111
## alternative hypothesis: true location shift is not equal to 0
Vemos que no podemos rechazar \(H_0\) en este caso.