8.10 Muestras pareadas o relacionadas
Si suponemos 2 variables o poblaciones X e Y, pero dependientes, estaremos en el caso de muestras o variables apareadas. Este caso recoge el ejemplo del estudio del efecto de un tratamiento: para saber si un nuevo tratamiento es efectivo sobre un cierto factor (dolor, temperatura, movilidad), se prueba en un grupo de personas y se miden los efectos antes
y después
del mismo. La variable \(X\) representa la medición del factor de interés en una muestra de \(n\) pacientes antes del tratamiento, y la variable \(Y\) representa la medición del mismo factor después de realizado el tratamiento. La diferencia entre las mediciones despues
y antes
, \(D=Y-X\) es una nueva variable medida en una muestra de tamaño \(n\): \[ (d_1,d_2,...,d_n)=(y_1-x_1,y_2-x_2,...,y_n-x_n)\].
Con lo cual, para saber si el tratamiento ha sido efectivo, plantearemos la hipótesis nula de que el efecto medio es cero (el tratamiento no sirve):
\(H_0: \mu_d=0\) frente a \(H_1: \mu_d<0\) o \(H_1: \mu_d>0\),
según sea la dirección que nos interesa. Por ejemplo, si tenemos interés en saber si el tratamiento reduce el dolor (hemos medido el dolor antes y después), la hipótesis alternativa será \(H_1: \mu_d<0\).
Si estamos interesados en saber si, por ejemplo, un programa de ejercicio físico aumenta la resistencia, la hipótesis alternativa será \(H_1: \mu_d>0\) (la resistencia después del tratamiento, en media, es mayor que antes del tratamiento).
Unos investigadores están tratando de descubrir la fórmula de la poción mágica que utilizaba el druida Panorámix de los libros de Astérix el galo, a partir de unas pócimas encontradas a través de internet. Para probar si es eficaz o no, plantean el siguiente experimento: contratan a \(8\) grandes luchadores de artes marciales mixtas, y controlan el tiempo que tardan en levantarse después de recibir una patada giratoria de Chuck Norris. Al cabo de un mes de la experiencia, se toman la pócima y se repite la prueba. El número de horas que tardaron en despertarse la primera vez, para los luchadores numerados del \(1\) al \(8\), respectivamente, fueron:
\(\text{sin poción:} \ 38 \ 32 \ 41 \ 35 \ 42 \ 32 \ 45 \ 37\)
y, para cada luchador, respectivamente, tras tomar la supuesta poción:
\(\text{con poción:} \ 30 \ 32 \ 34 \ 37 \ 35 \ 26 \ 38 \ 32\)
¿Es efectiva la nueva poción mágica?Solución:
Se quiere saber si el número medio de horas que tardaron en levantarse fue inferior cuando los luchadores tomaron la supuesta poción mágica, es decir, hay que plantear el contraste \[ H_0:\mu_X=\mu_Y \ \ \text{frente a} \ \ H_1:\mu_X>\mu_Y.\]
(\(X\) mide las horas durmiendo sin poción, \(Y\) con poción).
En este caso, las muestras son dependientes (muestras relacionadas o apareadas), porque son los mismos luchadores. Hay que calcular las diferencias entre los datos de una muestra y la otra:
\[d=(d_1=x_1-y_1,…,d_n=x_n-y_n )=(8,0,7,-2,7,6,7,5),\]
y ahora el contraste a realizar es \[H_0:\mu_d=0 \ \ \text{frente a} \ \ H_1:\mu_d>0.\]
Lo que es, simplemente, un test para la media de una muestra.
x=c(8,0,7,-2,7,6,7,5)
y=t.test(x, mu=0, alternative="greater")
El \(p\)-valor del contraste es 0.0042. Así, no aceptaríamos la hipótesis nula, o sea que los investigadores van bien encaminados con su fórmula.