8.8 Contrastes para comparación de poblaciones

En muchas ocasiones interesa contrastar si los parámetros de dos poblaciones son iguales o no lo son. Si queremos estudiar si hay diferencias entre la estatura de los hombres (o mujeres) de una población (España, por ejemplo) con otra (Francia), teniendo en cuenta que la estatura es una variable aleatoria que sigue una distribución normal, lo que tendremos que comparar son sus parámetros media y desviación típica

Si se desea comparar las diferencias que puedan existir entre dos tratamientos que se apliquen para una enfermedad, consideraremos dos muestras de pacientes a los que, de forma aleatoria, les aplicaremos uno u otro tratamiento, y después consideraremos la efectividad de cada una de los tratamientos.

De manera formal, tendremos dos variables \(X\)=efecto del tratamiento 1 e \(Y\)=efecto del tratamiento 2. Este efecto podrá ser, por ejemplo, la disminución de dolor, disminución de temperatura, aumento de movilidad, etc.

Para contrastar cual de los dos es mejor, puede realizarse un contraste de igualdad de medias, de la forma. \(H_0: \mu_1 = \mu_2\) frente a \(H_1:\mu_1 \neq \mu_2\).

El supuesto más habitual es considerar que las variables aleatorias \(X\) e \(Y\) son variables aleatorias que siguen una distribución normal. Esto es

\[X \in N(\mu_1, \sigma_1), \ \ Y\in N(\mu_2, \sigma_2)\] Un contraste de diferencia de medias nos sirve, entonces, para comprobar si hay diferencia o no entre el efecto medio de los tratamientos. Esta igualdad de medias (o no) es equivalente a considerar si la diferencia entre las medias es igual (o no) a cero.

\(H_{0}:\mu _{1}=\mu _{2}\ \ \)o \(\mu _{1}-\mu_{2}=0\)

El estadístico que se utiliza es el siguiente:

\[ T=\frac{(\overline{x}-\overline{y})-(\mu _{1}-\mu _{2})}{\sqrt{ \frac{\hat{S}_{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}}\ \ \in \ \ t_{n+m-2-\Delta }, \] siendo \(\Delta\) el entero más próximo a \[ \frac{\left( (m-1)\frac{\hat{S}_{n-1}^{2}}{n}-(n-1)\frac{\hat{S}_{m-1}^{2}}{m }\right) ^{2}}{(m-1)\left( \frac{\hat{S}_{n-1}^{2}}{n}\right) ^{2}+(n-1)\left( \frac{\hat{S}_{m-1}^{2}}{m}\right) ^{2}}. \]

Se quiere estudiar qué aumenta más la presión sanguínea: (1) resistir las tonterías del cuñado en la comida de navidad, o (2) estar esperando ansioso por un paquete pedido por Internet y, luego de estar toda la tarde en casa, descubrir que el repartidor ha pegado un papel en tu buzón donde dice “Ausente en el momento del reparto”.

Para ello se seleccionan dos grupos, se les somete a la tortura explicada, y luego se obtienen las presiones sistólicas en el momento de finalizar la sesión:

Grupo 1: 104,88,100, 98,102,92,96,100,96,96

Grupo 2: 100,102,96,106,110,110,120,112,112,90

¿Puede considerarse que las presiones medias son iguales en ambos casos?

En R, así de sencillo:

x=c(104,88,100,98,102,92,96,100,96,96)
y=c(100,102,96,106,110,110,120,112,112,90)
t.test(x,y)
## 
##  Welch Two Sample t-test
## 
## data:  x and y
## t = -2.7, df = 14, p-value = 0.02
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -15.429  -1.771
## sample estimates:
## mean of x mean of y 
##      97.2     105.8

Como el \(p\)-valor es más pequeño que \(0.05\), que es el que se usa habitualmente para decidir, diríamos que las presiones medias no pueden considerarse iguales.