8.8 Contrastes para comparación de poblaciones

En muchas ocasiones interesa contrastar si los parámetros de dos poblaciones son iguales o no lo son. Si queremos estudiar si hay diferencias entre la estatura de los hombres (o mujeres) de una población (España, por ejemplo) con otra (Francia), teniendo en cuenta que la estatura es una variable aleatoria que sigue una distribución normal, lo que tendremos que comparar son sus parámetros media y desviación típica

Si se desea comparar las diferencias que puedan existir entre dos tratamientos que se apliquen para una enfermedad, consideraremos dos muestras de pacientes a los que, de forma aleatoria, les aplicaremos uno u otro tratamiento, y después consideraremos la efectividad de cada una de los tratamientos.

De manera formal, tendremos dos variables \(X\)=efecto del tratamiento 1 e \(Y\)=efecto del tratamiento 2. Este efecto podrá ser, por ejemplo, la disminución de dolor, disminución de temperatura, aumento de movilidad, etc.

Para contrastar cual de los dos es mejor, puede realizarse un contraste de igualdad de medias, de la forma. \(H_0: \mu_1 = \mu_2\) frente a \(H_1:\mu_1 \neq \mu_2\).

El supuesto más habitual es considerar que las variables aleatorias \(X\) e \(Y\) son variables aleatorias que siguen una distribución normal. Esto es

\[X \in N(\mu_1, \sigma_1), \ \ Y\in N(\mu_2, \sigma_2)\] Un contraste de diferencia de medias nos sirve, entonces, para comprobar si hay diferencia o no entre el efecto medio de los tratamientos. Esta igualdad de medias (o no) es equivalente a considerar si la diferencia entre las medias es igual (o no) a cero.

\(H_{0}:\mu _{1}=\mu _{2}\ \ \)o \(\mu _{1}-\mu_{2}=0\)

Se pueden considerar 4 posibles casos

\(H_{0}:\mu _{1}=\mu _{2}\ \ \)o \(\mu _{1}-\mu_{2}=0\)

8.8.1 Se conocen las desviaciones típicas:

En este caso, el estadístico que se utiliza para realizar el contraste de hipótesis es el siguiente:

\[ T= \frac{(\overline{x}-\overline{y})-(\mu _{1}-\mu _{2})}{\sqrt{ \frac{\sigma _{1}^{2}}{n}+\frac{\sigma _{2}^{2}}{m}}} \in N(0,1). \]

8.8.2 Desconociendo las desviaciones típicas pero suponiéndolas iguales:

\[ T= \frac{(\overline{x}-\overline{y})-(\mu _{1}-\mu _{2})}{\sqrt{ \frac{(n-1)\hat{S}_{n-1}^{2}+(m-1)\hat{S}_{m-1}^{2}}{n+m-2}}\sqrt{\frac{1}{n} +\frac{1}{m}}} \ \ \in \ \ t_{n+m-2}. \]

8.8.3 Desconociendo las desviaciones típicas pero suponiendo que los tamaños de las muestras son grandes (mayores o iguales que 30)

\[ T=\frac{(\overline{x}-\overline{y})-(\mu _{1}-\mu _{2})}{\sqrt{ \frac{\hat{S}_{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}}\ \ \approx \ \ N(0,1)\ \]

8.8.4 Desconociendo las desviaciones típicas pero suponiendo que los tamaños de las muestras son pequeños (menores que 30)

\[ T=\frac{(\overline{x}-\overline{y})-(\mu _{1}-\mu _{2})}{\sqrt{ \frac{\hat{S}_{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}}\ \ \in \ \ t_{n+m-2-\Delta }, \] siendo \(\Delta\) el entero más próximo a \[ \frac{\left( (m-1)\frac{\hat{S}_{n-1}^{2}}{n}-(n-1)\frac{\hat{S}_{m-1}^{2}}{m }\right) ^{2}}{(m-1)\left( \frac{\hat{S}_{n-1}^{2}}{n}\right) ^{2}+(n-1)\left( \frac{\hat{S}_{m-1}^{2}}{m}\right) ^{2}}. \]

Se quiere estudiar qué aumenta más la presión sanguínea: (1) resistir las tonterías del cuñado en la comida de navidad, o (2) estar esperando ansioso por un paquete pedido por Internet y, luego de estar toda la tarde en casa, descubrir que el repartidor ha pegado un papel en tu buzón donde dice “Ausente en el momento del reparto”.

Para ello se seleccionan dos grupos, se les somete a la tortura explicada, y luego se obtienen las presiones sistólicas en el momento de finalizar la sesión:

Grupo 1: 104,88,100, 98,102,92,96,100,96,96

Grupo 2: 100,102,96,106,110,110,120,112,112,90

¿Puede considerarse que las presiones medias son iguales en ambos casos? (supóngase las desviaciones típicas desconocidas y distintas)

x=c(104,88,100,98,102,92,96,100,96,96)
y=c(100,102,96,106,110,110,120,112,112,90)
t.test(x,y)
## 
##  Welch Two Sample t-test
## 
## data:  x and y
## t = -2.7, df = 14, p-value = 0.02
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -15.429  -1.771
## sample estimates:
## mean of x mean of y 
##      97.2     105.8