7.8 Intervalos para la comparación de dos poblaciones normales independientes.

Se parte de dos muestras aleatorias simples \((x_{1},x_{2},...,x_{n})\) e
\((y_{1},y_{2},...,y_{m}),\) de las variables \(X\in N(\mu _{1},\sigma _{1})\) e \(Y\in N(\mu _{2},\sigma _{2}),\) respectivamente.

7.8.1 Intervalo de confianza para la diferencia de medias

Tenemos cuatro posibles casos

7.8.1.1 Conociendo las desviaciones típicas

\[ \left( (\bar{x}-\bar{y})\pm Z_{\alpha /2}\sqrt{\frac{\sigma _{1}^{2}}{n}+\frac{\sigma _{2}^{2}}{m}}\right) . \] #### Desconociendo las desviaciones típicas pero suponiendo que son iguales.

\[ \left( (\bar{x}-\bar{y})\pm t_{n+m-2,\alpha /2}^{{}}\sqrt{\frac{ (n-1)\hat{S}_{n-1}^{2}+(m-1)\hat{S}_{m-1}^{2}}{n+m-2}}\sqrt{\frac{1}{n}+ \frac{1}{m}}\right) \]

7.8.1.2 Desconociendo las desviaciones típicas y suponiendo que los tamaños de las muestras son grandes (mayores o iguales que 30)

\[ \left( (\bar{x}-\bar{y})\pm Z_{\alpha /2}\sqrt{\frac{\hat{S} _{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}\right) \]

7.8.1.3 Desconociendo las desviaciones típicas y suponiendo que los tamaños de las muestras son pequeños (menores que 30)

\[ \left( (\bar{x}-\bar{y})\pm t_{n+m-2-\Delta ,\alpha /2}^{{}}\sqrt{ \frac{\hat{S}_{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}\right) , \] siendo \(\Delta\) el entero más próximo a (Corrección de Welch) \[ \frac{\left( (m-1)\frac{\hat{S}_{n-1}^{2}}{n}-(n-1)\frac{\hat{S}_{m-1}^{2}}{m }\right) ^{2}}{(m-1)\left( \frac{\hat{S}_{n-1}^{2}}{n}\right) ^{2}+(n-1)\left( \frac{\hat{S}_{m-1}^{2}}{m}\right) ^{2}}. \]

7.8.2 Intervalo de confianza para el cociente de varianzas

\(\sigma_{2}^{2}/\sigma _{1}^{2}.\)

\[ \left( F_{n-1,m-1,1-\alpha /2}\frac{\hat{S}_{m-1}^{2}}{\hat{S}_{n-1}^{2}}\ ,\ F_{n-1,m-1,\alpha /2}\frac{\hat{S}_{m-1}^{2}}{\hat{S}_{n-1}^{2}}\right) , \] siendo \(F_{n-1,m-1,\alpha /2}\) el valor de una F de Snedecor con \(n-1\) y $ m-1$ grados de libertad que deja a la derecha \(\alpha /2\) de área.

Uno de los dilemas que más trae de cabeza a los historiadores y antropólogos es si existen diferencias físicas y psicológicas (inteligencia, fuerza, carácter… ) entre la gente de derechas y de izquierdas. Hoy vamos a traer algo de luz a este tema, comparando las estaturas de famosos personajes históricos de izquierdas y de derechas.

Calcular un intervalo de confianza, al 95 por ciento, para la diferencia de estaturas medias, y razonar si alguno de los grupos puede considerarse más alto que el otro.
De derechas Estatura De izquierdas Estatura
Adolf Hitler 175 Boris Yeltsin 187
Rudolf Hess 175 Josif Stalin 168
Francisco Franco 163 Fidel Castro 191
Reinhard Heydrich 191 Nicolas Maduro 190
Benito Mussolini 169 Che Guevara 175
Donald Trump 188 Hugo Chavez 173
Joseph Goebbels 165 Lenin 165
Hermann Goering 178 Nikita Khruschev 160
Heinrich Himmler 174 Leonid Bhreznev 173
Jordi Pujol 165 Gorbachov 175
Jose Maria Aznar 171 Pablo Iglesias 176
Silvio Berlusconi 171 Evo Morales 174
  • Solución:

Estamos en el caso de que las muestras son pequeñas y desconocemos las desviaciones típicas. Si las muestras fueran grandes, tendríamos que decidir si las varianzas pueden considerarse iguales o no. Para ello habría que hacer un contraste de hipótesis para saber si la proporción de varianzas puede considerarse igual a 1, puesto que: \[ Si \ \ \ \dfrac{\sigma_{2}^{2}}{\sigma_{1}^{2}}=1 \ \ entonces \ \ \sigma_{2}^{2}=\sigma_{1}^{2} \]

Esto se ve en el capítulo siguiente. Por lo tanto, vamos a considerar desconocidas las desviaciones tipicas y que los tamaños de las muestras son pequeños. El intervalo de confianza que tenemos que calcular es el monstruoso:

\[ \left( (\bar{x}-\bar{y})\pm t_{n+m-2-\Delta ,\alpha /2}^{{}}\sqrt{ \frac{\hat{S}_{n-1}^{2}}{n}+\frac{\hat{S}_{m-1}^{2}}{m}}\right) , \] siendo \(\Delta\) el entero más próximo a (Corrección de Welch) \[ \frac{\left( (m-1)\frac{\hat{S}_{n-1}^{2}}{n}-(n-1)\frac{\hat{S}_{m-1}^{2}}{m }\right) ^{2}}{(m-1)\left( \frac{\hat{S}_{n-1}^{2}}{n}\right) ^{2}+(n-1)\left( \frac{\hat{S}_{m-1}^{2}}{m}\right) ^{2}}. \] No es que sea tan complicado, lo peor es calcular el valor \(\Delta\), pero no es necesario, podemos hacer directamente:

e1=c(175,175,163,191,169,188,165,178,174,165,171,171)
e2=c(187,168,191, 190,175,173,165,160,173,175,176,174)
t.test(e1,e2, conf.level=0.95)
## 
##  Welch Two Sample t-test
## 
## data:  e1 and e2
## t = -0.49, df = 22, p-value = 0.6
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -9.566  5.899
## sample estimates:
## mean of x mean of y 
##     173.8     175.6

Este es el procedimiento para realizar un test de comparación de medias. Ahora mismo nos interesa el intervalo de confianza, que es \((-9.56, 5.89)\). Como podemos ver, el intervalo de confianza contiene al cero, o sea que hay poca diferencia entre la estatura media de un grupo y otro. De todas formas, para tomar una decisión más acertada, desde el punto de vista estadístico, es mejor realizar un contraste de hipótesis.