7.1 Prueba t de Student para muestras independientes

Supongamos que tenemos dos muestras aleatorias e independientes con medias de \(\bar{x_1}\) y \(\bar{x_2}\) y que queremos saber si estas dos medias son signifacativamente distintas a un nivel de \(p\leqslant0,05\). Esto es lo mismo que decir que si afirmamos que hay una diferencia entre las muestras tenemos un 95% de probabilidad de tener razón. Lo que tenemos que calcular, entonces, es la probabilidad de que las dos muestras pueder provenir de la misma distribución y que la diferencia que vemos es por varianza en esa población. En otras palabras: queremos saber si dos muestras con la diferencia observada (\(\bar{x_1}-\bar{x_2}\)) podrían tener provenir de la misma población.

Si sacamos un número significativo de muestras de una misma población la media de estas muestra va a tener una diferencia con la media de la población, en algunos casos más altos y en otros más bajos. Usamos este conocimiento para calcular el error estándar:

\[ SE = {\sigma\over{\sqrt{N}}}. \]

De la misma manera existe un error estándar de diferencias entre medias (SED por sus siglas en ingles).

Definición 7.1 (Error estándar de diferencia entre medias) \[ SED = \sqrt{\sigma^2_1/N_1 + \sigma^2_1/N_2} \]

donde:

  • \(\sigma^2_1\) y \(\sigma^2_2\): las varianzas de las poblaciones 1 y 2
  • \(N_1\) y \(N_2\): es el número de observaciones en cada muestra.

Al igual que con el error estándar, a menudo desconocemos la varianza de la población, por lo cual lo estimamos de la muestra y la formula es la que vemos en la definición 7.2.

Definición 7.2 (Error estándar de diferencia entre medias estimado de muestras) \[ SED = \sqrt{s^2_1/N_1 + s^2_1/N_2} \]

donde:

  • \(s^2_1\) y \(s^2_2\): las varianzas de las muestras 1 y 2
  • \(N_1\) y \(N_2\): es el número de observaciones en cada muestra.

Vimos en la sección 5.3 que para muestras relativamente pequeñas (N<30) la distribución de la muestra tiende a la distribución t de Student. Podemos valernos de esto para calcular la probabilidad de que nuestro SED esté en el rango requerido aplicando la formula de la definición

Definición 7.3 (Prueba de t) \[ t = {{(\bar{x_1}-\bar{x_2})}\over{SED}}. \]

Si aplicamos la fórmula de la definición 7.3 nos sale un valor que podemos comparar con los valores críticos de la tabla del apendice A para determinar si rechazamos \(H_0\) o no.

Ejemplo 7.1 (Prueba t)

Volvemos ahora a nuestros datos de notas de dos grupos de estudiantes con diferentes metodologías pedagígicos. Queremos saber con un nivel de significanza de 0,05 si existe diferencia entre la media de los dos grupos. Nuestras hipótesis nula y alternativa son entonces:

\(H_0:\mu_A=\mu_B\),

\(H_1: \mu_A\neq\mu_B\).

Los datos son:

Grupo A: {15, 12, 11, 18, 15, 15, 9, 19, 14, 13, 11, 12, 18, 15, 16, 14, 16, 17, 15, 17, 13, 14, 13, 15, 17, 19, 17, 18, 16, 14} y

Grupo B: {11, 16, 14, 18, 6, 8, 9, 14, 12, 12, 10, 15, 12, 9, 13, 16, 17, 12, 8, 7, 15, 5, 14, 13, 13, 12, 11, 13, 11, 7}.

La media y desviación estándar:

   Grupo A:
       \(\bar{x_A} = 14,933\)
       \(s = 2,490\)
       \(N=30\)
   Grupo B:
      \(\bar{x} = 11,77\)
      \(s = 3,308\)
      \(N=30\).

Aplicando la fórmula de la definición 7.2 obtenemos:

\[ SED = \sqrt{s^2_1/N_1 + s^2_1/N_2} = \sqrt{2,490^2/30 + 3,308^2/N_2} = 0,756 \]

y podemos calcular el valor de t aplicando la fórmula de la definición 7.3

\[ t = {{\bar{x_1}-\bar{x_2}}\over{SED}} = {{14.933-11,766}\over{0,756}}=4,188. \]

Si buscamos este valor en el Apendix A para 29 grados de libertad (N-1), vemos que debemos rechazar \(H_0\) y concluir que existe una diferencia estadísticamente significativa entre las dos muestras. Tenemos razón de creer que el método pedagógico influye en los resultados finales de los estudiantes.

Ejemplo 7.2 (Prueba t en R)

Si no queremos hacer todos estos cálculos a mano podemos hacerlos en R usando la función `t.test. Toma como parámetros las dos muestras que queremos comparar.

## 
##  Welch Two Sample t-test
## 
## data:  Grupo.A and Grupo.B
## t = 4.1887, df = 53.88, p-value = 0.0001046
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.650905 4.682428
## sample estimates:
## mean of x mean of y 
##  14.93333  11.76667

Vemos que el test nos devuelve además un valor de p más preciso.