7.2 Prueba de Shapiro-Wilks

En la sección 4.3 mencionamos que existen algunas maneras de estimar si una variable tiene una distribución normal o no. Nos basamos sobre todo en la forma de los polígonos de frecuencias (2.1). Ahora vamos a introducir un test más formal de normalidad.

El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una distribución normal. Eligimos un nivel de significanza, por ejemplo 0,05, y tenemos una hipótesis alternativa que sostiene que la distribución no es normal.

Tenemos:

\(H_0\): La distribución es normal

\(H_1\): La distribución no es normal,

o más formalmente aún:

\(H_0: X \sim \mathcal{N}(\mu,\sigma^2)\)

\(H_1: X \nsim \mathcal{N}(\mu,\sigma^2)\).

Ahora el test Shapiro-Wilks intenta rechazar la hipotesis nula a nuestro nivel de significanza. Para realizar el test usamos la función shapiro.test en R:

Ejemplo 7.3 (Test de Shapiro Wilks en R)

Grupo.A = c(15, 12, 11, 18, 15, 15, 9, 19, 14, 13, 11, 12, 18, 15, 16, 14, 16, 17, 15, 17, 13, 14, 13, 15, 17, 19, 17, 18, 16, 14)

shapiro.test(Grupo.A)

## 
##  Shapiro-Wilk normality test
## 
## data:  Grupo.A
## W = 0.97032, p-value = 0.548

Grupo.B = c(11, 16, 14, 18, 6, 8, 9, 14, 12, 12, 10, 15, 12, 9, 13, 16, 17, 12, 8, 7, 15, 5, 14, 13, 13, 12, 11, 13, 11, 7)


shapiro.test(Grupo.B)

## 
##  Shapiro-Wilk normality test
## 
## data:  Grupo.B
## W = 0.97636, p-value = 0.7227

Vemos que en ambos casos el valor de probabilidad (p) es muy superios a nuestro nivel elegido (0,05), por lo que no rechazamos la hipótesis nula.

En el caso de los ejemplos 7.1 y 7.2 ya obramos bajo la premisa de que las variables tenían una distribución normal, pero generalmente conviene realizar el test Shapiro-Willks antes de decidir qué prueba estadística vamos a usar. Si rechazamos \(H_0\), es decir si no concluimos que la distribución sea normal, no deberíamos usar un test paramétrico.