7.2 Prueba de Shapiro-Wilks

En la sección 4.3 mencionamos que existen algunas maneras de estimar si una variable tiene una distribución normal o no. Nos basamos sobre todo en la forma de los polígonos de frecuencias (2.1). Ahora vamos a introducir un test más formal de normalidad.

El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una distribución normal. Eligimos un nivel de significanza, por ejemplo 0,05, y tenemos una hipótesis alternativa que sostiene que la distribución no es normal.

Tenemos:

\(H_0\): La distribución es normal

\(H_1\): La distribución no es normal,

o más formalmente aún:

\(H_0: X \sim \mathcal{N}(\mu,\sigma^2)\)

\(H_1: X \nsim \mathcal{N}(\mu,\sigma^2)\).

Ahora el test Shapiro-Wilks intenta rechazar la hipotesis nula a nuestro nivel de significanza. Para realizar el test usamos la función shapiro.test en R:

Ejemplo 7.3 (Test de Shapiro Wilks en R)
## 
##  Shapiro-Wilk normality test
## 
## data:  Grupo.A
## W = 0.97032, p-value = 0.548
## 
##  Shapiro-Wilk normality test
## 
## data:  Grupo.B
## W = 0.97636, p-value = 0.7227

Vemos que en ambos casos el valor de probabilidad (p) es muy superios a nuestro nivel elegido (0,05), por lo que no rechazamos la hipótesis nula.

En el caso de los ejemplos 7.1 y 7.2 ya obramos bajo la premisa de que las variables tenían una distribución normal, pero generalmente conviene realizar el test Shapiro-Willks antes de decidir qué prueba estadística vamos a usar. Si rechazamos \(H_0\), es decir si no concluimos que la distribución sea normal, no deberíamos usar un test paramétrico.