8.11 Para la diferencia de proporciones

Ahora consideramos la hipótesis nula de que la proporción \(p_1\), que mide la proporción de una característica \(A\) en una población, es igual a \(p_2\), que es la proporción de la misma característia en otra población.

\(H_{0}:p_{1}=p_{2}\) o \(p_{1}-p_{2}=0\)

El estadístico para este caso se escribe, a partir de las proporciones muestrales \(\hat{p}_1\) y \(\hat{p}_2\) en dos muestras, como:

\[ T=\frac{(\hat{p_{1}}-\hat{p_{2}})-(p_{1}-p_{2})}{\sqrt{\frac{\hat{p_{1}}(1- \hat{p_{1}})}{n_{1}}+\frac{\hat{p_{2}}(1-\hat{p_{2}})}{n_{2}}}}\approx \ \ N(0,1). \]

Para comprobar si interceder ante el altísimo (rezar) por una persona enferma influye o no en una más rápida curación, se llevó a cabo el siguiente experimento: los pacientes que iban a ser operados de cirugía de injerto de derivación arterial coronaria (CABG) serían informados de que habría una serie de voluntarios rezando por una pronta recuperación, de la siguiente forma: \(1201\) pacientes fueron informados de que podrían recibir o no oraciones intercediendo por ellos. Estos pacientes se dividieron en \(2\) grupos A y B de \(604\) y \(597\) personas, que recibieron ayuda en forma de rezos (grupo A) y no la recibieron (grupo B) (Es decir, cada persona de cada grupo no sabía si recibía esa ayuda o no).

Un tercer grupo de \(601\) pacientes fueron informados de que recibirían oraciones intercediendo por ellos, y todos recibieron ayuda de esa manera. Las oraciones duraron \(14\) días, empezando a la noche antes de la intervención.

Al cabo de \(30\) días de la intervención se controló la presencia de complicaciones. Los resultados finalmente fueron

Complicaciones en el grupo A = \(315.\)

Complicaciones en el grupo B = \(304.\)

Complicaciones en el grupo C = \(352.\)

¿Qué conclusiones podemos sacar de estos resultados?

Este estudio puede leerse con detalle en: “Study of the Therapeutic Effects of Intercessory Prayer (STEP) in cardiac bypass patients: A multicenter randomized trial of uncertainty and certainty of receiving intercessory prayer”. American Heart Journal, 2006 151(4):934-42.

Empecemos comparando los que recibieron ayuda con los que no (grupos A y B, respectivamente) y ellos no lo sabían. Las proporciones muestrales son \(\hat{p}_1=315/604=0.52\), \(\hat{p}_2=304/597=0.50\). El contraste que se plantea es \(H_0: p_1=p_2\) frente a \(H_1:p_1\neq p_2\).

Para realizar el contraste usamos la función z.test.2 que se definió en el capítulo anterior:

z.test.2(315,604,304,597,alternative="two.sided")
## $estimate
## [1] 0.01231
## 
## $ts.z
## [1] 0.4268
## 
## $p.val
## [1] 0.6695
## 
## $cint
## [1] -0.04422  0.06884

Comprobamos que el \(p\)-valor para este contraste es z.test.2$p.val, lo cual significa que no podemos rechazar la hipótesis nula. Esto quiere decir que rezar (o no rezar) por una tercera persona es indiferente (si esa tercera persona no lo sabe).

Ahora comparemos los grupos A y B (no saber si rezan por ti) en conjunto, con el C (sabes que rezan por ti).

Las proporciones muestrales son:

\[\hat{p}_1=\dfrac{315+304}{604+597}=\dfrac{619}{1201}=0.51 \ y \ \hat{p}_2=\dfrac{352}{601}=0.58.\]

De nuevo, planteamos el contraste \(H_0: p_1=p_2\) frente a \(H_1:p_1\neq p_2\).

Ahora:

z.test.2(619,1201,352,601,alternative="two.sided")
## $estimate
## [1] -0.07029
## 
## $ts.z
## [1] -2.842
## 
## $p.val
## [1] 0.004486
## 
## $cint
## [1] -0.11876 -0.02181

Se obtiene que el \(p\)-valor es prácticamente cero, es decir, que se puede rechazar la hipótesis de que las proporciones no son iguales. De hecho, si planteamos como hipótesis alternativa la unilateral: \(H_1:p_1< p_2\), el \(p\)-valor sigue siendo muy pequeño, con lo que convendríamos que es mejor que sepas que rezan por tí, que no sepas si lo hacen o no. ## Algunos contrastes no paramétricos

8.11.1 Contrastes de normalidad

Si se dispone de una muestra \((x_1,...,x_n)\) aleatoria de una variable \(X\) y se quiere comprobar que esta variable sigue una distribución normal, es decir se plantea el contraste:

\(H_0:\ X\) sigue una distribución normal, frente a \(H_1: \ X\) no sigue una distribución normal,

lo más fácil que puede hacerse es un histograma o un gráfico de la estimacion de la densidad, y ver si se parece a la campana de Gauss.

Ejemplo:

X=rnorm(100)
op<-par(mfrow=c(1,2))
hist(X)
X=c(rnorm(100),4,5,6,8)
hist(X)

par(op)

Primero hemos simulado 100 datos de una distribución normal de media cero y desviación típica \(1\), y el histograma realizado se parece bastante a la campana de Gauss. Sin embargo, a continuación incluimos en el conjunto X los datos \(4,5,6\) y \(8\), que serían datos atípicos o anómalos, y el histograma deja de parecerse a la campana de Gauss.

Sin embargo,también existen procedimientos de cálculo para llevar a cabo un contraste de normalidad, como son el contraste de Kolmogorov-Smirnov (KS test), el de Anderson-Darling (AD test) o el de Shapiro-Wils (shapiro test). Este último test se encuentra directamente en el paquete base, los otros dos los podemos encontrar en el paquete nortest.

x=rnorm(100)
lillie.test(x )
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  x
## D = 0.064, p-value = 0.4
ad.test(x)
## 
##  Anderson-Darling normality test
## 
## data:  x
## A = 0.32, p-value = 0.5
shapiro.test(x)
## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.99, p-value = 0.7

8.11.2 Contrastes de independencia entre caracteres

En el capítulo de estadística bidimensional se vieron las tablas de contingencia para atributos o caracteres. Vamos a recordar el ejemplo en el que usamos el conjunto de datos de pasajeros del Titanic, y comparabamos los supervivientes con la clase en que viajaban

Titanic <- read_excel("Data/Pasajeros-Titanic.xlsx")
t1<- table(Titanic$sobrevivio, Titanic$clase)
t2<-addmargins(t1)
 pander(t2)
  1st 2nd 3rd Sum
no 123 158 528 809
yes 200 119 181 500
Sum 323 277 709 1309
 dt<-data.frame(Titanic)
ggplot(dt, aes(x=clase))+
geom_bar( aes(fill= sobrevivio), position="dodge")

Gráficamente, se intuye que las variables “sobrevivir” y “clase en la que viajaba” están relacionadas, pues no hay independencia entre las mismas.

De manera general, podemos plantear, para 2 variables categóricas \(X\) e \(Y\) de un fichero de datos, el test de hipótesis:

\(H_0: \ X\) e \(Y\) son independientes, frente a \(H_1:\) no lo son.

Esto puede realizarse mediante el llamado test \(\chi^2\) de Pearson o el test exacto de Fisher;

t2=table(Titanic$sobrevivio, Titanic$clase)
pander(t2)
  1st 2nd 3rd
no 123 158 528
yes 200 119 181
chisq.test(t2)
## 
##  Pearson's Chi-squared test
## 
## data:  t2
## X-squared = 130, df = 2, p-value <2e-16
fisher.test(t2)        
## 
##  Fisher's Exact Test for Count Data
## 
## data:  t2
## p-value <2e-16
## alternative hypothesis: two.sided
En el capítulo de la variable aleatoria normal describimos el trabajo de (Hansenne et al. 2001), donde se detalla un cuestionario de 226 items de el Inventario de Temperamento y Carácterpara evaluar las siete dimensiones de la personalidad descritas por Cloninger (Cloninger et al. 1994). El cuestionario fue respondido por 322 ciudadanos Belgas. La variable RD1 mide la Sentimentalidad. Vamos a ver si hay relación entre esta variable y el Sexo.
library(readxl)
hansenne <- read_excel("Data/20011701_hansenne/data.xls") 
t1<- table(hansenne$RD1, hansenne$SEXE)
t2<-addmargins(t1)
pander(t2)
  Feminin Masculin Sum
0 0 1 1
1 0 3 3
2 0 7 7
3 2 9 11
4 4 8 12
5 13 18 31
6 10 34 44
7 38 39 77
8 40 20 60
9 40 16 56
10 14 6 20
Sum 161 161 322
dt<-data.frame(hansenne)
ggplot(dt, aes(x=RD1))+
geom_bar( aes(fill= SEXE), position="dodge") 

chisq.test(t2)
## 
##  Pearson's Chi-squared test
## 
## data:  t2
## X-squared = 51, df = 22, p-value = 4e-04

Gráficamente podemos intuir que existen diferencias por sexo. El contraste Chi-cuadrado da un \(p\)-valor muy próximo a cero, con lo que la independencia entre las variables Sexo y RD1 se rechazarían.

References

Cloninger, C Robert, Thomas R Przybeck, Dragan M Svrakic, and Richard D Wetzel. 1994. “The Temperament and Character Inventory (Tci): A Guide to Its Development and Use.” Center for Psychobiology of Personality, Washington University St. Louis, MO.

Hansenne, Michel, Olivier Le Bon, Anne Gauthier, and Marc Ansseau. 2001. “Belgian Normative Data of the Temperament and Character Inventory.” European Journal of Psychological Assessment 17 (1). Hogrefe & Huber Publishers: 56.