7.8 Intervalo de confianza para la diferencia de proporciones.

Ahora suponemos dos poblaciones en donde se considera la misma característica $A.$ $p_{1}$ es la proporción de elementos con dicha característica en la primera población, y $p_{2}$ es la proporción en la segunda población. Se toma una muestra de tamaño $n_{1}$ de la primera población y otra de tamaño $n_{2}$ en la segunda, y se calculan las respectivas proporciones muestrales $\hat{p_{1}}$ y $\hat{p_{2}}$ . El intervalo de confianza para la diferencia $p_{1}-p_{2}$ es $\left( (\hat{p_{1}}-\hat{p_{2}})\pm Z_{\alpha /2}\sqrt{\frac{\hat{p_{1}}(1-\hat{p_{1}})}{n_{1}}+\frac{\hat{p_{2}}(1-\hat{p_{2}})}{n_{2}}}\right) .$

Para calcularlo con R, introducimos la siguiente función:

z.test.2  <- function(x1,n1,x2,n2,p=0,
  conf.level=0.95,alternative="two.sided")
    {
 ts.z <- NULL
 cint <- NULL
 p.val <- NULL
 phat <- NULL
 p1 <- x1/n1
 p2 <- x2/n2
 q1 <- 1 - p1
 q2 <- 1 - p2
 phat <-  p1 - p2 
 SE.phat <- sqrt( ((p1*q1)/n1) + ((p2*q2)/n2) )
 ts.z <- (phat - p)/SE.phat
 p.val <- pnorm(ts.z)
 ts.z <-  (phat - p )/SE.phat
 if(ts.z<0) p.val <- 2*pnorm(ts.z) 
else p.val<-2*(1-pnorm(ts.z))
  if(alternative=="less") {
      p.val <- pnorm(ts.z)
    }
    if(alternative=="greater") {
      p.val <- 1 - pnorm(ts.z)
   }
   
  cint <- phat + c( 
    -1*((qnorm(((1 - conf.level)/2) + 
        conf.level))*SE.phat),
    ((qnorm(((1 - conf.level)/2) + 
        conf.level))*SE.phat) )
  return(list(estimate=phat,ts.z=ts.z,
            p.val=p.val,cint=cint))
}

Al igual que la función inmediatamente anterior, esta calcula el intervalo de confianza para la diferencia de proporciones, y también realiza un test de hipótesis para contrastar si las proporciones teóricas de las dos poblaciones pueden considerarse iguales.

En Hollywood existe bastante confusión entre los actores Javier Bardem y Jeffrey Dean Morgan. Leer, por ejemplo esto o aquello.

Se elige por la calle aleatoriamente a 100 personas, y se les enseña una foto de Bardem, pidiéndoles que marquen una casilla según quién crean que es (Bardem o el actor americano). 52 personas aciertan. Se hace lo mismo con otras 100 personas a las que se les enseña una foto de Jeffrey Dean Morgan, y 53 personas aciertan. ¿Crees que a lo mejor son la misma persona?

Figura 7.11: J. Bardem y J. Dean Morgan (o al revés).

Calculamos el intervalo usando la función anterior. Únicamente es necesario, para calcular el intervalo de confianza, indicar el nivel de confianza que queremos (aunque, en esta ocasión, vamos a utilizar $0.95$ , y tampoco haría falta escribirlo, puesto que es el que se usa por defecto:

z.test.2(52,100,53,100, conf.level=0.95 )$cint

## [1] -0.1484  0.1284

Como vemos, la proporción de gente que reconoce correctamente a Bardem puede coincidir con la proporción de gente que reconoce correctamente a J.D. Morgan (puesto que el intervalo de confianza contiene al cero). O, lo que es lo mismo, la proporción de gente que se equivoca (creyéndose que es la otra persona) pueden coincidir.