7.7 Intervalo de confianza para la desviación típica
(Para la varianza, simplemente se elevan los valores al cuadrado).
7.7.1 Conociendo la media
(√∑ni=1(xi−μ)2χ2n,α/2 , √∑ni=1(xi−μ)2χ2n,1−α/2) siendo χ2n,α/2 el valor de una Chi-cuadrado con n grados de libertad que deja a la derecha α/2 de área.
7.7.2 Desconociendo la media
(√∑ni=1(xi−ˉx)2χ2n−1,α/2 , √∑ni=1(xi−ˉx)2χ2n−1,1−α/2)=
=(√(n−1)ˆS2n−1χ2n−1,α/2,√(n−1)ˆS2n−1χ2n−1,1−α/2)=(√nˆS2nχ2n−1,α/2,√nˆS2nχ2n−1,1−α/2), siendo χ2n−1,α/2 el valor de una Chi-cuadrado con n−1 grados de libertad que deja a la derecha α/2 de área.
7.7.3 I.C. para una proporción
El objetivo es construir un intervalo de confianza para la proporción de elementos {p}} de una población que poseen una determinada característica (votantes de un partido político, alumnos que usan una determinada red social, elementos defectuosos, …) a partir de una muestra aleatoria simple de la población.
De esta forma, consideramos la variableX | P(X=xi) |
---|---|
0 | 1−p |
1 | p |
Es decir, la variable aleatoria que toma los valores 1 y 0 (1 si tiene la característica con probabilidad p, 0 si no la tiene)
Tomamos entonces una muestra aleatoria simple X1,…,Xn de la variable X∈B(1,p)
Dado el nivel de confianza 1−α, elegimos el estadístico pivotal que T=ˆp−p√p(1−p)n≈N(0,1)
Teniendo en cuenta que α2=P(Z≥zα2), sabemos que 1−α≈P(−zα/2<ˆp−p√p(1−p)n<zα/2)
Despejando obtenemos el intervalo (ˆp−zα/2√p⋅(1−p)n , ˆp+zα/2√p⋅(1−p)n) Puesto que p es desconocido, en la práctica lo sustituiremos por ˆp o por 0.5 (el valor que da lugar a un I.C. con longitud máxima).
Si sustituimos p por ˆp, obtenemos el intervalo de confianza
(ˆp−zα/2√ˆp(1−ˆp)n , ˆp+zα/2√ˆp(1−ˆp)n).
Si sustituimos p por 0.5, obtenemos el intervalo de confianza
(ˆp−zα/2√14n , ˆp+zα/2√14n).
Al finalizar un ensayo clínico para un trabajo fin de master, la profesora Chifuentes dispuso de una m.a.s. de 100 pacientes, de las cuales 7 dijeron no haber notado mejoría. Determinar un intervalo de confianza (con un nivel de confianza aproximado del 99%) para p, proporción de pacientes que notan mejoría en la población en general.
¿Qué tamaño muestral n recomendarías para que la longitud del intervalo de confianza (con un nivel de confianza aproximado del 95%) para la proporción p fuera inferior a 0.01 unidades?- Solución:
Tenemos que n=100 pacientes y que la proporción muestral es ˆp=93100=0.93
El I.C. para p al nivel de confianza aproximado 1−α es: (ˆp−zα/2√p⋅(1−p)n , ˆp+zα/2√p⋅(1−p)n)
Tenemos dos opciones:
Primera opción: aproximar p por ˆp. (0.93±2.575√0.93×0.07100)=(0.93±0.0657)=(0.8643,0.9957)
Segunda opción: aproximar p por 0.5. (0.93±2.575√1400)=(0.93±0.1275)=(0.8025,1.0575)
7.7.3.1 Cálculo del tamaño muestral necesario para obtener una cierta precisión
Sea L la longitud máxima del intervalo.
2⋅zα/2√p(1−p)n≤L⟺n≥4p(1−p)z2α/2L2=4p(1−p)(1.960.01)2 Tenemos dos opciones:
Primera opción: aproximar p por ˆp=0.93.
En este caso obtenemos que n≥10003.53. Hay que preguntarle a 10004 pacientess.
Segunda opción: aproximar p por 0.5.
En este caso obtenemos que n≥38416 pacientess.
7.7.4 Intervalo de confianza para la diferencia de proporciones.
Ahora suponemos dos poblaciones en donde se considera la misma característica A. p1 es la proporción de elementos con dicha característica en la primera población, y p2 es la proporción en la segunda población. Se toma una muestra de tamaño n1 de la primera población y otra de tamaño n2 en la segunda, y se calculan las respectivas proporciones muestrales ^p1 y ^p2. El intervalo de confianza para la diferencia p1−p2 es ((^p1−^p2)±Zα/2√^p1(1−^p1)n1+^p2(1−^p2)n2).
Análogamente al caso anterior, se puede considerar el intervalo más largo posible: ((^p1−^p2)±Zα/2√14n1+14n2).