Capítulo 9 Teoria Assintotica
9.1 Convergência de séries não aleatórias
Exemplo de uma série não convergente f(N)=N2
= function(x) x^2
f = 1:30
N plot(N, f(N), type="l", col="lightblue", lwd=4)
Série convergente
g(N)=10x−99/100sin(x)+pi
= function(x) 10*x^(-99/100) * sin(x) + pi
g = 1:100
N plot(N, g(N), type="l", lwd=2)
= 2
e1 plot(N, g(N), type="l", lwd=2)
abline(h=pi+e1, lwd=2, col="darkred")
abline(h=pi-e1, lwd=2, col="darkred")
= .5
e2 plot(N, g(N), type="l", lwd=2)
abline(h=pi+e2, lwd=2, col="darkblue")
abline(h=pi-e2, lwd=2, col="darkblue")
= .1
e3 plot(N, g(N), type="l", lwd=2)
abline(h=pi+e3, lwd=2, col=rgb(.3,.6,1,.5))
abline(h=pi-e3, lwd=2, col=rgb(.3,.6,1,.5))
= 100:200
N plot(N, g(N), type="l", lwd=2)
= .1
e3 abline(h=pi+e3, lwd=2, col=rgb(.3,.6,1,.5))
abline(h=pi-e3, lwd=2, col=rgb(.3,.6,1,.5))
9.2 Convergência em Probabilidade e Lei Fraca dos Grandes Números
Definição Uma variável aleatória converge em probabilidade para c quando n→∞, denotado por Zn→pc ou plimn→∞Zn=c se para todo δ>0,
limn→∞P|Zn−c|≤δ]=1
De forma mais simples, o conceito de convergência em probabilidade se refere a uma sequência de variáveis aleatórias concentrando ao redor de um ponto na medida em que o tamanho amostral cresce.
=matrix(NA,100,30)
A
for(i in 1:30){
=replicate(100,expr = mean(rnorm(i*10)) )
A[,i]
}boxplot(A)
=matrix(NA,100,30)
A
for(i in 1:30){
=replicate(100,expr = mean(rnorm(i*10,10)) )
A[,i]
}boxplot(A)
Definição A Lei Fraca dos Grandes Números: se Xi é independente e identicamente distribuído e E|X|<∞, então, quando n→∞
¯Xn=1nn∑i=1→pE[X]
Portanto, a Lei Fraca dos Grandes Números diz que a média amostral converge em probabilidade para a média populacional. Um estimador que converge em probabilidade para o verdadeiro parâmetro populacional é um estimador consistente.
par(mfrow = c(2, 2))
#loop em n
for (nn in c(5, 10, 50, 100)) {
= replicate(n = 1000, expr = mean(runif(nn, 0, 5)))
xbarra hist(xbarra, col="blue", breaks = 20, xlim = c(0,5), main = paste("n=",nn))
}
= replicate(n = 1000, expr = mean(runif(5, 0, 5)))
xbarra plot(density(xbarra), ylim=c(0,3), xlim = c(0,5))
#loop em n
for (n in c(10, 50, 100)) {
= replicate(n = 1000, expr = mean(runif(n, 0, 5)))
xbarra lines(density(xbarra)) # Draws a plot of the empirical CDF (see below)
}
par(mfrow = c(2, 2))
#loop em n
for (nn in c(50, 100, 500, 1000)) {
= replicate(n = 1000, expr = mean(runif(nn, 0, 5)))
xbarra hist(xbarra, col="blue", breaks = 20, xlim = c(0,5), main = paste("n=",nn))
}
9.2.1 Viés x consistência
set.seed(16)
par(mfrow = c(2, 2))
= 1000
pop for (i in c(20,100,1000,10000)){
= replicate(n = pop, expr = rnorm(i)[1])
fo
plot(density(fo),
col = 'green',
lwd = 2,
ylim = c(0, 2),
xlab = 'estimates',
main = 'Estimador Não viesado e Não Consistente')
abline(v=0)
}
set.seed(16)
par(mfrow = c(2, 2))
= 100
pop for (i in c(20,100,1000,10000)){
= replicate(n = pop, expr = mean(rnorm(i)) - 0.99^i )
fo plot(density(fo),
col = 'green',
lwd = 2,
xlab = 'estimates',
xlim = c(-1,1),
main = 'Estimador Viesado e Consistente')
abline(v=0)
}
set.seed(16)
par(mfrow = c(2, 2))
= 1000
pop for (i in c(20,100,1000,10000)){
= replicate(n = pop, expr = mean(rnorm(i)))
fo
plot(density(fo),
col = 'green',
lwd = 2,
xlab = 'estimates',
xlim = c(-1,1),
main = 'Estimador Não viesado e Consistente')
abline(v=0)
}
Definição: Teorema do Mapeamento Contínuo - Se Zn→pc quando n→∞ e h(.) é contínua em c, então h(Zn)→ph(c) quando n→∞
set.seed(16)
par(mfrow = c(2, 2))
= 1000
pop for (i in c(20,100,1000,10000)){
= replicate(n = pop, expr = mean(2 + 5*(rnorm(i,1))))
x
plot(density(x),
col = 'green',
lwd = 2,
xlab = 'estimates',
xlim = c(0,10),
main = 'Estimador Não viesado e Consistente')
abline(v=0)
}
9.3 Convergência em Distribuição e Teorema Central do Limite
Um outro tipo de convergência importante no estudo das propriedades de um estimador é a convergência em distribuição. Vimos que a média amostral converge em probabilidade para a média populacional, mas para realizar inferência estatística é necessário conhecer o comportamento assintótico da distribuição da média amostral.
Definição Seja Zn uma variável aleatória com distribuição G(u)=P[Zn≤u]. Zn converge em distribuição para Z quando n→∞, denotado por Zn→dZ, se para todo u em que G(u)=P[Z≤u] é contínua, Gn(u)→G(u) quando n→∞.
Média Amostral: A média amostral ˉXn é uma função da distribuição F das observações e do tamanho amostral n. O objetivo é encontrar a distribuição assintótica de ˉXn, ou seja, queremos mostrar que ˉXn→dZ. Pela li dos Grandes Números sabemos que ˉXn→pμ. Desde que convergência em probabilidade para uma constante é o mesmo que convergência em distribuição, isso implica que ˉXn→dμ. No entanto, esta não é uma distribuição útil pois o limite da distribuição é degenerado. Para obter uma distribuição não degenerada precisamos reescalonar ˉXn. Lembre que var(ˉXn−μ)=σ2n. Isso implica que var(√n(ˉXn−μ))=σ2. Portanto, esse resultado sugere uma normalização da estatística:
ZN=√n(ˉXn−μ)
Feito isso, temos que E[Zn]=0 e var(Zn)=σ2. Portanto a média e a variância da distribuição amostral do estimador da média estão estabelecidos. Portanto, o próximo passo é encontrar a distribuição assintótica de Zn.
Definição Teorema Central do Limite: se Xi representa uma amostra i.i.d e E[X2]<∞, então, quando n→∞
√n(ˉXn−μ)→dN(0,σ2)
<- 10000
reps <- c(5, 20, 75, 100) sample.sizes
Distribuição Normal
par(mfrow = c(2, 2))
for (n in sample.sizes) {
=replicate(1000,expr = sqrt(i)*mean(rnorm(i)))
xplot(density(x))
}
Distribuição Poison
par(mfrow = c(2, 2))
set.seed(123)
= 1
lambda for (n in sample.sizes) {
=replicate(1000,expr = sqrt(n)*(mean(rpois(i,lambda)-lambda)))
xplot(density(x))
}
Distribuição Binomial
par(mfrow = c(2, 2))
set.seed(123)
for(i in c(10,100,500,1000)){
=replicate(1000,expr = sqrt(i)*(mean(rbinom(i,1,0.5)-0.5)/0.5))
xplot(density(x))
}
Distribuição Uniforme
par(mfrow = c(2, 2))
set.seed(123)
par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
=replicate(1000,expr = sqrt(i)*(mean(sample(1:6,i,replace = TRUE)-3.5)))
xplot(density(x))
}
Jogar um dado
par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
=replicate(1000,expr = sqrt(i)*(mean(sample(1:6,i,replace = TRUE)-3.5)))
xplot(density(x))
}
Distribuição Uniforme discreta
par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
=replicate(1000,expr = sqrt(i)*(mean(sample(1:50,i,replace = TRUE)-25.5)))
xplot(density(x))
}