Capítulo 9 Teoria Assintotica

9.1 Convergência de séries não aleatórias

Exemplo de uma série não convergente f(N)=N2

f = function(x) x^2
N = 1:30
plot(N, f(N), type="l", col="lightblue", lwd=4)

Série convergente

g(N)=10x99/100sin(x)+pi

g = function(x) 10*x^(-99/100) * sin(x) + pi
N = 1:100
plot(N, g(N), type="l", lwd=2)

e1 = 2
plot(N, g(N), type="l", lwd=2)
abline(h=pi+e1, lwd=2, col="darkred")
abline(h=pi-e1, lwd=2, col="darkred")

e2 = .5
plot(N, g(N), type="l", lwd=2)
abline(h=pi+e2, lwd=2, col="darkblue")
abline(h=pi-e2, lwd=2, col="darkblue")

e3 = .1
plot(N, g(N), type="l", lwd=2)
abline(h=pi+e3, lwd=2, col=rgb(.3,.6,1,.5))
abline(h=pi-e3, lwd=2, col=rgb(.3,.6,1,.5))

N = 100:200
plot(N, g(N), type="l", lwd=2)
e3 = .1
abline(h=pi+e3, lwd=2, col=rgb(.3,.6,1,.5))
abline(h=pi-e3, lwd=2, col=rgb(.3,.6,1,.5))

9.2 Convergência em Probabilidade e Lei Fraca dos Grandes Números

Definição Uma variável aleatória converge em probabilidade para c quando n, denotado por Znpc ou plimnZn=c se para todo δ>0,

limnP|Znc|δ]=1

De forma mais simples, o conceito de convergência em probabilidade se refere a uma sequência de variáveis aleatórias concentrando ao redor de um ponto na medida em que o tamanho amostral cresce.

A=matrix(NA,100,30)

for(i in 1:30){
  A[,i]=replicate(100,expr = mean(rnorm(i*10)) )
}
boxplot(A)

A=matrix(NA,100,30)

for(i in 1:30){
  A[,i]=replicate(100,expr = mean(rnorm(i*10,10)) )
}
boxplot(A)

Definição A Lei Fraca dos Grandes Números: se Xi é independente e identicamente distribuído e E|X|<, então, quando n

¯Xn=1nni=1pE[X]

Portanto, a Lei Fraca dos Grandes Números diz que a média amostral converge em probabilidade para a média populacional. Um estimador que converge em probabilidade para o verdadeiro parâmetro populacional é um estimador consistente.

par(mfrow = c(2, 2))
#loop em n
for (nn in c(5, 10, 50, 100)) {

  xbarra = replicate(n = 1000, expr = mean(runif(nn, 0, 5)))
  hist(xbarra, col="blue", breaks = 20, xlim = c(0,5), main = paste("n=",nn))
}

xbarra = replicate(n = 1000, expr = mean(runif(5, 0, 5)))
plot(density(xbarra), ylim=c(0,3), xlim = c(0,5))



#loop em n
for (n in c(10, 50, 100)) {
  
  xbarra = replicate(n = 1000, expr = mean(runif(n, 0, 5)))
  lines(density(xbarra))        # Draws a plot of the empirical CDF (see below)
  
}

par(mfrow = c(2, 2))
#loop em n
for (nn in c(50, 100, 500, 1000)) {

  xbarra = replicate(n = 1000, expr = mean(runif(nn, 0, 5)))
  hist(xbarra, col="blue", breaks = 20, xlim = c(0,5), main = paste("n=",nn))
}

9.2.1 Viés x consistência

set.seed(16)


par(mfrow = c(2, 2))

pop = 1000
for (i in c(20,100,1000,10000)){
  
  fo = replicate(n = pop, expr = rnorm(i)[1])

  plot(density(fo),
       col = 'green',
       lwd = 2,
       ylim = c(0, 2),
       xlab = 'estimates',
       main = 'Estimador Não viesado e Não Consistente')
  abline(v=0)
}

set.seed(16)
par(mfrow = c(2, 2))

pop = 100
for (i in c(20,100,1000,10000)){

  fo = replicate(n = pop, expr = mean(rnorm(i)) - 0.99^i )
  plot(density(fo),
       col = 'green',
       lwd = 2,
       xlab = 'estimates',
       xlim = c(-1,1),
       main = 'Estimador Viesado e Consistente')
  abline(v=0)
}

set.seed(16)
par(mfrow = c(2, 2))

pop = 1000
for (i in c(20,100,1000,10000)){
  
  fo = replicate(n = pop, expr = mean(rnorm(i)))
  
  plot(density(fo),
       col = 'green',
       lwd = 2,
       xlab = 'estimates',
       xlim = c(-1,1),
       main = 'Estimador Não viesado e Consistente')
  abline(v=0)
}

Definição: Teorema do Mapeamento Contínuo - Se Znpc quando n e h(.) é contínua em c, então h(Zn)ph(c) quando n

set.seed(16)
par(mfrow = c(2, 2))

pop = 1000
for (i in c(20,100,1000,10000)){
  
x = replicate(n = pop, expr = mean(2 + 5*(rnorm(i,1))))
  
  plot(density(x),
       col = 'green',
       lwd = 2,
       xlab = 'estimates',
       xlim = c(0,10),
       main = 'Estimador Não viesado e Consistente')
  abline(v=0)
}

9.3 Convergência em Distribuição e Teorema Central do Limite

Um outro tipo de convergência importante no estudo das propriedades de um estimador é a convergência em distribuição. Vimos que a média amostral converge em probabilidade para a média populacional, mas para realizar inferência estatística é necessário conhecer o comportamento assintótico da distribuição da média amostral.

Definição Seja Zn uma variável aleatória com distribuição G(u)=P[Znu]. Zn converge em distribuição para Z quando n, denotado por ZndZ, se para todo u em que G(u)=P[Zu] é contínua, Gn(u)G(u) quando n.

Média Amostral: A média amostral ˉXn é uma função da distribuição F das observações e do tamanho amostral n. O objetivo é encontrar a distribuição assintótica de ˉXn, ou seja, queremos mostrar que ˉXndZ. Pela li dos Grandes Números sabemos que ˉXnpμ. Desde que convergência em probabilidade para uma constante é o mesmo que convergência em distribuição, isso implica que ˉXndμ. No entanto, esta não é uma distribuição útil pois o limite da distribuição é degenerado. Para obter uma distribuição não degenerada precisamos reescalonar ˉXn. Lembre que var(ˉXnμ)=σ2n. Isso implica que var(n(ˉXnμ))=σ2. Portanto, esse resultado sugere uma normalização da estatística:

ZN=n(ˉXnμ)

Feito isso, temos que E[Zn]=0 e var(Zn)=σ2. Portanto a média e a variância da distribuição amostral do estimador da média estão estabelecidos. Portanto, o próximo passo é encontrar a distribuição assintótica de Zn.

Definição Teorema Central do Limite: se Xi representa uma amostra i.i.d e E[X2]<, então, quando n

n(ˉXnμ)dN(0,σ2)

reps <- 10000
sample.sizes <- c(5, 20, 75, 100)

Distribuição Normal

par(mfrow = c(2, 2))
for (n in sample.sizes) {
  x=replicate(1000,expr = sqrt(i)*mean(rnorm(i)))
  plot(density(x))                
}

Distribuição Poison

par(mfrow = c(2, 2))
set.seed(123)
lambda = 1
for (n in sample.sizes) {
    x=replicate(1000,expr = sqrt(n)*(mean(rpois(i,lambda)-lambda)))
  plot(density(x))                

}

Distribuição Binomial

par(mfrow = c(2, 2))
set.seed(123)

for(i in c(10,100,500,1000)){
  x=replicate(1000,expr = sqrt(i)*(mean(rbinom(i,1,0.5)-0.5)/0.5))
  plot(density(x))                
}  

Distribuição Uniforme

par(mfrow = c(2, 2))

set.seed(123)

par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
  x=replicate(1000,expr = sqrt(i)*(mean(sample(1:6,i,replace = TRUE)-3.5)))
  plot(density(x))                
}

Jogar um dado

par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
  x=replicate(1000,expr = sqrt(i)*(mean(sample(1:6,i,replace = TRUE)-3.5)))
  plot(density(x))                
}

Distribuição Uniforme discreta

par(mfrow = c(2, 2))
for(i in c(1,5,10,50)){
  x=replicate(1000,expr = sqrt(i)*(mean(sample(1:50,i,replace = TRUE)-25.5)))
  plot(density(x))                
}