Loading [MathJax]/jax/output/HTML-CSS/jax.js

Inferência Estatística

Intervalos de Confiança

Rosineide da Paz

Objetivos

Trataremos dos temas:

  • Exemplos para distribuição da média amostral
  • Estimação por Intervalo

Distribuição Amostral da Média: Exemplo

Um pesquisador está estudando a resist^encia de um certo material sob determinadas condições. Ele sabe que essa variável é normalmente distribu´ıda com variância igual a 4, ou seja, a resistência é uma variável aleatória

XNormal(μ,σ2=4).

Suponha que foi extraída uma amostra aleatória de tamanho n=10, como segue:

7,9 6,8 5,4 7,5 7,9 6,4 8 6,3 4,4 5,9

  1. Se a média é desconhecida, como estimá-la?
  2. Se utilizarmos o estimador ¯X para obter essa estimativa, estariamos fazendo uma boa escolha? Por quê?
  3. Neste caso, o valor estimado é ¯X=6,65. Se fosse selecioanda outra amostra aleatória, a estimativa seria a mesma?
  4. Será que devemos nos preocupar com a variabilidade das estimativas, ou seja, se temos pequena ou grande variância na distribuição do estimador?

Intervalos de Confiança: caso 1

Intervalos de Confiança para Média (ICM) de Populações Normais e Variância Conhecida (PNVC)

  • Pelo TLC, se X1,X2,,Xn é uma amostra aleatória de uma população normal, então:

¯XN(μ,σ2n)               Z=¯Xμσ/nN(0,1).

  • O desvio-padrão da média amostral σ/n é chamado de Erro-Padrão.

  • Este nome especial é dado para evitar confunsão entre o desvio-padrão da população X e o desvio-padrão da média amostral ¯X.

Contrução do ICM para PNVC

Assim, dado 0<γ<1, existe um α=1γ definindo quantis (±Zα/2) que delimita uma região contendo γ×100 % das amostras na distribuição de Z.

Contrução do IC

Assim, dado 0<γ<1, existe um α=1γ definindo quantis (±Zα/2) que delimita uma região contendo γ×100 % das amostras na distribuição de Z.

 

 

 

P(zα/2Zzα/2)=γP(zα/2ˉXμσ/nzα/2)=γP(zα/2σ/nˉXμzα/2σ/n)=γP(ˉXzα/2σ/nμˉX+zα/2σ/n)=γ

Intevalo aleatório

O intervalo aleatório que depende de α:

[ˉXzα/2σ/n;ˉX+zα/2σ/n],

contém o verdadeiro valor de μ com probabilidade γ=1α.

  • γ é denominado coeficiente de confiança.

  • α é dito ser o nível de significância.

  • Este intervalo é um estimador intervalar para a média populacional.

  • Os estimadores intervalares, juntamente com os seus coeficientes de confiança γ, são chamados de Intervalos de Confiança (IC).

  • Dada uma amostra observada, o intervalo de confiança pode ser obtido substituindo os valores de ¯x, σ, n e zα/2 na equação do estimador.

  • O valor zα/2 pode ser obtido da distribuição N(0,1) de modo que P(Zzα/2)=α2.

Ilustração gráfica

Transformação da normal para normal padrão

Z=¯Xμσ/nN(0,1)                     ¯X=μ+ZσnN(μ,σ2n)

- Note que Zα/2=¯xc1μσ/n e Zα/2=¯xc2μσ/n

Exemplo

  • Considere que um psicultor deseja estimar a média do peso de peixes existentes em um criadouro em um determinado tempo.

  • Suponha que todos os peixes têm a mesma idade e são da mesma espécie.

  • Considere que foi extraída uma amostra aleatória de tamanho 10.

  • Seja X=“peso dos peixes”

  • É razoavel admitir XN(μ,σ2).

  • vamos supor, que devido a estudos realizados, σ2 seja conhecida.

Suponha que a distribuição para os pesos, que iremos supor normal, seja a seguinte.

Exemplo 1

Assim, desta população é selecionada a amostra aleatória de tamanho n=10.

0,66 0,51 0,87 0,28 0,38
0,57 0,41 0,31 0,62 0,49
¯X: 0,51
σ: 0,20

  • Então, obtemos o seguinte IC(95%).
Limite Inferior Limite superior
IC(95%) 0,39 0,63

Intervalos de Confiança: caso 2

Populações não Normais

  • Se a população não pode ser considerada normal, mas a amostra é grande: ¯X se aproxima da Normal(μ,σ2n)

  • Então,

Z=¯Xμσ/n se aproxima da Normal(0,1). Logo, se n30, usamos o mesmo estimador do Caso 1.

Observação: se a amostra é pequena e a população não é normal, esta metodologia não pode ser aplicada.

ICM para Populações Não Normais tendo ou não a variância da população.

- Se a população não é normal, o TLC garante uma aproximação da distribuição da média amostral para a normal.

  • Neste caso, devemos ter amostras suficientemente grande para obter boa aproximação.

  • Aqui, amostras maiores ou iguais a 30 são consideradas grande o suficiente para a obtenção do ICM.

  • Com amostra grande, se a variância da população não é conhecida, basta substituir a variância da população pela variância da amostra (S2).

Exemplo 2: Seja o problema de estimar a quantidade media de ovos por ninho de passarinho em uma dada região, num dado momento, usando uma amostra com n=30.

4 7 4 2 2 3 1 0 3 4
3 4 0 3 3 3 1 0 2 5
2 1 4 4 1 2 2 4 3 2

Aqui, usaremos S, para estimar σ.

¯X: 2,63
S: 1,59
Limite Inferior Limite superior
IC(95%) 2,06 3,2

População simulada

Intervalos de Confiança: caso 3

IC para Populações Normais com Variância Desconhecida e Amostra Pequena

  • Sempre que a amostra for pequena, a população deve ser suposta normal para esta metodologia.

  • Podendo ser feita essa suposição, ainda é comum não ser conhecida a variância da população.

  • Neste caso, a variância deve ser estimada usando a variância amostral.

  • No entanto, o uso deste estimador muda a distribuição da variável aleatória T=¯XμSn.

  • Assim, teremos outra variável aleatória T=¯XμS/n, que tem distribuição t de Student.

  • A curva densidade da t de Student é similar a curva da normal, mas com mais massa de probabilidades nas caldas.

  • Este desvio da normalidade, pode conduzir o estudo a um resultado enganoso.

  • Então, neste caso, usaremos a distribução t de Student, em vez da normal padrão, para obter os quantis que determinam o ICM.

Densidade da distribuição t de Student

f(t)=Γ[(ν+1)/2]Γ[ν/2]πν(1+t2/ν)(ν+1)/2

  • Note que a desnidade desta distribuição depende de um parâmetro ν.

  • Esse parâmetro é chamado de graus de liberdade da distribuição.

Distribuição da Transformação

T=¯XμS/ntStudent(ν=n1)                     ¯X=μ+TσnN(μ,σ2n)

Estimador intervalar para o Caso 3

IC((γ×100)%)=[ˉXtα/2S/n;ˉX+tα/2S/n]

Exemplo 3

  • No exemplo anterior, não se pode supor normalidade da população.

  • Assim, os intervalos de confiança não podem ser obtidos, caso a amostra seja pequena e variância desconhecida.

  • Então, vamos considerar o problema de se obter estimativa para o peso dos peixes em um berçario com variância desconhecida.

  • Considere X=“peso dos peixes com mesma idade e espécie”

  • É razoavel supor XN(μ,σ2).

  • Se σ2 é desconhecido, vamos usar a variância amostral para obter uma estimativa.

Exemplo

Distribuição real da população, suposta normal.

μX: 0,67
σX: 0,22

  • Selecionada uma amostra aleatória, n=10.
0,78 0,96 1,05 0,43 0,49
0,80 0,49 0,71 0,81 0,33
  • Considere desconhecido o desvio-padrão, assim devemos usar o desvio-padrão amostral S, para estimá-lo.
¯X: 0,69
S: 0,24
  • Usando: [ˉXtα/2S/n;ˉX+tα/2S/n],

  • obtemos o seguinte IC(95%).

Limite Inferior Limite superior
IC(95%) 0,52 0,86

IC’s para 100 amostras de tamanho n=10 cada

IC’s para 100 amostras de tamanho n=30 cada

Exercício 1

O projetista de uma indústria tomou uma amostra de n funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Sabendo que foi verificado a média amostral que é ¯x e que o desvio padrão populacional é σ, construir um intervalo de confiança de nível de confiança γ×100% para μ, conforme a tabela.

n ¯x σ γ×100%
29 17,75 3,71 85

Exrecício 2

(Montgomery, Pag: 174, 8-1, adaptado): Para uma população Normal com variância σ2 conhecida, responda: qual o nível de confiança γ=1α para os intervalos:

[¯x2.14σn;¯x+2.14σn]

[¯x2,49σn;¯x+2,49σn]

[¯x1,85σn;¯x+1,85σn]

Exercício 3

(Montgomery, Pag: 178, 8-38, adaptado): Uma máquina produz bastões metálicos usados em um sistema de suspensão de automóveis. Uma amostra aleatória de n bastões, mostrada a seguir, é selecionada para ter o diâmetro medido (em milímetros).

6,86 7,74 5,74 6,37 9,06
5,60 7,49 7,05 7,14 4,84
7,28 7,15 8,37 9,71 6,63
7,89 6,65 6,49 6,72 6,17
6,56 7,91 6,28 10,83 5,51
6,53 9,38 7,65 10,17 7,16

Com base nesse conjunto de dados, responda aos itens.

  1. Apresente a média amostral e seu erro-padrão, respectivamente;
  2. Complete a frase:

Exercício 4

(Montgomery, Pag: 178, 8-34, adaptado): Suponha que a energia solar consumida (em trilhões de BTU) nos Estados Unidos, por ano, de 1989 a 2004, seja como mostrada no quadro a seguir.

59,38 58,80 59,14 95,30 75,26
80,04 66,30 62,94 50,88 66,28
58,45 59,19 66,32 55,06 60,98
58,04 61,27 67,27 68,13 45,86
65,16 46,35 78,95 80,85 84,19
69,76 42,41 79,27 63,98 73,37

Construa um intervalo de confiança para a energia sola média consumida, usando a confiança que segue.

90%