Inferência Estatística

Análise de Variância (ANOVA)

Rosineide da Paz

Teste Estatístico de Hipóteses

Hipóteses

Monta-se uma hipótese principal (hipótese nula)

$H_0: \theta=\theta_0$

em que $\theta$ é uma característica da população.

Exemplos:

proporção populacional;
média populacional;
variância da população;
distribuição da população;
homogeneidade;
entre outros.

Ou seja, é feita uma afirmação sobre uma característica.

Supõe-se inicialmente que $H_0$ seja verdadeira.
Obtém-se uma estatística para testar $H_0$ .
Decide-se sobre rejeitar (manter como verdade) ou não essa hipótese.
Caso $H_0$ seja rejeitada, sua hipótese complementar (alternativa) é considerada como verdadeira.
Então, o teste deve ser dicotômico, com apenas duas possibilidades.
A hipótese alternativa é normalmente denotada por $H_a$ ou $H_1$ .
Aqui denotaremos por $H_a$ .

Exemplo de aplicação

Um tipo de cabo de aço é fabricado de modo que sua resistência seja uma variável aleatória que segue uma distribuição normal com média de 12 kgf e desvio-padrão de 5 kgf.
O controle de qualidade decide analisar a qualidade dos cabos produzidos.
Para isto, seleciona uma amostra aleatória de tamanho 15, que forneceu os seguintes valores:

3.89

8.56

9.79

10.98

8.78

6.43

14.92

7.69

11.77

9.04

12.8

7.35

7.64

19.86

$\mu_0$	$\overline{x}_{obs}$	$\sigma$
12	10.17	5

O que dizer sobre a resistência, tem mesmo média $\mu_0=12$ ?

Realização de um teste de hipóteses para a média da população

Para realização de um teste de hipóteses para a média da população, $\mu$ ,
deve-se formular duas hipóteses:
- hipótese nula $H_0$ e
- hipótese alternativa $H_a$ .
Se $\mu_0$ é um valor suposto para a média da população,
então podem ocorrer os seguintes testes.

- Teste bilateral: $H_0: \mu=\mu_0 \ \ \ \mbox{ contra }\ \ \ H_a: \mu\neq\mu_0$ - Teste unilateral a esquerda: $H_0: \mu=\mu_0 \ \ \ \mbox{ contra }\ \ \ H_a: \mu < \mu_0$

Teste unilateral a direita: $H_0: \mu=\mu_0 \ \ \ \mbox{ contra }\ \ \ H_a: \mu > \mu_0$

ANOVA um fator fixo

Análise de variância (ANOVA)

Este é um procedimento utilizado para comparar três ou mais médias populacionais, tendo como base as variâncias amostrais.
Os dados amostrais são separados em grupos segundo uma característica (fator).

-Fator (ou tratamento): é uma característica que permite distinguir diferentes populações umas das outras.

Cada fator contém dois ou mais grupos (classificações).
Existem muitas formas de realizar uma análise de variância, que depende do tipo de experimento a ser realizado.

Experimento

Um experimento pode envolver as seguintes atividades.

Conjectura: uma hipótese que motiva o experimento.
Experimento: o teste realizado para investigar a congectura.
Análise: investigação estatística dos dados gerados no experimento.
Conclusão: afirmação ou reformulação da conjectura proposta inicialmente.

Caso a conjectura seja reformulada, novo experimento é requerido.

Motivação

Com o objetivo de avaliar as modificações promovidas na interface de um sistema, foi realizado um experimento composto por 4 intervenções distintas.
Para cada intervenção, foram investigados 20 usuários que atuam na mesma área.
No experimento para cada usuário foi medido o grau de satisfação, usando para isso um modelo estatístico previamente treinado para este fim.
Para cada usuário, foi escolhida uma interface de forma aleatória.
O grau de satisfação foi patronizado para assumir valores entre 0 e 100, em que zero índica um usuário muito insatisfeito e 100 indica um usuário muito satisfeito.

Users	Trat 1	Trat 2	Trat 3	Trat 4
1	0.60	0.82	0.79	0.82
2	0.62	0.85	0.83	0.81
3	0.61	0.78	0.82	0.79
4	0.64	0.79	0.81	0.80
5	0.63	0.80	0.82	0.79

Delineamento

Neste exemplo o fator investigado é o design da interface do sistema.
E cada usuário representa uma replicação do experimento para os 4 tratamentos.
Já as intervenções realizadas representam tratamentos que são níveis (ou categorias) do fator que é controlável no experimento.
Um tratamento é uma condição imposta que se deseja avaliar em um experimento.
Cada nível define um grupo de observações.
Ainda no exemplo, o grau de satisfação é denominada resposta, ou variável dependente do fator, que é independenteno modelo.

Neste exemplo, os fatores são

Fatores e Tipos de Tratamentos

Os tratamentos podem ser como segue.

Quantitativos: doses de remédios, temperaturas, resistências etc.
Qualitativos: marcas de equipamentos, tipos de plantas, diferentes interfaces etc.

O tipo de tratamento afeta a forma como os dados são analisados.

Em relação aos fatores, podemos ter diferentes fatores controláveis. Aqui abordaremos experimentos com apenas um fator.

Comparação

Modelo

$\begin{aligned} & \text {Dados típicos para experimento com um único fator. }\\ &\begin{array}{c|ccc} \hline \text{Replicações}&& \text{Fator} \\ & \text{Tratamento 1} & \text{Tratamento 2} & \cdots & \text{Tratamento k} \\\hline 1 & y_{11} & y_{12} &\cdots & y_{1k} \\ 2 & y_{21} & y_{22} &\cdots & y_{2k} \\ \vdots&\vdots & \vdots&\vdots & \vdots \\ n & y_{n1} & y_{n2} & \cdots& y_{nk} \\ \hline Médias & \overline{y_1}&\overline{y_2}&\cdots&\overline{y_k}\\ \hline \end{array} \end{aligned}$

- Experimentos com um fator e efeito fixo, tem com modelo:

$y_{ij} = \mu + b_j + \epsilon_{ij}$

para $i=1, \cdots, n$
e $j=1,\cdots k$ .

Queremos testar: $H_0:\mu_1=\mu_2=\cdots=\mu_k$ vs $H_1:\mu_j\neq\mu_l, \mbox{ para algum par } j \neq l$

Ainda…

O que equivale a testar: $H_0:b_1=b_2=\cdots=b_k=0$ vs $H_1:b_j\neq0, \mbox{ para algum } j.$

Em que: $\sum_{j=1}^{k}b_j=0$

Somas de quadrados

A partir da divisão da soma de quadrados global em soma de quadrado entre os tratamentos e soma de quadrados dentro dos grupos, tem-se a seguinte igualdade: $\sum_{j=1}^{k}\sum_{i=1}^{n}(y_{ij}-\overline{y})^2=n\sum_{j=1}^{k}(\overline{y}_{j}-\overline{y})^2+\sum_{j=1}^{k}\sum_{i=1}^{n}(y_{ij}-\overline{y}_j)^2$ Que dá origem a estatística:

$F_{obs} = \frac{\sum_{j=1}^{k}(\overline{y}_{j}-\overline{y})^2/(k-1)}{\sum_{j=1}^{k}\sum_{i=1}^{n}(y_{ij}-\overline{y}_j)^2/[k(n-1)]}$

Esse valor pode ser usado para saber o quão improvável é a distriuição considerada, a partir da hipótese principal adotada.

ANOVA de um fator com google planilhas

Passo 1: instalar a extensão XLMiner Analysis ToolPak;
Passo 2: carregar a base de dados no formato adequado;
Passo 3: selecionar os valores de resposta;
Passo 4: Clicar em Extensões > XLMiner Analysis ToolPak > Start.

Esta extensão pode aplicar também o teste t e normal para uma amostra.