2 Tabela de Frequência Simples
Esse tipo de tabela é apropriado para variáveis qualitativas ou quantitativas discretas com poucos valores possíveis, como no caso do Exemplo 1.1. O formato geral para esse tipo de tabela pode ser visto na Tabela 2.1, onde tem-se:
\(k\) sendo o número de classes da tabela, que neste caso é a quantidade de valores distíntos no conjunto de dados;
\(n_i\) a frequência absoluta;
\(f_i\) a frequência relativa;
\(F_{ac}\) a frequência relativa acumulada;
\(n\) total de elementos da amostra, se as medições são feitas em todos os elementos da população, tem-se \(N\) maiúsculo em vez de minúsculo.
| Variável | \(n_i\) | \(f_i\) | \(F_{ac}\) | 
|---|---|---|---|
| \(x_1\) | \(n_1\) | \(f_1=n_1/n\) | \(n_1/n\) | 
| \(x_2\) | \(n_2\) | \(f_2=n_2/n\) | \((n_1+n_2)/n\) | 
| \(...\) | \(...\) | \(...\) | \(...\) | 
| \(x_k\) | \(n_k\) | \(f_k=n_k/n\) | \((n_1+n_2+ ... +n_k)/n\) | 
| Total | \(n\) | 1 | 
Exemplo.2.1 Considere agora a variável Y=“Sexo” a partir dos dados apresentados na Tabela 1.1. Será que, dentre os entrevistados, estiveram mais homens que mulheres? A TAbela 2.2 mostra a distribuição de frequência por sexo dos estudantes que responderam ao questionário. Note que \(\approx 64\)% dos entrevistados são homens, o que pode é esperado, uma vez que, em 2020, se matricularam mais homens do que mulheres nos cursos de engenharias do Campus da UFC de Russas. Note que não faz sentido construir a coluna da frequência acumulada, uma vez que os possíveis valores da variável não tem uma ordenação.
Y=DadosEstudante[,4]           ## variável Sexo
n=length(Y)                    ## obtém o número de elementos no vetor
ni=as.numeric(table(Y))        ## obtém a frequência de cada possível valor nos dados
fi=round(ni/n, digits=3)                       ## obtém a frequência relativa de cada possível valor nos dados
resultado<-c("Feminino", "Masculino", "Não Declarado")  
tabela=cbind(resultado,ni,fi)
Total<- data.frame(
 resultado= "Total",
 ni= sum(ni),
 fi= round( sum(fi), digits = 3))
Tabela=rbind(tabela,c("Total",sum(ni),round( sum(fi), digits = 3)))
knitr::kable(
  Tabela, 
  caption = 'Distribução de frequência da variável Y="sexo".',
  booktabs = TRUE,
  col.names =  c("Y","Frequência absoluta","Frequência relativa"),
   align = "ccc"
)| Y | Frequência absoluta | Frequência relativa | 
|---|---|---|
| Feminino | 74 | 0,354 | 
| Masculino | 133 | 0,636 | 
| Não Declarado | 2 | 0,01 | 
| Total | 209 | 1 | 
Considerando, novamente, os dados de estudantes apresentados na Tabela 1.1, vamos averiguar em torno de que valor tendem a se concentrar as estaturas obtidas, qual a menor ou qual a maior estatura, ou ainda, quantos estudantes estão abaixo ou acima de uma dada estatura. Observe que olhar diretamente para a tabela de dados brutos é difícil se ter uma ideia do comportamento da variável altura considerando o grupo inteiro de estudantes. Novamente podemos interpretar mais facilmente esse conjunto de dados fazendo uso de uma tabela de frequência. Considerando a Tabela de Frequência Simples 2.3, percebemos que esta se mostra muito longa e difere pouco da tabela de dados brutos. Assim, é conveniente montar outra estratégia para resumir esses dados em uma tabela de frequência.
Observe que o processo empregado para variável Altura na Tabela 2.3 é inconveniente. Desta forma, o melhor seria formar agrupamentos. Assim, em vez de ser usada uma tabela com os valores observados da variável, pode-se utilizar intervalos que possam conter esses valores. Esse tipo de tabela será chamado aqui de tabela de frequência com intervalos nas classes.
Z=DadosEstudante[,7]                    ## variável Altura
n=length(Z)                             ## obtém o número de elementos no vetor
ni=as.numeric(table(Z))                 ## obtém a frequência de cada possível valor nos dados
fi=ni/n                                 ## obtém a frequência relativa de cada possível valor nos dados
valposs<-unique(Z)                      ## valores possíveis da variável no conjunto de dados  
fac=cumsum(fi) 
tabela=cbind(valposs,ni,fi,fac)
knitr::kable(
  tabela, 
  caption = 'Distribução de frequência da variável Z="Altura".',
  booktabs = TRUE,
  col.names =  c("Z","Frequência Absoluta","Frequência Relativa","Frequência Acumulada"),
   align = "cccc"
)| Z | Frequência Absoluta | Frequência Relativa | Frequência Acumulada | 
|---|---|---|---|
| 1,61 | 1 | 0,0047847 | 0,0047847 | 
| 1,60 | 1 | 0,0047847 | 0,0095694 | 
| 1,65 | 2 | 0,0095694 | 0,0191388 | 
| 1,73 | 1 | 0,0047847 | 0,0239234 | 
| 1,68 | 1 | 0,0047847 | 0,0287081 | 
| 1,80 | 6 | 0,0287081 | 0,0574163 | 
| 1,75 | 2 | 0,0095694 | 0,0669856 | 
| 1,53 | 2 | 0,0095694 | 0,0765550 | 
| 1,70 | 8 | 0,0382775 | 0,1148325 | 
| 1,93 | 5 | 0,0239234 | 0,1387560 | 
| 1,72 | 4 | 0,0191388 | 0,1578947 | 
| 1,64 | 2 | 0,0095694 | 0,1674641 | 
| 1,82 | 12 | 0,0574163 | 0,2248804 | 
| 1,78 | 4 | 0,0191388 | 0,2440191 | 
| 1,87 | 4 | 0,0191388 | 0,2631579 | 
| 1,76 | 11 | 0,0526316 | 0,3157895 | 
| 1,56 | 6 | 0,0287081 | 0,3444976 | 
| 1,83 | 14 | 0,0669856 | 0,4114833 | 
| 1,63 | 5 | 0,0239234 | 0,4354067 | 
| 1,54 | 5 | 0,0239234 | 0,4593301 | 
| 1,51 | 3 | 0,0143541 | 0,4736842 | 
| 1,85 | 1 | 0,0047847 | 0,4784689 | 
| 1,62 | 23 | 0,1100478 | 0,5885167 | 
| 1,71 | 7 | 0,0334928 | 0,6220096 | 
| 1,69 | 9 | 0,0430622 | 0,6650718 | 
| 1,59 | 10 | 0,0478469 | 0,7129187 | 
| 1,52 | 4 | 0,0191388 | 0,7320574 | 
| 1,55 | 11 | 0,0526316 | 0,7846890 | 
| 1,58 | 5 | 0,0239234 | 0,8086124 | 
| 1,50 | 1 | 0,0047847 | 0,8133971 | 
| 1,77 | 11 | 0,0526316 | 0,8660287 | 
| 1,81 | 2 | 0,0095694 | 0,8755981 | 
| 1,49 | 8 | 0,0382775 | 0,9138756 | 
| 1,66 | 2 | 0,0095694 | 0,9234450 | 
| 1,67 | 2 | 0,0095694 | 0,9330144 | 
| 1,57 | 3 | 0,0143541 | 0,9473684 | 
| 1,74 | 2 | 0,0095694 | 0,9569378 | 
| 1,94 | 4 | 0,0191388 | 0,9760766 | 
| 1,48 | 1 | 0,0047847 | 0,9808612 | 
| 1,84 | 3 | 0,0143541 | 0,9952153 | 
| 1,79 | 1 | 0,0047847 | 1,0000000 |