2 Tabela de Frequência Simples

Esse tipo de tabela é apropriado para variáveis qualitativas ou quantitativas discretas com poucos valores possíveis, como no caso do Exemplo 1.1. O formato geral para esse tipo de tabela pode ser visto na Tabela 2.1, onde tem-se:

\(k\) sendo o número de classes da tabela, que neste caso é a quantidade de valores distíntos no conjunto de dados;
\(n_i\) a frequência absoluta;
\(f_i\) a frequência relativa;
\(F_{ac}\) a frequência relativa acumulada;
\(n\) total de elementos da amostra, se as medições são feitas em todos os elementos da população, tem-se \(N\) maiúsculo em vez de minúsculo.

Tabela 2.1: Modelo para um tabela de frequência simples.
Variável	\(n_i\)	\(f_i\)	\(F_{ac}\)
\(x_1\)	\(n_1\)	\(f_1=n_1/n\)	\(n_1/n\)
\(x_2\)	\(n_2\)	\(f_2=n_2/n\)	\((n_1+n_2)/n\)
\(...\)	\(...\)	\(...\)	\(...\)
\(x_k\)	\(n_k\)	\(f_k=n_k/n\)	\((n_1+n_2+ ... +n_k)/n\)
Total	\(n\)	1

Exemplo.2.1 Considere agora a variável Y=“Sexo” a partir dos dados apresentados na Tabela 1.1. Será que, dentre os entrevistados, estiveram mais homens que mulheres? A TAbela 2.2 mostra a distribuição de frequência por sexo dos estudantes que responderam ao questionário. Note que \(\approx 64\)% dos entrevistados são homens, o que pode é esperado, uma vez que, em 2020, se matricularam mais homens do que mulheres nos cursos de engenharias do Campus da UFC de Russas. Note que não faz sentido construir a coluna da frequência acumulada, uma vez que os possíveis valores da variável não tem uma ordenação.

Y=DadosEstudante[,4]           ## variável Sexo

n=length(Y)                    ## obtém o número de elementos no vetor
ni=as.numeric(table(Y))        ## obtém a frequência de cada possível valor nos dados
fi=round(ni/n, digits=3)                       ## obtém a frequência relativa de cada possível valor nos dados
resultado<-c("Feminino", "Masculino", "Não Declarado")  

tabela=cbind(resultado,ni,fi)


Total<- data.frame(
 resultado= "Total",
 ni= sum(ni),
 fi= round( sum(fi), digits = 3))

Tabela=rbind(tabela,c("Total",sum(ni),round( sum(fi), digits = 3)))

knitr::kable(
  Tabela, 
  caption = 'Distribução de frequência da variável Y="sexo".',
  booktabs = TRUE,
  col.names =  c("Y","Frequência absoluta","Frequência relativa"),
   align = "ccc"
)

Tabela 2.2: Distribução de frequência da variável Y=“sexo”.
Y	Frequência absoluta	Frequência relativa
Feminino	74	0,354
Masculino	133	0,636
Não Declarado	2	0,01
Total	209	1

Considerando, novamente, os dados de estudantes apresentados na Tabela 1.1, vamos averiguar em torno de que valor tendem a se concentrar as estaturas obtidas, qual a menor ou qual a maior estatura, ou ainda, quantos estudantes estão abaixo ou acima de uma dada estatura. Observe que olhar diretamente para a tabela de dados brutos é difícil se ter uma ideia do comportamento da variável altura considerando o grupo inteiro de estudantes. Novamente podemos interpretar mais facilmente esse conjunto de dados fazendo uso de uma tabela de frequência. Considerando a Tabela de Frequência Simples 2.3, percebemos que esta se mostra muito longa e difere pouco da tabela de dados brutos. Assim, é conveniente montar outra estratégia para resumir esses dados em uma tabela de frequência.

Observe que o processo empregado para variável Altura na Tabela 2.3 é inconveniente. Desta forma, o melhor seria formar agrupamentos. Assim, em vez de ser usada uma tabela com os valores observados da variável, pode-se utilizar intervalos que possam conter esses valores. Esse tipo de tabela será chamado aqui de tabela de frequência com intervalos nas classes.

Z=DadosEstudante[,7]                    ## variável Altura
n=length(Z)                             ## obtém o número de elementos no vetor
ni=as.numeric(table(Z))                 ## obtém a frequência de cada possível valor nos dados
fi=ni/n                                 ## obtém a frequência relativa de cada possível valor nos dados
valposs<-unique(Z)                      ## valores possíveis da variável no conjunto de dados  
fac=cumsum(fi) 
tabela=cbind(valposs,ni,fi,fac)

knitr::kable(
  tabela, 
  caption = 'Distribução de frequência da variável Z="Altura".',
  booktabs = TRUE,
  col.names =  c("Z","Frequência Absoluta","Frequência Relativa","Frequência Acumulada"),
   align = "cccc"
)

Tabela 2.3: Distribução de frequência da variável Z=“Altura”.
Z	Frequência Absoluta	Frequência Relativa	Frequência Acumulada
1,61	1	0,0047847	0,0047847
1,60	1	0,0047847	0,0095694
1,65	2	0,0095694	0,0191388
1,73	1	0,0047847	0,0239234
1,68	1	0,0047847	0,0287081
1,80	6	0,0287081	0,0574163
1,75	2	0,0095694	0,0669856
1,53	2	0,0095694	0,0765550
1,70	8	0,0382775	0,1148325
1,93	5	0,0239234	0,1387560
1,72	4	0,0191388	0,1578947
1,64	2	0,0095694	0,1674641
1,82	12	0,0574163	0,2248804
1,78	4	0,0191388	0,2440191
1,87	4	0,0191388	0,2631579
1,76	11	0,0526316	0,3157895
1,56	6	0,0287081	0,3444976
1,83	14	0,0669856	0,4114833
1,63	5	0,0239234	0,4354067
1,54	5	0,0239234	0,4593301
1,51	3	0,0143541	0,4736842
1,85	1	0,0047847	0,4784689
1,62	23	0,1100478	0,5885167
1,71	7	0,0334928	0,6220096
1,69	9	0,0430622	0,6650718
1,59	10	0,0478469	0,7129187
1,52	4	0,0191388	0,7320574
1,55	11	0,0526316	0,7846890
1,58	5	0,0239234	0,8086124
1,50	1	0,0047847	0,8133971
1,77	11	0,0526316	0,8660287
1,81	2	0,0095694	0,8755981
1,49	8	0,0382775	0,9138756
1,66	2	0,0095694	0,9234450
1,67	2	0,0095694	0,9330144
1,57	3	0,0143541	0,9473684
1,74	2	0,0095694	0,9569378
1,94	4	0,0191388	0,9760766
1,48	1	0,0047847	0,9808612
1,84	3	0,0143541	0,9952153
1,79	1	0,0047847	1,0000000