8.3 Gráficos de barras simples
Para construir construir gráficos de barras, utilizamos a função geom_bar().
Vamos construir um gráfico utilizando nossa base de dados de empréstimos. Digamos que queremos construir um gráfico indicando a quantidade de pessoas por categoria na variável estado_civil2.
(obs: caso não lembre como construímos a variável estado_civil2, voltar aqui)
O comando fill=“cor” pode ser utilizado para escolher a cor de preenchimento do gráfico. Aqui, vamos colorir de azul claro (lightblue), uma cor já pré-definida no R.
Além disso, podemos escolher uma cor personalizada através do código hex. Você pode obter uma lista de códigos hex clicando aqui.
Podemos, ainda, escolher uma cor de contorno para o gráfico através do comando color=“cor”.
Gráfico de barras e proporções
Ótimo, já temos um gráfico de barras personalizado. No entanto, o nosso eixo y mostra a contagem efetiva de quantos indivíduos temos em cada categoria da variável estado_civil2. Muitas vezes, podemos preferir representar as porcentagens para cada categoria.
Usamos o pacote GGally para criar o gráfico de barras com proporções. O comando y=after_stat(prop) que calcula a proporção de cada categoria no eixo y. Além disso, temos que adicionar o comando stat=“prop” na função geom_bar().
#Criar gráfico de barras com porcentagem
dados%>%ggplot(aes(y= after_stat(prop),
x=estado_civil2))+geom_bar(fill="#5EB8B4",stat = "prop")
Com esse gráfico conseguimos ver que mais de 70% dos indivíduos da nossa base de dados são casados(as)
Se quisermos que as porcentagens apareçam em formato de % e não em formato decimal, podemos usar o comando scale_y_continuous(labels = percent_format()), do pacote scales.
#Chamar o pacote scales
library(scales)
#Criar gráfico de barras com porcentagem
dados%>%ggplot(aes(y= ..prop.., group = 1,
x=estado_civil2))+geom_bar(fill="#5EB8B4")+
scale_y_continuous(labels = percent_format()) #adicionar símbolo de %
Gráfico de barras com duas variáveis
Os gráficos de barra também podem ser realizados com duas variáveis diferentes, uma no eixo x e outra no eixo y. Para isso usamos o comando stat=, dentro da função geom_bar()
Podemos, também, resumir os dados usando uma função específica, como média, mediana, etc. Para isso, usamos o comando stat=“summary”, seguido pelo comando fun=“mean”, que especifica que queremos a média da variável que será representada no eixo Y.
dados %>% ggplot(aes(x=estado_civil2, y=idade))+
geom_bar(stat = "summary", fun = "mean",fill="#5EB8B4")
Comando stat + fun
• stat = “summary” + fun = “mean”: Para plotar a média dos valores.
• stat = “summary” + fun = “sum”: Para plotar a soma dos valores.
• stat = “summary” + fun = “median”: Para plotar a mediana dos valores.
• stat = “summary” + fun = “length”: Para contar o número de ocorrências.