8.3 Gráficos de barras simples

Para construir construir gráficos de barras, utilizamos a função geom_bar().

Vamos construir um gráfico utilizando nossa base de dados de empréstimos. Digamos que queremos construir um gráfico indicando a quantidade de pessoas por categoria na variável estado_civil2.

(obs: caso não lembre como construímos a variável estado_civil2, voltar aqui)

dados %>% ggplot(aes(x=estado_civil2))+geom_bar()

O comando fill=“cor” pode ser utilizado para escolher a cor de preenchimento do gráfico. Aqui, vamos colorir de azul claro (lightblue), uma cor já pré-definida no R.

dados %>% ggplot(aes(x=estado_civil2))+geom_bar(fill="lightblue")

Além disso, podemos escolher uma cor personalizada através do código hex. Você pode obter uma lista de códigos hex clicando aqui.

dados %>% ggplot(aes(x=estado_civil2))+geom_bar(fill="#5EB8B4")

Podemos, ainda, escolher uma cor de contorno para o gráfico através do comando color=“cor”.

dados %>% ggplot(aes(x=estado_civil2))+geom_bar(fill="#5EB8B4", color="black")

Gráfico de barras e proporções

Ótimo, já temos um gráfico de barras personalizado. No entanto, o nosso eixo y mostra a contagem efetiva de quantos indivíduos temos em cada categoria da variável estado_civil2. Muitas vezes, podemos preferir representar as porcentagens para cada categoria.

Usamos o pacote GGally para criar o gráfico de barras com proporções. O comando y=after_stat(prop) que calcula a proporção de cada categoria no eixo y. Além disso, temos que adicionar o comando stat=“prop” na função geom_bar().

#Criar gráfico de barras com porcentagem

dados%>%ggplot(aes(y= after_stat(prop),
                   x=estado_civil2))+geom_bar(fill="#5EB8B4",stat = "prop")

Com esse gráfico conseguimos ver que mais de 70% dos indivíduos da nossa base de dados são casados(as)

Se quisermos que as porcentagens apareçam em formato de % e não em formato decimal, podemos usar o comando scale_y_continuous(labels = percent_format()), do pacote scales.

#Chamar o pacote scales
library(scales)

#Criar gráfico de barras com porcentagem

dados%>%ggplot(aes(y= ..prop.., group = 1,
                   x=estado_civil2))+geom_bar(fill="#5EB8B4")+
scale_y_continuous(labels = percent_format()) #adicionar símbolo de %

Gráfico de barras com duas variáveis

Os gráficos de barra também podem ser realizados com duas variáveis diferentes, uma no eixo x e outra no eixo y. Para isso usamos o comando stat=, dentro da função geom_bar()

Podemos, também, resumir os dados usando uma função específica, como média, mediana, etc. Para isso, usamos o comando stat=“summary”, seguido pelo comando fun=“mean”, que especifica que queremos a média da variável que será representada no eixo Y.

dados %>% ggplot(aes(x=estado_civil2, y=idade))+
geom_bar(stat = "summary", fun = "mean",fill="#5EB8B4")

Comando stat + fun

• stat = “summary” + fun = “mean”: Para plotar a média dos valores.
• stat = “summary” + fun = “sum”: Para plotar a soma dos valores.
• stat = “summary” + fun = “median”: Para plotar a mediana dos valores.
• stat = “summary” + fun = “length”: Para contar o número de ocorrências.