Chapter 9 Aula 8

9.0.1 Gráficos de linhas

Para construir gráficos de linhas com o ggplot utilizamos a função geom_line()

Vamos utilizar uma base de dados babynames para construir um gráfico mostrando a evolução da popularidade de três nomes nos EUA, de 1880 a 2015.Este pacote de dados está disponível para instalar no CRAN do R, com o nome de “babynames”.

Devido à enorme extensão da base, filtramos apenas os nomes “Amanda”, “Emma” e “Taylor”, mantendo, também, apenas os nomes femininos.

Utilizamos o argumento year (ano) no eixo x, o argumento n (contagem de bebês) no eixo y. Além disso, agrupamos e colorimos as linhas a partir da variável nome, com os comandos group e color.

#Criar gráfico de linhas
babynames%>%ggplot( aes(x=year, y=n,group=name, color=name)) + 
  geom_line()

9.0.2 Histogramas e densidade

Para construir histogramas, utilizamos a função geom_histogram(). Para isso precisamos de uma variável quantitativa.

Vamos montar um histograma da idade dos indivíduos da nossa base de dados.

ggplot(dados, aes(x=idade)) + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Para definir o tamanho de cada intervalo, podemos utilizar o argumento bindwidth.

ggplot(IBGE, aes(x=SM)) + geom_histogram(binwidth =0.5)

Gráfico de densidade

Podemos, também, criar gráficos de densidade no lugar do histograma. Nesse caso, utilizamos a função geom_density(). O comando alpha indica a transparência do preenchimento do gráfico.

ggplot(dados, aes(x=idade)) + geom_density(alpha=.2, fill="#FF6666")

9.0.3 Boxplot

Boxplots também são úteis para estudarmos a distribuição de uma variável, principalmente quando queremos comparar várias distribuições.

Para construir um boxplot no ggplot, utilizamos a função geom_boxplot(). Ele precisa dos atributos x e y, sendo que no atributo x devemos mapear uma variável categórica.

Façamos um boxplot cruzando o estado civil e idade.

dados%>%ggplot(aes(x=estado_civil2, y=idade)) + geom_boxplot()

9.0.4 Gráfico de calor

O gráfico de calor é utilizado para representar duas variáveis qualitativas e uma variável quantitativa.

Digamos que queremos cruzar estado civil, idade por grupos e o valor do empréstimo. Teremos a seguinte grafia:

dados%>%ggplot(aes(estado_civil2, idadeQ, fill= valor_emprestimo)) + 
  geom_tile()

9.0.5 Juntando gráficos

Uma funcionalidade muito útil do ggplot2 é a possibilidade de usar facets para replicar um gráfico para cada categoria de uma variável.

Vamos criar um gráfico de estado civil para cada categoria de idade que criamos na segunda aula, com a variável idadeQ.

ggplot(dados, aes(x=idadeQ))+geom_bar(fill="#5EB8B4")+
  facet_wrap(~estado_civil, ncol=2)