Chapter 9 Aula 8
9.0.1 Gráficos de linhas
Para construir gráficos de linhas com o ggplot utilizamos a função geom_line()
Vamos utilizar uma base de dados babynames para construir um gráfico mostrando a evolução da popularidade de três nomes nos EUA, de 1880 a 2015.Este pacote de dados está disponível para instalar no CRAN do R, com o nome de “babynames”.
Devido à enorme extensão da base, filtramos apenas os nomes “Amanda”, “Emma” e “Taylor”, mantendo, também, apenas os nomes femininos.
Utilizamos o argumento year (ano) no eixo x, o argumento n (contagem de bebês) no eixo y. Além disso, agrupamos e colorimos as linhas a partir da variável nome, com os comandos group e color.
9.0.2 Histogramas e densidade
Para construir histogramas, utilizamos a função geom_histogram(). Para isso precisamos de uma variável quantitativa.
Vamos montar um histograma da idade dos indivíduos da nossa base de dados.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Para definir o tamanho de cada intervalo, podemos utilizar o argumento bindwidth.
Gráfico de densidade
Podemos, também, criar gráficos de densidade no lugar do histograma. Nesse caso, utilizamos a função geom_density(). O comando alpha indica a transparência do preenchimento do gráfico.
9.0.3 Boxplot
Boxplots também são úteis para estudarmos a distribuição de uma variável, principalmente quando queremos comparar várias distribuições.
Para construir um boxplot no ggplot, utilizamos a função geom_boxplot(). Ele precisa dos atributos x e y, sendo que no atributo x devemos mapear uma variável categórica.
Façamos um boxplot cruzando o estado civil e idade.
9.0.4 Gráfico de calor
O gráfico de calor é utilizado para representar duas variáveis qualitativas e uma variável quantitativa.
Digamos que queremos cruzar estado civil, idade por grupos e o valor do empréstimo. Teremos a seguinte grafia: