14.9 Exercícios Aula 9
14.9.1 Exercício 1
No exercício 1, nosso objetivo é criar um gráfico de barras mostrando a evolução de viagens por tipo de 2020 a 2021 (dados da PNAD). No dataframe turismo.csv, extraído do sistema SIDRA (https://sidra.ibge.gov.br/pesquisa/pnadca/tabelas), temos os dados de viagens em uma tabela de contingência. No entanto, o pacote ggplot2 exige que os dados estejam no formato longo para conseguir visualizar as informações sob forma de gráfico.
1-Baixar o arquivo turismo.csv no drive e carregá-lo no R
2-Transformar a tabela para formato longer usando o tidyr. Manter a variável ano e criar as variáveis “Natureza” (da viagem) e “Total”
3-Transformar a variável Ano em character
4-Renomear as categorias da variável “Natureza”, removendo os pontos e dando espaços. Exemplo: “Cultura.e.gastronomia” vira “Cultura e gastronomia”
5-Plotar um gráfico de barras empilhado, semelhante à imagem abaixo
14.9.2 Exercício 3
No exercício 3, criaremos uma tabela a partir de dados da Pesquisa de Origem e Destino de Belo Horizonte, cruzando informações sobre a estrutura familiar, sexo e idade.
Para isso, baixar o arquivo Idosos.xlsx no drive.
1-Carregar o arquivo Idosos.xlsx
2-Criar um novo dataframe, selecionando as colunas UDM, Sexo e Idade
3-Usar o dplyr para criar uma tabela: 1- que agrupe as variáveis UDM e Sexo (group_by) 2- que crie uma nova variável através do cálculo da média da variável Idade (summarize). Salvar a nova tabela como um dataframe
4-Transformar a tabela criada no item 3 em formato wider, usando os nomes (names_from) da variável UDM e valores (values_from) da variável Média de Idade
5-Visualizar a tabela acima com o gt
14.9.3 Exercício 4
No exercício 3 transformaremos dados sobre as chegadas de turistas internacionais no Brasil em formato wider.
Acessar o site: https://dados.gov.br/dados/conjuntos-dados/estimativas-de-chegadas-de-turistas-internacionais-ao-brasil
Procurar “Chegada de Turistas Internacionais - 2023” e clicar em Acessar recurso
1-Carregar o arquivo csv chegadas_2023
2-Criar um novo dataframe, selecionando as colunas “Continente”, “Mês” e “Chegadas”
3-Criar uma nova tabela com o dplyr, agrupando Continente e Mês e criando uma nova variável “Total” com a soma dos valores da variável Chegadas. Salvar a nova tabela em um novo dataframe.
4-Transformar a tabela do exercício 3 em formato wider, usando os nomes (names_from) da variável Continente e valores (values_from) da variável Total
5-Representar a tabela com o pacote gt()