14.2 Exercícios Aula 2
No exercício da Aula 2 iremos trabalho com o arquivo PessoaRenda do censo 2010.
Existem vários pacotes disponíveis para download de dados do Censo IBGE. Alguns deles são:
Pacote censobr
O pacote censobr permite realizar o download de dados do Censo Brasileiro. Instalamos o pacote e depois carregamos, com a função library().
Vamos baixar dados referentes aos bloco “Pessoa Renda” setores censitários de Belo Horizonte. Primeiramente utilizamos a função read_tracts()
## Reading data cached locally.
Para verificarmos o arquivo de dicionário usamos a seguinte função:
## Reading data cached locally.
## NULL
1-Transformar os dados em dataframe utilizando a função as.data.frame()
2-Filtrar os dados apenas de Belo Horizonte utilizando a função filter. Utilizar o código do município, que pode ser encontrado no link:
3-Criar uma nova tabela, selecionando as seguintes variáveis:
4-Criar quatro novas variáveis, segundo instrução: 1-A primeira variável(Menos3SM) deve ser a soma das variáveis V001, V002,V003, V004. 2-A segunda variável (De3a5SM) é igual à variável V005. 3-A terceira variável, De5a10SM, é igual à variável V006. 4-A última variável, Mais10SM, deve ser a soma das variáveis V007 + V008 + V009.
Vamos criar uma nova tabela com as variáveis:
-Codigo setor censitário
-Menos de 3 salários mínimos (Menos3SM)
-Entre 3 e 5 salários mínimos (De3a5SM)
-Entre 5 e 10 salários mínimos (De5a10SM)
-Mais de 10 salários mínimos (Mais10SM)
Selecionar colunas
14.2.1 Exercício 2
1-Com o dataframe criado acima, criar uma nova variável chamada Total, que corresponda à soma das variáveis Menos3SM, De3a5SM, De5a10SM e Mais10SM
2-Com o dataframe criado acima, criar quatro novas variáveis que representem a porcentagem da população de cada faixa de renda (PMenos3SM, PDe3a5SM, PDe5a10SM, PMaisde10SM). Utilizar a variável “População total” para o cálculo da porcentagem
3-Criar um novo dataframe, selecionando apenas as variáveis criadas no item acima
14.2.2 Exercício 3
1-Criar um novo dataframe, filtrando os setores censitários que tenham, ao mesmo tempo, mais de 50% de pessoas ganhando até 3SM e mais de 20% de pessoas ganhando de 3 a 5SM
2-Criar um novo dataframe, filtrando os setores censitários que tenham ou mais de 20% de pessoas ganhando mais de 10SM ou mais de 40% de pessoas ganhando de 5 a 10SM