14.2 Exercícios Aula 2

No exercício da Aula 2 iremos trabalho com o arquivo PessoaRenda do censo 2010.

Existem vários pacotes disponíveis para download de dados do Censo IBGE. Alguns deles são:

install.packages("censobr")
install.packages("geobr")
install.packages("PNADcIBGE")

Pacote censobr

O pacote censobr permite realizar o download de dados do Censo Brasileiro. Instalamos o pacote e depois carregamos, com a função library().

library(censobr)

Vamos baixar dados referentes aos bloco “Pessoa Renda” setores censitários de Belo Horizonte. Primeiramente utilizamos a função read_tracts()

df <- read_tracts(year = 2010,
                  dataset = 'PessoaRenda',
                  showProgress = FALSE)
## Reading data cached locally.

Para verificarmos o arquivo de dicionário usamos a seguinte função:

data_dictionary(year = 2010, dataset = 'tracts', showProgress = FALSE)
## Reading data cached locally.
## NULL

1-Transformar os dados em dataframe utilizando a função as.data.frame()

2-Filtrar os dados apenas de Belo Horizonte utilizando a função filter. Utilizar o código do município, que pode ser encontrado no link:

3-Criar uma nova tabela, selecionando as seguintes variáveis:

4-Criar quatro novas variáveis, segundo instrução: 1-A primeira variável(Menos3SM) deve ser a soma das variáveis V001, V002,V003, V004. 2-A segunda variável (De3a5SM) é igual à variável V005. 3-A terceira variável, De5a10SM, é igual à variável V006. 4-A última variável, Mais10SM, deve ser a soma das variáveis V007 + V008 + V009.

Vamos criar uma nova tabela com as variáveis:
-Codigo setor censitário
-Menos de 3 salários mínimos (Menos3SM)
-Entre 3 e 5 salários mínimos (De3a5SM)
-Entre 5 e 10 salários mínimos (De5a10SM)
-Mais de 10 salários mínimos (Mais10SM)

Selecionar colunas

bh_f<-df%>%select(code_tract,V001,V002,V003,V004,V005,V006,V007,V008,V009)

14.2.1 Exercício 2

1-Com o dataframe criado acima, criar uma nova variável chamada Total, que corresponda à soma das variáveis Menos3SM, De3a5SM, De5a10SM e Mais10SM

2-Com o dataframe criado acima, criar quatro novas variáveis que representem a porcentagem da população de cada faixa de renda (PMenos3SM, PDe3a5SM, PDe5a10SM, PMaisde10SM). Utilizar a variável “População total” para o cálculo da porcentagem

3-Criar um novo dataframe, selecionando apenas as variáveis criadas no item acima

14.2.2 Exercício 3

1-Criar um novo dataframe, filtrando os setores censitários que tenham, ao mesmo tempo, mais de 50% de pessoas ganhando até 3SM e mais de 20% de pessoas ganhando de 3 a 5SM

2-Criar um novo dataframe, filtrando os setores censitários que tenham ou mais de 20% de pessoas ganhando mais de 10SM ou mais de 40% de pessoas ganhando de 5 a 10SM