Capítulo 5 Trabajo de Sandra
5.1 Bases de datos a usar
library(readxl)
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(haven)5.2 A continuación, se han seleccionado solamente las variables relevantes.
5.3 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2012, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
base2012 <- read_sav("data/2012_05_CENACOM02_CAP100.sav")
base2012 <- base2012 %>%
select(UBIGEO, AT103_A, AT105, AT106_15, AT106_15_CANT, AT108, AT108_1, AT108_2, AT108_3)
base2012 <- base2012 %>%
rename(
AT106_17 = AT106_15,
AT106_17_CANT = AT106_15_CANT
)base2013 <- read_sav("data/2013_04_ATCapitulo100.sav")
base2013 <- base2013 %>%
select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3)base2014 <- read_sav("data/2014_04_AT_CAP100.SAV")
base2014 <- base2014 %>%
select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3 )base2015 <- read_sav("data/2015_05_AT_Capitulo_100.sav")
base2015 <- base2015 %>%
select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3 )
base2015 <- base2015 %>%
mutate(AT103_A = as.character(AT103_A))5.4 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2016, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
base2016 <- read_sav("data/2016_A_T_Capitulo 100.sav")
base2016 <- base2016 %>%
select(UBIGEO, AT103_A, AT105, AT106_16, AT106_16_CANT, AT108, AT108_1, AT108_2, AT108_3 )
base2016 <- base2016 %>%
rename(
AT106_17 = AT106_16,
AT106_17_CANT = AT106_16_CANT
)5.5 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2017, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
base2017 <- read_sav("data/2017_A_T_Capitulo 100.sav")
base2017 <- base2017 %>%
select(UBIGEO, AT103_A, AT105, AT106_16, AT106_16_CANT, AT108, AT108_1, AT108_2, AT108_3 )
base2017 <- base2017 %>%
rename(
AT106_17 = AT106_16,
AT106_17_CANT = AT106_16_CANT
)5.6 Creación de la base general 2012-2017
basegeneral <- bind_rows(
base2012,
base2013,
base2014,
base2015,
base2016,
base2017
)5.7 Conversión de las columnas “labelled” a “factor”
basegeneral <- as_factor(basegeneral)head(basegeneral,20)## # A tibble: 20 x 9
## UBIGEO AT103_A AT105 AT106_17 AT106_17_CANT AT108 AT108_1 AT108_2 AT108_3
## <chr> <chr> <fct> <fct> <dbl> <fct> <dbl> <dbl> <dbl>
## 1 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 2 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 3 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 4 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 5 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 6 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 7 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 8 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 9 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 10 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 11 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 12 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 13 100601 2011 Colisi… 0 NA No fat… NA 4 0
## 14 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 15 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 16 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 17 100601 2011 Choque 0 NA Solo d… NA NA 1
## 18 100601 2011 Caída … 0 NA No fat… NA 1 1
## 19 100601 2011 Colisi… 0 NA No fat… NA 2 2
## 20 100601 2011 Despis… 0 NA Solo d… NA NA 1
5.8 Total de accidentes registrados por la PNP, desde 2012 al primer semestre del 2017
accidentesgeneral <- basegeneral %>%
count(AT103_A) %>%
group_by(AT103_A) 5.9 Total de accidentes que involucraron una bicicleta, desde 2012 al primer semestre del 2017
accidentesbici <- basegeneral %>%
filter(AT106_17 == "BICICLETA") %>%
count(AT103_A, AT106_17)%>%
group_by(AT103_A) 5.10 Gráfico del total de accidentes de tránsito que involucraron a una bicicleta, desde 2012 hasta el primer semestre de 2017
accidentesbici <- accidentesbici %>%
ggplot(aes(AT103_A,
n,
group = AT106_17)) +
geom_line()
accidentesbici +
theme_clean() +
labs(
title = "Accidentes que involucraron a una bicicleta, desde 2012 hasta el primer semestre de 2017",
subtitle = "Número de accidentes registrados por la PNP",
caption = "Fuente: INEI - Censo Nacional de Comisarías 2012-2017",
x = "Años",
y = "Cantidad de accidentes"
)
5.11 Gráfico del total de accidentes de tránsito, desde 2012 hasta el primer semestre de 2017
accidentesgeneral <- basegeneral %>%
count(AT103_A, AT106_17) %>%
group_by(AT103_A) %>%
ggplot(aes(AT103_A,
n,
color = AT106_17,
group = AT106_17)) +
geom_line()
accidentesgeneral +
scale_y_log10()+
theme_clean() +
labs(
title = "Total de accidentes de tránsito, desde 2012 hasta el primer semestre de 2017",
subtitle = "Número de accidentes registrados por la PNP",
caption = "Fuente: INEI - Censo Nacional de Comisarías 2012-2017",
x = "Años",
y = "Cantidad de accidentes"
)