Capítulo 5 Trabajo de Sandra
5.1 Bases de datos a usar
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(ggthemes)
library(haven)
5.2 A continuación, se han seleccionado solamente las variables relevantes.
5.3 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2012, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
<- read_sav("data/2012_05_CENACOM02_CAP100.sav")
base2012
<- base2012 %>%
base2012 select(UBIGEO, AT103_A, AT105, AT106_15, AT106_15_CANT, AT108, AT108_1, AT108_2, AT108_3)
<- base2012 %>%
base2012 rename(
AT106_17 = AT106_15,
AT106_17_CANT = AT106_15_CANT
)
<- read_sav("data/2013_04_ATCapitulo100.sav")
base2013
<- base2013 %>%
base2013 select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3)
<- read_sav("data/2014_04_AT_CAP100.SAV")
base2014
<- base2014 %>%
base2014 select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3 )
<- read_sav("data/2015_05_AT_Capitulo_100.sav")
base2015
<- base2015 %>%
base2015 select(UBIGEO, AT103_A, AT105, AT106_17, AT106_17_CANT, AT108, AT108_1, AT108_2, AT108_3 )
<- base2015 %>%
base2015 mutate(AT103_A = as.character(AT103_A))
5.4 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2016, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
<- read_sav("data/2016_A_T_Capitulo 100.sav")
base2016
<- base2016 %>%
base2016 select(UBIGEO, AT103_A, AT105, AT106_16, AT106_16_CANT, AT108, AT108_1, AT108_2, AT108_3 )
<- base2016 %>%
base2016 rename(
AT106_17 = AT106_16,
AT106_17_CANT = AT106_16_CANT
)
5.5 Modificación del nombre de una variable:
En algunos casos, como en la base del año 2017, la variable AT106_17 tenía otro nombre, por un tema de variables adicionales que se incluyeron ese año en la encuesta y que, por ende, cambiaron la numeración secuencial. Es necesario renombrar la variable para poder cruzarla con los demás años.
<- read_sav("data/2017_A_T_Capitulo 100.sav")
base2017
<- base2017 %>%
base2017 select(UBIGEO, AT103_A, AT105, AT106_16, AT106_16_CANT, AT108, AT108_1, AT108_2, AT108_3 )
<- base2017 %>%
base2017 rename(
AT106_17 = AT106_16,
AT106_17_CANT = AT106_16_CANT
)
5.6 Creación de la base general 2012-2017
<- bind_rows(
basegeneral
base2012,
base2013,
base2014,
base2015,
base2016,
base2017 )
5.7 Conversión de las columnas “labelled” a “factor”
<- as_factor(basegeneral) basegeneral
head(basegeneral,20)
## # A tibble: 20 x 9
## UBIGEO AT103_A AT105 AT106_17 AT106_17_CANT AT108 AT108_1 AT108_2 AT108_3
## <chr> <chr> <fct> <fct> <dbl> <fct> <dbl> <dbl> <dbl>
## 1 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 2 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 3 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 4 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 5 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 6 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 7 100601 2011 Colisi… 0 NA No fat… NA 2 1
## 8 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 9 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 10 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 11 100601 2011 Colisi… 0 NA No fat… NA 1 1
## 12 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 13 100601 2011 Colisi… 0 NA No fat… NA 4 0
## 14 100601 2011 Atrope… 0 NA No fat… NA 1 1
## 15 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 16 100601 2011 Colisi… 0 NA Solo d… NA NA 2
## 17 100601 2011 Choque 0 NA Solo d… NA NA 1
## 18 100601 2011 Caída … 0 NA No fat… NA 1 1
## 19 100601 2011 Colisi… 0 NA No fat… NA 2 2
## 20 100601 2011 Despis… 0 NA Solo d… NA NA 1
5.8 Total de accidentes registrados por la PNP, desde 2012 al primer semestre del 2017
<- basegeneral %>%
accidentesgeneral count(AT103_A) %>%
group_by(AT103_A)
5.9 Total de accidentes que involucraron una bicicleta, desde 2012 al primer semestre del 2017
<- basegeneral %>%
accidentesbici filter(AT106_17 == "BICICLETA") %>%
count(AT103_A, AT106_17)%>%
group_by(AT103_A)
5.10 Gráfico del total de accidentes de tránsito que involucraron a una bicicleta, desde 2012 hasta el primer semestre de 2017
<- accidentesbici %>%
accidentesbici ggplot(aes(AT103_A,
n,group = AT106_17)) +
geom_line()
+
accidentesbici theme_clean() +
labs(
title = "Accidentes que involucraron a una bicicleta, desde 2012 hasta el primer semestre de 2017",
subtitle = "Número de accidentes registrados por la PNP",
caption = "Fuente: INEI - Censo Nacional de Comisarías 2012-2017",
x = "Años",
y = "Cantidad de accidentes"
)
5.11 Gráfico del total de accidentes de tránsito, desde 2012 hasta el primer semestre de 2017
<- basegeneral %>%
accidentesgeneral count(AT103_A, AT106_17) %>%
group_by(AT103_A) %>%
ggplot(aes(AT103_A,
n,color = AT106_17,
group = AT106_17)) +
geom_line()
+
accidentesgeneral scale_y_log10()+
theme_clean() +
labs(
title = "Total de accidentes de tránsito, desde 2012 hasta el primer semestre de 2017",
subtitle = "Número de accidentes registrados por la PNP",
caption = "Fuente: INEI - Censo Nacional de Comisarías 2012-2017",
x = "Años",
y = "Cantidad de accidentes"
)