5.1 Dataset de ANUIES
Leemos el dataset de la Asociación Nacional de Universidades e Instituciones de Educación Superior y cambiamos las variables de id
a caracteres.
<- vroom("data/anuies.tsv")
anuies <- anuies %>%
anuies mutate(municipality_id = as.character(municipality_id),
state_id = as.character(state_id))
<- anuies %>%
anuies ::mutate(state = replace(state, state == "Michoacán de Ocampo", "Michoacán"),
dplyrstate = replace(state, state == "Veracruz de Ignacio de la Llave", "Veracruz"),
state = replace(state, state == "Coahuila de Zaragoza", "Coahuila"))
5.1.1 Obtener el número de instituciones de educación superior en cada municipio
<- anuies %>%
anuies_by_mun ::select(municipality_id, municipality, state, institution) %>%
dplyr## El dataset también contiene áreas del conocimiento y otras variables, por lo que
## nos aseguramos de contar una sola vez cada institución
::distinct() %>%
dplyr## Agrupamos por variables geográficas y contamos
::group_by(municipality_id, municipality, state) %>%
dplyr## Contamos las instituciones dado el agrupamiento y renombramos
## la variable n
::tally(name = "total")
dplyr
head(anuies_by_mun)
## # A tibble: 6 × 4
## # Groups: municipality_id, municipality [6]
## municipality_id municipality state total
## <chr> <chr> <chr> <int>
## 1 10001 Canatlán Durango 2
## 2 10004 Cuencamé Durango 1
## 3 10005 Durango Durango 48
## 4 10007 Gómez Palacio Durango 15
## 5 10008 Guadalupe Victoria Durango 2
## 6 1001 Aguascalientes Aguascalientes 51
vroom_write(anuies_by_mun, "data/anuies_by_mun.tsv")
5.1.2 Obtener el número de instituciones de educación superior en cada municipio por grado académico
<- anuies %>%
anuies_by_mun_degree ::select(municipality_id, municipality, state, academic_degree, institution) %>%
dplyr## Contamos una sola vez cada institución por grado académico
::distinct() %>%
dplyr::group_by(municipality_id, municipality, state, academic_degree) %>%
dplyr## Contamos las instituciones dado el agrupamiento.
::tally(name = "total")
dplyr
head(anuies_by_mun_degree)
## # A tibble: 6 × 5
## # Groups: municipality_id, municipality, state [3]
## municipality_id municipality state academic_degree total
## <chr> <chr> <chr> <chr> <int>
## 1 10001 Canatlán Durango Licenciatura 1
## 2 10001 Canatlán Durango Maestría 1
## 3 10001 Canatlán Durango Normal de Licenciatura 1
## 4 10004 Cuencamé Durango Licenciatura 1
## 5 10005 Durango Durango Doctorado 12
## 6 10005 Durango Durango Especialidad 9
vroom_write(anuies_by_mun_degree, "data/anuies_by_mun_degree.tsv")
5.1.3 Obtener el número de estudiantes de educación superior en cada municipio por grado académico y sexo
<- anuies %>%
estud_by_mun_sexo ::select(municipality_id, municipality, state, academic_degree, sex, students) %>%
dplyr## Hacemos un summary, para sumar el número de estudiantes
## agrupando por las variables geográficas, el grado académico y sexo
::group_by(municipality_id, municipality, state, academic_degree, sex) %>%
dplyr::summarise(estudiantes = sum(students)) dplyr
## `summarise()` has grouped output by 'municipality_id',
## 'municipality', 'state', 'academic_degree'. You can override
## using the `.groups` argument.
head(estud_by_mun_sexo)
## # A tibble: 6 × 6
## # Groups: municipality_id, municipality, state,
## # academic_degree [4]
## municipality_id municipality state academic_degree sex estudiantes
## <chr> <chr> <chr> <chr> <chr> <dbl>
## 1 10001 Canatlán Durango Licenciatura Hombre 138
## 2 10001 Canatlán Durango Licenciatura Mujer 157
## 3 10001 Canatlán Durango Maestría Hombre 115
## 4 10001 Canatlán Durango Maestría Mujer 158
## 5 10001 Canatlán Durango Normal de Licenciatura Hombre 1905
## 6 10004 Cuencamé Durango Licenciatura Hombre 1638
vroom_write(estud_by_mun_sexo, "data/estud_by_mun_sexo.tsv")