5.1 Dataset de ANUIES
Leemos el dataset de la Asociación Nacional de Universidades e Instituciones de Educación Superior y cambiamos las variables de id a caracteres.
anuies <- vroom("data/anuies.tsv")
anuies <- anuies %>%
mutate(municipality_id = as.character(municipality_id),
state_id = as.character(state_id))
anuies <- anuies %>%
dplyr::mutate(state = replace(state, state == "Michoacán de Ocampo", "Michoacán"),
state = replace(state, state == "Veracruz de Ignacio de la Llave", "Veracruz"),
state = replace(state, state == "Coahuila de Zaragoza", "Coahuila"))5.1.1 Obtener el número de instituciones de educación superior en cada municipio
anuies_by_mun <- anuies %>%
dplyr::select(municipality_id, municipality, state, institution) %>%
## El dataset también contiene áreas del conocimiento y otras variables, por lo que
## nos aseguramos de contar una sola vez cada institución
dplyr::distinct() %>%
## Agrupamos por variables geográficas y contamos
dplyr::group_by(municipality_id, municipality, state) %>%
## Contamos las instituciones dado el agrupamiento y renombramos
## la variable n
dplyr::tally(name = "total")
head(anuies_by_mun)## # A tibble: 6 × 4
## # Groups: municipality_id, municipality [6]
## municipality_id municipality state total
## <chr> <chr> <chr> <int>
## 1 10001 Canatlán Durango 2
## 2 10004 Cuencamé Durango 1
## 3 10005 Durango Durango 48
## 4 10007 Gómez Palacio Durango 15
## 5 10008 Guadalupe Victoria Durango 2
## 6 1001 Aguascalientes Aguascalientes 51
vroom_write(anuies_by_mun, "data/anuies_by_mun.tsv")5.1.2 Obtener el número de instituciones de educación superior en cada municipio por grado académico
anuies_by_mun_degree <- anuies %>%
dplyr::select(municipality_id, municipality, state, academic_degree, institution) %>%
## Contamos una sola vez cada institución por grado académico
dplyr::distinct() %>%
dplyr::group_by(municipality_id, municipality, state, academic_degree) %>%
## Contamos las instituciones dado el agrupamiento.
dplyr::tally(name = "total")
head(anuies_by_mun_degree)## # A tibble: 6 × 5
## # Groups: municipality_id, municipality, state [3]
## municipality_id municipality state academic_degree total
## <chr> <chr> <chr> <chr> <int>
## 1 10001 Canatlán Durango Licenciatura 1
## 2 10001 Canatlán Durango Maestría 1
## 3 10001 Canatlán Durango Normal de Licenciatura 1
## 4 10004 Cuencamé Durango Licenciatura 1
## 5 10005 Durango Durango Doctorado 12
## 6 10005 Durango Durango Especialidad 9
vroom_write(anuies_by_mun_degree, "data/anuies_by_mun_degree.tsv")5.1.3 Obtener el número de estudiantes de educación superior en cada municipio por grado académico y sexo
estud_by_mun_sexo <- anuies %>%
dplyr::select(municipality_id, municipality, state, academic_degree, sex, students) %>%
## Hacemos un summary, para sumar el número de estudiantes
## agrupando por las variables geográficas, el grado académico y sexo
dplyr::group_by(municipality_id, municipality, state, academic_degree, sex) %>%
dplyr::summarise(estudiantes = sum(students)) ## `summarise()` has grouped output by 'municipality_id',
## 'municipality', 'state', 'academic_degree'. You can override
## using the `.groups` argument.
head(estud_by_mun_sexo)## # A tibble: 6 × 6
## # Groups: municipality_id, municipality, state,
## # academic_degree [4]
## municipality_id municipality state academic_degree sex estudiantes
## <chr> <chr> <chr> <chr> <chr> <dbl>
## 1 10001 Canatlán Durango Licenciatura Hombre 138
## 2 10001 Canatlán Durango Licenciatura Mujer 157
## 3 10001 Canatlán Durango Maestría Hombre 115
## 4 10001 Canatlán Durango Maestría Mujer 158
## 5 10001 Canatlán Durango Normal de Licenciatura Hombre 1905
## 6 10004 Cuencamé Durango Licenciatura Hombre 1638
vroom_write(estud_by_mun_sexo, "data/estud_by_mun_sexo.tsv")