5.1 Dataset de ANUIES

Leemos el dataset de la Asociación Nacional de Universidades e Instituciones de Educación Superior y cambiamos las variables de id a caracteres.

anuies <- vroom("data/anuies.tsv")
anuies <- anuies %>%
  mutate(municipality_id = as.character(municipality_id), 
         state_id = as.character(state_id))

anuies <- anuies %>% 
  dplyr::mutate(state = replace(state, state == "Michoacán de Ocampo", "Michoacán"),
                state = replace(state, state == "Veracruz de Ignacio de la Llave", "Veracruz"),
                state = replace(state, state == "Coahuila de Zaragoza", "Coahuila"))

5.1.1 Obtener el número de instituciones de educación superior en cada municipio

anuies_by_mun <- anuies %>% 
  dplyr::select(municipality_id, municipality, state, institution) %>%
  ## El dataset también contiene áreas del conocimiento y otras variables, por lo que 
  ## nos aseguramos de contar una sola vez cada institución
  dplyr::distinct() %>%
  ## Agrupamos por variables geográficas y contamos
  dplyr::group_by(municipality_id, municipality, state) %>%
  ## Contamos las instituciones dado el agrupamiento y renombramos 
  ## la variable n
  dplyr::tally(name = "total")

head(anuies_by_mun)
## # A tibble: 6 × 4
## # Groups:   municipality_id, municipality [6]
##   municipality_id municipality       state          total
##   <chr>           <chr>              <chr>          <int>
## 1 10001           Canatlán           Durango            2
## 2 10004           Cuencamé           Durango            1
## 3 10005           Durango            Durango           48
## 4 10007           Gómez Palacio      Durango           15
## 5 10008           Guadalupe Victoria Durango            2
## 6 1001            Aguascalientes     Aguascalientes    51
vroom_write(anuies_by_mun, "data/anuies_by_mun.tsv")

5.1.2 Obtener el número de instituciones de educación superior en cada municipio por grado académico

anuies_by_mun_degree <- anuies %>% 
  dplyr::select(municipality_id, municipality, state, academic_degree, institution) %>%
  ## Contamos una sola vez cada institución por grado académico
  dplyr::distinct() %>%
  dplyr::group_by(municipality_id, municipality, state, academic_degree) %>%
  ## Contamos las instituciones dado el agrupamiento. 
  dplyr::tally(name = "total") 

head(anuies_by_mun_degree)
## # A tibble: 6 × 5
## # Groups:   municipality_id, municipality, state [3]
##   municipality_id municipality state   academic_degree        total
##   <chr>           <chr>        <chr>   <chr>                  <int>
## 1 10001           Canatlán     Durango Licenciatura               1
## 2 10001           Canatlán     Durango Maestría                   1
## 3 10001           Canatlán     Durango Normal de Licenciatura     1
## 4 10004           Cuencamé     Durango Licenciatura               1
## 5 10005           Durango      Durango Doctorado                 12
## 6 10005           Durango      Durango Especialidad               9
vroom_write(anuies_by_mun_degree, "data/anuies_by_mun_degree.tsv")

5.1.3 Obtener el número de estudiantes de educación superior en cada municipio por grado académico y sexo

estud_by_mun_sexo <- anuies %>% 
  dplyr::select(municipality_id, municipality, state, academic_degree, sex, students) %>%
  ## Hacemos un summary, para sumar el número de estudiantes
  ## agrupando por las variables geográficas, el grado académico y sexo
  dplyr::group_by(municipality_id, municipality, state, academic_degree, sex) %>%
  dplyr::summarise(estudiantes = sum(students)) 
## `summarise()` has grouped output by 'municipality_id',
## 'municipality', 'state', 'academic_degree'. You can override
## using the `.groups` argument.
head(estud_by_mun_sexo)
## # A tibble: 6 × 6
## # Groups:   municipality_id, municipality, state,
## #   academic_degree [4]
##   municipality_id municipality state   academic_degree        sex    estudiantes
##   <chr>           <chr>        <chr>   <chr>                  <chr>        <dbl>
## 1 10001           Canatlán     Durango Licenciatura           Hombre         138
## 2 10001           Canatlán     Durango Licenciatura           Mujer          157
## 3 10001           Canatlán     Durango Maestría               Hombre         115
## 4 10001           Canatlán     Durango Maestría               Mujer          158
## 5 10001           Canatlán     Durango Normal de Licenciatura Hombre        1905
## 6 10004           Cuencamé     Durango Licenciatura           Hombre        1638
vroom_write(estud_by_mun_sexo, "data/estud_by_mun_sexo.tsv")