B Lista de comandos útiles

Nota: Varios de estos comandos pertenecen a tidyverse, por lo que se asume que se ha instalado y cargado tidyverse.

Generales

Comando	Descripción	Ejemplo
`install.packages()`	Instalar paquete (es necesario hacer sólo una vez y en la Consola)	`install.packages("tidyverse")`
`library()`	Cargar paquete	`library(tidyverse)`
`read_csv()`	Cargar datos en formato .csv (separado por comas)	`read_csv("carpeta/misdatos.csv")`
`read_excel()`	Cargar datos desde un archivo Excel (requiere cargar paquete `readxl`)	`read_excel("misdatos.xlsx", sheet = "Hoja1")`
`glimpse()`	Entrega un resumen de un data frame (variables y observaciones)	`glimpse(mpg)`
`$`	Seleccionar una variable de un data frame	`dataframe$edad`
`table()`	Generar una tabla de frecuencia para la(s) variable(s)	`table(dataframe$comuna, dataframe$carrera)`

Manipulación de datos con tidyverse

Nota: Varios de estos comandos se usan con el operador “pipe” (%>%), en los ejemplos usamos df como nombre del data frame sobre el cual se aplica la función.

Comando	Descripción	Ejemplo
`filter()`	Seleccionar (filtrar) observaciones (filas) de un data frame	`df %>% filter(edad >= 18 & comuna == "Concon")`
`select()`	Seleccionar variables (columnas) de un data frame	`df %>% select(edad, comuna, carrera)`
	Al usar `select()` con `-` se seleccionan todas las variables, excepto las indicadas	`df %>% select(-comuna)`
`rename()`	Renombrar variables de un data frame	`df %>% rename(edad = edad.del.individuo)`
`mutate()`	Modificar variables y entregar el resultado en otra variable	`df %>% mutate(ptos.totales = ptos.local + ptos.visita)`
`summarise()`	Generar alguna estadística a partir de las variables del data frame (reducir varios valores a uno solo)	`df %>% summarise(edad.promedio = mean(edad))`
`group_by()`	Agrupar las observaciones según una o más variables para luego calcular alguna estadística por grupo	`df %>% group_by(carrera) %>% summarise(edad.promedio = mean(edad))`
`arrange()`	Reordenar observaciones según una o más variables (usar `-` para orden descendiente)	`df %>% arrange(edad, -ingresos)`
`drop_na()`	Remover filas con valores faltantes	`df %>% drop_na()`

Análisis de correlación

Nota: Varios de estos comandos se aplican sólo a variables cuantitativas, en los ejemplos se asume que df es un dataframe sólo con variables cuantitativas. Además se sume que no hay valores faltantes.

Para comandos que requieren la librería corrr, esta se debe instalar y luego cargar con library(corrr).

Comando	Descripción	Ejemplo
`pairs()`	Crear una matriz de gráficos de dispersión para las variables en la base de datos	`df %>% pairs()`
`colpair_map(cov)`	Crea la matriz de covarianza para las variables en la base de datos (requiere la librería `corrr`)	`df %>% colpair_map(cov)`
`colpair_map(cor)`	Crea la matriz de correlación para las variables en la base de datos (requiere la librería `corrr`)	`df %>% colpair_map(cor)`