A Introdución a R
A.1 Ventajas de R
Open Source (gratuito)
Usado por muchos desarrolladores y en muchos trabajos, especialmente aquellos intensivos en “data analysis”
Sustituto perfecto de
Stata
aunque es menos amigableVisualización más flexible que
Stata
Es más eficiente en algunas funcionalidades como uso de datos geográficos
A.2 DataCamp
DataCamp es una plataforma que contiene cursos y contenido para aprender
R
y otros softwares de Data Analysis (ej.Python
)Recibirán una invitación a su correo del ITAM. Tendrán acceso a los cursos por 6 meses. El uso de DataCamp es opcional para el curso.
Al usar DataCamp podrán practicar como programar en
R
y el sistema les da feedback inmediatoPara usarlo no es necesario instalar
R
en su computadora, aunque para las Tareas sí lo necesitarán
A.3 Instalando R
Entrar a
CRAN
e instalarR
siguiendo el link relevante del cuadro que indica “Download and install R”Windows: seguir los links “install R for first time” y “Download R 4.0.2 for Windows. Una vez instalado, regresar a la página donde aparecía el link de “install R for first time” y elige el link que dice “Rtools”. En la nueva página elige “Rtools40.exe” e instala.
Mac: seguir el link “R-4.0.2.pkg” (notarized and signed)
Entrar a
RStudio
. Bajen en la página hasta encontrar la sección “All Installers” y ahí dependiendo si tienen Windows o Mac eligen descargar el archivo “RStudio-1.3.1056.exe
” (Windows) o “RStudio-1.3.1056.dmg
” y siguen las instrucciones de instalación.
En DataCamp hay un tutorial para instalar R
y RStudio
también
A.3.1 R
y RStudio
R
es un lenguaje de programación con enfoque estadístico y matricial.R
ejecuta todas las operaciones que le indicaremos.RStudio
es una interfaz que nos da flexibilidad al realizar distintas tareas. Podemos integrar todo nuestro proceso de trabajo en el mismo ambiente.Para utilizar
RStudio
es necesario descargar primeroR
.
A.3.2 R
Packages
A diferencia de
Stata
,R
no tiene los comandos en menús y su uso si requiere del conocimiento del nombre de los comandos relevantesLos packages representan un conjunto de funciones, datos y comandos de
R
.Para instalar un nuevo package se utiliza el comando
install.packages(‘nombre del package’)
Para utilizar las funciones que incluye dicho package hay que cargarlos en la sesión utilizando el comando
library(package)
Se recomienda que se carguen todos los packages que se utilizaran en la sesión al inicio del script de
R
A.3.3 Abriendo bases de datos
Utilizar el comando
setwd
para indicar el directorio de trabajo donde pondrán la base de datos por abrir (ojo con la dirección de las diagonales “/
”)- Ej.
setwd("C:/Users/aaeag/Microeconometria_aplicada/Bases Stata")
- Ej.
Para abrir bases en formato:
Stata -> utilizamos
library(haven)
-> comandoread_dta(“nombre_archivo”)
CSV -> comando
read.csv(“nombre_archivo”)
Excel -> utilizamos
library(gdata)
-> comandoread.xlsx(“nombre_archivo”)
En el script de ejemplo se muestra como abrimos una base de Stata
Otra alternativa consiste en utilizar la ventana superior derecha, pestaña “Environment
”, botón “Import Dataset
”