A Introdución a R

A.1 Ventajas de R

  • Open Source (gratuito)

  • Usado por muchos desarrolladores y en muchos trabajos, especialmente aquellos intensivos en “data analysis”

  • Sustituto perfecto de Stata aunque es menos amigable

  • Visualización más flexible que Stata

  • Es más eficiente en algunas funcionalidades como uso de datos geográficos

A.2 DataCamp

  • DataCamp es una plataforma que contiene cursos y contenido para aprender R y otros softwares de Data Analysis (ej. Python)

  • Recibirán una invitación a su correo del ITAM. Tendrán acceso a los cursos por 6 meses. El uso de DataCamp es opcional para el curso.

  • Al usar DataCamp podrán practicar como programar en R y el sistema les da feedback inmediato

  • Para usarlo no es necesario instalar R en su computadora, aunque para las Tareas sí lo necesitarán

A.3 Instalando R

  1. Entrar a CRAN e instalar R siguiendo el link relevante del cuadro que indica “Download and install R”

    • Windows: seguir los links “install R for first time” y “Download R 4.0.2 for Windows. Una vez instalado, regresar a la página donde aparecía el link de “install R for first time” y elige el link que dice “Rtools”. En la nueva página elige “Rtools40.exe” e instala.

    • Mac: seguir el link “R-4.0.2.pkg” (notarized and signed)

  2. Entrar a RStudio. Bajen en la página hasta encontrar la sección “All Installers” y ahí dependiendo si tienen Windows o Mac eligen descargar el archivo “RStudio-1.3.1056.exe” (Windows) o “RStudio-1.3.1056.dmg” y siguen las instrucciones de instalación.

En DataCamp hay un tutorial para instalar R y RStudio también

A.3.1 R y RStudio

  • R es un lenguaje de programación con enfoque estadístico y matricial. R ejecuta todas las operaciones que le indicaremos.

  • RStudio es una interfaz que nos da flexibilidad al realizar distintas tareas. Podemos integrar todo nuestro proceso de trabajo en el mismo ambiente.

  • Para utilizar RStudio es necesario descargar primero R.

Pantalla principal de RStudio

Figure A.1: Pantalla principal de RStudio

A.3.2 R Packages

  • A diferencia de Stata, R no tiene los comandos en menús y su uso si requiere del conocimiento del nombre de los comandos relevantes

  • Los packages representan un conjunto de funciones, datos y comandos de R.

  • Para instalar un nuevo package se utiliza el comando install.packages(‘nombre del package’)

  • Para utilizar las funciones que incluye dicho package hay que cargarlos en la sesión utilizando el comando library(package)

  • Se recomienda que se carguen todos los packages que se utilizaran en la sesión al inicio del script de R

A.3.3 Abriendo bases de datos

  • Utilizar el comando setwd para indicar el directorio de trabajo donde pondrán la base de datos por abrir (ojo con la dirección de las diagonales “/”)

    • Ej. setwd("C:/Users/aaeag/Microeconometria_aplicada/Bases Stata")
  • Para abrir bases en formato:

    • Stata -> utilizamos library(haven) -> comando read_dta(“nombre_archivo”)

    • CSV -> comando read.csv(“nombre_archivo”)

    • Excel -> utilizamos library(gdata) -> comando read.xlsx(“nombre_archivo”)

En el script de ejemplo se muestra como abrimos una base de Stata

Otra alternativa consiste en utilizar la ventana superior derecha, pestaña “Environment”, botón “Import Dataset