Introducción

Cover image

Este texto es el apunte de R usado en el curso Razonamiento Cuantitativo con Datos (RCD), de la Universidad Adolfo Ibáñez. Este curso tiene como objetivo desarrollar en sus alumnos la capacidad de extraer información a partir de datos; resumir esta información, comunicarla de manera efectiva, y usarla para predecir y tomar decisiones. Esto pasa por desarrollar una forma de pensar, así como por aprender a usar las tecnologías de visualización, análisis y manipulación de datos masivos más importantes en aplicaciones relevantes a la economía y los negocios.

Si bien hay muchas herramientas que permiten visualizar, analizar y manipular datos, R se destaca por ser una opción versátil, poderosa, fácil de usar, ampliamente documentada, y constantemente actualizada. Además, es una opción completamente gratis. Es la herramienta preferida por estadísticos, y es ampliamente usada en el mundo de la tecnología y los negocios.

Este apunte tiene por objetivo introducir al alumno de RCD al uso de R para visualizar, analizar y manipular datos. Para ello, hace fuerte uso de los paquetes que conforman el tidyverse de Wickham et al. El foco de este libro está puesto en usar R como un lenguaje de programación. Más bien, está puesto en usar R como una herramienta para responder preguntas a través de datos, gentilmente incorporando elementos del pensamiento algorítimico cuando necesario.

Este texto no busca ser un compendio exhaustivo de R y de todas las funcionalidades que ofrece. Tampoco pretende ser un texto de estadísticas ni un manual de buenas prácticas para la comunicación de información extraída a partir de datos. Más bien, busca resumir en un solo lugar los métodos de R más indispensables, y ofrecer muchos ejemplos para facilitar el aprendizaje.

Recomendamos al lector interesado en ahondar sus conocimientos los siguienes libros, todos más completos que este texto:

¿Cómo usar este apunte?

En una primera lectura de este apunte, se insta al lector a comenzar por los capítulos 2 y 3 (tablas de datos y visualización de datos), para posteriormente continuar con el capítulo 1 (R base). El texto está redactado para ser leído de esta manera. El lector descubrirá que al leer los capítulos 2 y 3 primeros, el capítulo 1 tendrá mucho más sentido, y las aplicaciones serán mucho más evidentes.