1 PRELIMINARES
1.1 Introducción
R es un ambiente y un lenguaje de programación de fuente abierta, con grandes capacidades estadísticas y gráficas.
La primera versión de R fue escrita en Nueva Zelanda por Ross Ihaka y Robert Gentleman. Los desarrollos actuales son coordinados por un grupo de programadores que se denomina el Grupo Nuclear de Desarrollo de R (The R Development Core Team).
En adición a su potencia, la característica que ha posicionado a R como el software estadístico de mayor popularidad es la de haberse mantenido gratuito y encontrarse en constante crecimiento a través de las aportaciones recibidas por especialistas en diferentes ámbitos del conocimiento y personas entusiastas alrededor de todo el mundo.
Un buen punto de partida para iniciarse con R (instalación y actualizaciones) es la página del proyecto R. Allí puede accederse a información básica y documentación, así como a la Red Exhaustiva de Archivos de R (CRAN: The Comprehensive R Archive Network), desde donde pueden bajarse tanto los instaladores del programa, como sus extensiones (paquetes). Desde la página del proyecto, al hacer clic en el vínculo CRAN, se direcciona a una página desde donde puede elegirse el servidor (mirror) más conveniente. Cada servidor cuenta con una copia de todos los archivos. El servidor de nuestro País se encuentra en la Universidad ICESI.
1.2 Instalación
Los instaladores de R pueden obtenerse desde cualquiera de los servidores de la CRAN (por ejemplo el de Microsoft). Allí, se elige inicialmente el sistema operativo. En el caso de Windows, se ingresa al subdirectorio “base”, desde donde podrá descargarse el instalador.
1.3 Ejecución de R
La primera vez que se instala R en un equipo, se crea una carpeta llamada “R”, localizada en el directorio que usa el sistema operativo para alojar los programas (en Windows, es usual que los programas se instalen dentro de “Program files” o “Archivos de Programa”); dentro de esta carpeta, se crea una subcarpeta para cada versión. Así, si en un equipo se instaló inicialmente la versión 3.0.2, se crea la carpeta “R-3.0.2”; si luego se instala la versión 3.1.1, se creará una nueva carpeta llamada “R-3.1.1” y así sucesivamente, para cada nueva versión. En cada versión, los archivos ejecutables se encuentran dentro de la subcarpeta “bin”. No obstante, el usuario normalmente no tiene que buscar tales carpetas, puesto que el proceso de instalación genera los accesos directos, mediante los cuales se ejecuta el programa, acorde con el sistema operativo.
Aunque existen diversas formas de ejecutar el programa, solamente nos referiremos a dos de estas:
Rgui.exe: El programa se ejecuta en un ambiente básico de ventanas, con una barra de menús en la parte superior. Hoy en día ha caído en desuso, dándole paso a otras interfaces gráficas más funcionales. Para ejecutar el programa de esta manera (al menos por curiosidad) se usa el acceso directo que se crea con la instalación2.
-
RStudio (recomendado): Además de ser una gui, RStudio es una interfaz diseñada para hacer más cómoda y eficaz la labor de programación, extendiendo la potencia y funcionalidades de R. En tal sentido, RStudio es un Entorno de Desarrollo Integrado (ide: Integrated Development Environment). Puede decirse sin temor a errar que RStudio es el ide más popular para R3.
RStudio es la interfaz de trabajo de muchos desarrolladores, así como de usuarios finales de R. También es nuestra interfaz recomendada. En adelante, se dará por sentado que se está ejecutando R a través de RStudio4.
Aunque existen otras interfaces gráficas que buscan ser ‘más amigables con el usuario’, desplegando menús y cajas de diálogo que le permite realizar los análisis más comunes, sin que tenga que entenderse con el código5, no es este el enfoque que pretendemos estimular.
Para fines de citación, debe tenerse presente que, sin importar cuál sea el ide que se utilice, el programa principal mediante el cual se procesan todas las instrucciones siempre es R6. Las interfaces únicamente constituyen enlaces entre R y el usuario7.
Antes de continuar con el estudio de este manual, se recomienda instalar tanto R como RStudio. Obviamente, R, que es el software central, tendrá que estar instalado. No obstante, la interacción del usuario con R se realizará siempre a través de RStudio. Para ejecutar cualquier tarea en R, se abre RStudio, interfaz que carga automáticamente R.
Una vez se abre R —a través de RStudio—, se tiene acceso a la consola, la cual constituye el medio estándar de entrada y salida de texto (información no gráfica). Allí pueden escribirse las instrucciones y allí mismo aparecen las salidas de texto. El símbolo mayor que (>
), denominado prompt o invitación, que aparece en la línea de comandos, indica que el sistema está preparado para recibir información.
En el código que se presenta en este libro se omite el prompt. Esto facilita el seguimiento interactivo a los ejemplos que se presentan, bastando con copiar el código del libro y pegarlo en la consola o en el editor de scripts de RStudio.