Chapter 2 R and RStudio

Per scaricare R andare sul sito CRAN, comprehensive R archive network.

CRAN è composto da una serie di server mirror distribuiti nel mondo ed è usato per la distribuzione delle versioni del linguaggio R e dei suoi pacchetti. Il mirror migliore per la propria posizione viene scelto automaticamente quando si scarica un pacchetto ma è possibile selezionarne uno a piacimento. Ogni anno viene rilasciata una nuova versione di R (esempio versione 3.5.0 o 3.6.0) ma vengono rilasciate 3 o 4 versioni intermedie con piccole migliorie (esempio versione 3.6.1). Ogni volta che si vuole aggiornare R è necessario scaricare la nuova versione e reinstallare tutti i pacchetti.

Perchè bisogna reinstallare i pacchetti dopo un aggiornamento?

I pacchetti installati non sono altro che file in una cartella sul proprio disco fisso chiamata ‘R-ver’, dove ‘ver’ è uguale al numero che indentifica la versione di R. Se si usa Windows come sistemama operativo solitamente la cartella si trova in documenti (C:/Documents/R/win-library/R-ver). Quando si scarica e installa una nuova versione di R, una nuova cartella viene creata in win-library con il nome della nuova versione. Quest ultima sarà vuota e riandrà popolata con i nuovi pacchetti.

2.1 Che cos’è R?

R non è un programma che si può installare e aprire come Word o Excel ma è un linguaggio di programmazione open-source come C o C++. R può essere usato tramite linee di comando scritte nel linguaggio R, per l’appunto, che vengono interpretate dal proprio computer. Quindi, a differenza dei linguaggi più a basso livello, come C o C++, non deve essere compilato prima di essere eseguito Una volta le righe di comando di R venivano lanciate tramite una finestra del terminale (shell), quelle a sfondo nero con le scritte bianche o verdi per intenderci. Oggi, la stragrande maggioranza degli utenti si interfaccia a R tramite il software RStudio che ne migliora e facilita l’esperienza di utilizzo.

2.2 RStudio

RStudio è un ambiente di sviluppo integrato, o IDE (integrated development environment), per programmare in R. Si può scaricare al link http://www.rstudio.com/download e successivamente installare. Anche RStudio viene aggiornamento di frequente. Si raccomanda la versione successiva alla 1.0.0. Quando si avvia RStudio, una nuova sessione di R viene avviata. La schermata che appare è la seguente:

  • Pannello Output: qui compaiono tutti gli elementi grafici in output (plot, tabelle formattate, ecc…)

  • Pannello Console: qui vanno scritte le righe di comando in R per essere eseguite tramite il tasto Invio.

Esempio: se nella console si digita 1 + 1 e si preme Invio, RStudio mostrerà:

> 1 + 1
[1] 2

L’[1] indica che quello che appare nella console è il primo (e unico in questo caso) elemento dell’output. Alcuni comandi produrranno dei risultati lunghi che verranno mostrati su più linee, in questo caso sarà utile sapere quale elemento dell’output stiamo visualizzando per ricostruire la struttura dell’oggetto in uscita.

Esempio: il risultato del comando 100:130 è una serie di 31 numeri, vale a dire la sequenza di numeri da 100 a 130.

> 100:130
[1] 100 101 102 103 104 105 106 107 108 109 110 111 112
[14] 113 114 115 116 117 118 119 120 121 122 123 124 125
[25] 126 127 128 129 130

Il quattordicesimo elemento dell’output di 100:130 è 113.

L’operatore (x:y) ritorna la sequenza di interi che parte con l’intero x e termina con l’intero y.

R è in grado di capire quando un comando non è terminato. In questo caso, se si preme Invio, comparirà un + nella console indicando che R sta aspettando chi si completi il comando.

Ad esempio:

> 5 -
+
+ 1
[1] 4

Se si digita un comando non riconosciuto da R, questo ritornerà:

> 3 % 5
Error: unexpected input in "3 % 5"

Una volta acquisita una certa manualità nell’utilizzo della console è possibile eseguire delle semplici operazioni matematiche in maniera immediata.

Cominciate a familiarizzare con la console eseguendo delle semplici operazioni matematiche:

  • Scegliete un qualsiasi numero e aggiungere 2.

  • Moltiplicate il risultato per 3.

  • Sottraete 6 al risultato precedente.

  • Infine, dividete per 3.