4 Att jobba i R

På Demoskop arbetar vi i projekt i RStudio. För att skapa ett nytt projekt i R klickar du på file -> New Project och väljer var du vill att ditt projekt ska sparas. Oftast är det i en undermapp till en kundmapp, exempelvis Data, Analys eller öppna svar.

Ibland kan ett projekt i R innehålla flera delar, slumpa ett mindre urval, skapa en ny variabel, bearbeta öppna svar, bygge en regressionsmodell. I de fallen kan det vara enklast att skapa ett nytt projekt under en ny undermapp som heter R.

4.1 Stilguide

I R följer vi en stilguide för hur man skriver kod som finns här: S:-projectstilguide.html.

Det skiljer sig lite från hur vi skriver kod i SAS. Stilguiden finns till för att koden ska bli så enkel som möjligt att läsa. Därför är det i regel många fler mellanrum än i SAS-kod. En anledning till det är att du kan skriva mycket längre kod i R, R är inte känsligt för radbrytningar.

Du behöver inte läsa hela stilguiden, här är några utdrag:

4.1.1 Kommentera kod

En generell regel kring kommentering av kod är att du ska svara på frågan varför du gör något.

Börja med att varför du skrivit koden.

*Skriv #’ i början av kommenteringen, då är du i kommenteringsläge och kan enkelt skriva längre meningar. Observera att mina kommentarer här är utan å ä ö. Det är bara pågrund av paketet jag skriver det här dokumentet med, det funkar utmärkt annars.

#' I programmet importerar jag data fran SPSS for att 
#' slumpa borta respondenter sa att antalet respondenter blir faerre.
#' 
#' Malet aer att urvalet ska bli 1014 intervjuer istaellet foer 1400
#' 
#' Av: Filip Wastberg
#' Datum: 2017-12-21

data <- read_sas("kund0001_data_01.sb7dat")

data <- sample_n(data, size = 1014, weight = vikt)

write_sas(data, "kund0001_data_01_mindre.sb7dat")

*Varför använder vi ens programmering för data-analys? Varför inte göra allting i Excel eller någon annanstans? Visst, vi skulle kunna göra så, och gör nog så i ganska stor utsträckning idag, men det är inte utan baksidor. Att lista ut hur någon gjort en analys eller databearbetning i Excel är ofta en gissningslek om hur personen som gjort analysen tänkt. Det gäller även när det är du själva som gjort analysen (och försöker gissa hur du gjorde den för ett år sedan).

Målet med kod i R är att den ska vara enkel att läsa och det ska vara lätt för läsaren av koden att förstå hur analysen gått till även om det bara är du själv som gjort analysen. Därför är det viktigt att man kommenterar koden man skriver.*

4.1.2 Väldigt långa meningar

Ibland har man väldigt långa funktioner eller meningar. Försök generellt att hålla dina meningar, oavsett om det är kommentarer eller faktiskt kod till kortare än 80 tecken inklusive blanksteg. Du ser hur många tecken du skrivit nere till vänster i kodeditorn.

Det här dåligt.

do_something_very_complicated("that", requires, many, arguments, "some of which may be long")

Det här är bra.

do_something_very_complicated(
  "that",
  requires = many,
  arguments = "some of which may be long"
)