7 Kreiranje varijabli

Iako će se najčešće koristiti varijable iz učitanog podatkovnog okvira, korisno je znati da se varijable mogu i izraditi pridruživanjem vrijednosti. Na primjer, ako se želi kreirati varijabla a koja sadrži vrijednost 1, to je moguće napraviti na sljedeći način:

a <- 1
a
## [1] 1

Iako je kreiranje varijabli korisno, podatke je češće nužno i važnije definirati s obzirom na njihovu strukturu. Sjetite se i napomene kod programskih paketa, često će programski paketi iziskivati točno određen tip i strukturu podataka.

No, varijable će češće sadržavati više opažanja, to jest podataka. Onda to može izgledati ovako:

a <- c(1, 2, 3, 4, 5)
a
## [1] 1 2 3 4 5

Kreiranje varijabli je temeljna operacija u R-u koja omogućava pohranu podataka za kasniju upotrebu. Međutim, postoji nekoliko uobičajenih grešaka koje korisnici čine prilikom kreiranja varijabli:

  • Upotreba nedozvoljenih znakova u imenima varijabli: R ne dopušta upotrebu određenih znakova u imenima varijabli, kao što su razmaci i znakovi interpunkcije (npr. !, ?, #, %, &). Osim toga, prvi znak ne može biti broj. Greška u korištenju ovih znakova može dovesti do sintaktičkih grešaka.

  • Prepisivanje ugrađenih funkcija: Ako korisnik dodjeljuje varijabli naziv koji je već rezerviran za neku od R-ovih ugrađenih funkcija (npr. c, mean, sum), to može dovesti do neočekivanih rezultata ili grešaka u izvođenju koda. Uvijek je dobro provjeriti koristi li se ime koje je već rezervirano.

  • Varijable koje nisu prethodno inicijalizirane: Pristup varijablama koje nisu prethodno inicijalizirane ili definirane rezultira greškom. Pokušaj pristupa varijabli koja nije definirana generira poruku o grešci.

  • Nejasna namjena varijabli zbog lošeg imenovanja: Iako ne generira tehničku pogrešku, loše imenovanje varijabli (npr. korištenje imena poput x, temp, ili var1) može otežati razumijevanje koda. Takav će se pristup koristiti samo za pomoćne izračune koje korisnik nema namjeru ponavljati. Dobra je praksa koristiti opisne nazive koji jasno odražavaju namjenu varijable.

  • Neispravno pretpostavljena tipizacija: Ponekad korisnici nenamjerno kreiraju pogrešan tip podatka varijable. Na primjer, pridruživanjem brojevnih vrijednosti navodnicima (a <- “1”) varijabla a postaje znakovni niz umjesto numeričke vrijednosti. To može dovesti do naknadnih grešaka u matematičkim operacijama i analizi podataka.

  • Upotreba neodgovarajućeg pridruživanja: Iako su <- i = u većini slučajeva zamjenjivi pri pridruživanju vrijednosti, postoje situacije gdje je poželjno koristiti jedno umjesto drugog. Na primjer, <- se tradicionalno koristi za pridruživanje varijabli u globalnom prostoru imena, dok se = često koristi unutar funkcija za specifikaciju argumenata.

  • Pogreška u vektorizaciji: Pri pridruživanju više vrijednosti varijabli bez korištenja funkcije c() može doći do greške. Ispravan način za kreiranje vektora je upotreba funkcije c(), kao što je prikazano u primjeru. To nas ujedno vodi do sljedeće teme i kreiranja vektora.