Poglavlje 1 Uvod

NAPOMENA: Tekst je u izradi (nije lektoriran i provjeren, nisu povezani svi literaturni navodi!)

Knjiga je namijenjena svima koji žele naučiti modele obrade i prikaza podataka pomoću R jezika koristeći aplikaciju RStudio. Knjiga nije samo vodič kroz R jezik i RStudio aplikaciju, već koristi brojne izvore informacija te usporedbe različitih metoda koje se koriste u društvenim, humanističkim i biomedicinskim znanostima. Tako, ovdje možemo pronaći usporedbe različitih eksplanatornih i konfirmatornih metoda s brojnim referencijama te modeliranje (SEM). Ovo djelo nije samo vodič, priručnik ili udžbenik već ima i karateristike znanstvene monografije.

Ova knjiga u elektroničkom formatu u cijelosti je napravljena pomoću bookdown paketa i Markdown sintaksnog jezika u RStudio sučelju. Takav pristup omogućava dinamičku izmjenu e-knjige jer jezik R je toliko raširen da vjerojatno nitko ne može sa sigurnosti reći koliko je trenutno aktivnih i novih ‘paketa’ u izradi. R je jezik otvorenog koda (open source) a također i aplikacija RStudio te su u kombinaciji vrlo moćan alat za obradu i prikaz rezultata istraživanja. Riječ paket je prijevod riječi package a označava dio aplikacije, programa (eng. software) koji radi određenu funkciju/-e ili statističku metodu ili jednostavno točno određeni prikaz tablica ili slika u okviru jezika R i aplikacije RStudio.

R kao objektni jezik u kombinaciji s Markdown opisnim jezikom pruža bezbroj mogućnosti. R i RStudio omogućavaju studentima i nastavnicima besplatno korištenje za potrebe obrazovanja, istraživanja i publiciranja. Uz poznavanje R jezika, korištenje vrlo jednostavnog Markdown opisnog jezika, moguće je vrlo elegantno pisanje knjiga, priprema prezentacija, pisanje radova i oblikovanje različitih priručnika. R i RStudio vrlo elegantno komuniciraju s Pandoc sustavom i Latexom.

R jezik zajedno s markdown sintaksnim jezikom jako je produktivan spoj literatnog programiranja (Knuth, 1984). U okviru RStudio aplikacije, Yihui Xie je s paketom knitr objedinio mogućnost korištenja nekoliko jezika u okviru markdown sintakse (Markdown, LaTeX, HTML, AsciiDoc, reStructuredText i Textile) (Allaire & Iannone, 2019; Xie, 2015, 2016, 2019).

Raditi obradu podataka i prikaz rezultata istraživanja u R jeziku, znači i promjenu razmišljanja, kognitivnog ustroja kojeg stječemo ili smo stekli uporabom uobičajenih vizualnih aplikacija koje nude određene izbornike i načine obrade i prikaza podataka. R omogućava potpunu kontrolu nad podacima i traži od korisnika razumijevanje procesa kroz koje prolazi a što znači i kvalitetnije usvajanje gradiva. Rad u aplikaciji koja podržava R, kao što je RStudio, ne ograničava korisnika već postojećim vizualnim rješenjima, već potiče kreativnost, učenje i alternativne pristupe u rješenju nekog istraživačkog problema. R paketi se objaljuju gotovo neposredno kada se razvije i metoda a što je gotovo nemoguće u komercijalnim aplikacijama.

1.1 R i RStudio

U praksi se danas najčešće koriste statistički paketi:

Ukoliko se želi koristiti R tada treba na računalu instalirati prvo R jezik a zatim i aplikaciju koja će upravljati s jezikom, kao što je npr. RStudio. R jezik ima i svoj časopis The R Journal.

R studio kao i druge aplikacije koje rade s R jezikom koriste paketni način funkcioniranja. Središnje mjesto lokacije paketa nalazi se na CRAN stranici gdje ima više od 12 000 paketa. Uz svaki paket ide i priručnik u pdf formatu u kojem su objašnjene funkcije paketa.

Instaliranje paketa u RStudio aplikaciji može se obaviti na dva načina, pomoću konzole u RStudio aplikaciji (naredbenom retku) ili iz padajućeg izbornika Tools - Install Packages. Dovoljno je pronaći paket na mreži i upisati njegovo ime koristeći jedan od dva predložena načina. Tako npr. sučelje ili paket bookdown za izradu ove e-knjige može se instalirati na slijedeći način u terminalu:

devtools::install_github("rstudio/bookdown")

Službene statističke simbole možemo pogledati na mrežnim stranicama .

U Hrvatskoj također postoji udruženje statističara koje je također dio svjetskog udruženja.

1.2 R u različitim znanostima

U području društvenih znanosti postoji jako puno paketa (library) s namjenom upravo u društvenim znanostima CRAN Task View: Statistics for the Social Sciences. Tu možemo vidjeti teoriju i primjenu Bayesove statistike, ekonometrike i financija, obrade i vizualnih prikaza primjene upitnika, psihometrije, društvenih mreža i dr. Konkretno za područje psihologije, možda najbolje mjesto je Personality Project kojeg je voditelj prof. William Ravelle. U rezličitim poglavljima koristit ćemo funkcije psych paketa koji se razvija od 2005 godine u okviru laboratorija Personality, Motivation and Cognition pri Odsjeku za psihologiju Northwestern sveučilišta, Department of Psychology at Northwestern University. Navedeni paket koristi funkcije koje se mogu primijeniti u području istraživanja ličnosti, psihometrije i drugih područja.

U području biomedicine ima niz primjera uporabe R jezika i paketa. Jednostavan prikaz specifičnosti primjera u području biomedicine obrađuje na mrežnom mjestu Welcome to a Little Book of R for Biomedical Statistics!.

U humanističkim znanostima R vrlo lijepo radi s različitim mrežama, geoprostornim podacima, manipulacijom slikama, analizom jezika i teksta (Arnold & Tilton, 2015). Analiza teksta može se raditi pomoću paketa tm (Feinerer & Hornik, 2020), wordcloud (Fellows, 2018), wordcloud2 (Lang & Chien, 2018). Jednostavnim pozivom paketa wordcloud2 i učitavanjem datoteke s podacima dobivamo zanimljiv slikovni prikaz kvalitativne analize s pripadajućim frekvencijama. Frekvencije tj. učestalosti pojavljivanja pojedine riječi dobivamo prijelazom pokazivača preko pojedine riječi.

1.3 Gdje učiti i naći primjere o R-u

Osim prethodno navedenih poveznica na službenim stranicama R-jezika i RStudio sučelja, postoje i drugi izvor. Mrežni resursi danas pružaju izniman i raznovrstan izvor informacija, tečajeva, knjiga i primjera uporabe R jezika u praksi. Na poznatoj edukacijskoj platformi Coursera postoji niz online edukacija s poznatih sveučilišta u svijetu kao što je Duke University i dr. Dovoljno je u tražilicu upisati R statistics i dobivamo popis trenutno aktivnih predavanja i tečajeva iz primjene statistike u R-u. Na [GitHub]{https://github.com/rstudio-education/rstats-ed/blob/master/README.md} platformi postavljen je paket rstats-ed koji objedinjuje različite izvore edukacija.

References

Allaire, Y. X., JJ, & Iannone, R. (2019). Rmarkdown: Dynamic Documents for R. https://github.com/rstudio/rmarkdown
Arnold, T., & Tilton, L. (2015). Humanities Data in R: Exploring Networks, Geospatial Data, Images, and Text. Springer International Publishing. //www.springer.com/us/book/9783319207018
Feinerer, I., & Hornik, K. (2020). Tm: Text mining package. http://tm.r-forge.r-project.org/
Fellows, I. (2018). Wordcloud: Word clouds. https://CRAN.R-project.org/package=wordcloud
Knuth, D. E. (1984). Literate Programming. The Computer Journal, 27(2), 97–111. https://doi.org/10.1093/comjnl/27.2.97
Lang, D., & Chien, G. (2018). wordcloud2: Create word cloud by htmlwidget. https://github.com/lchiffon/wordcloud2
Xie, Y. (2015). Dynamic documents with R and knitr (2nd ed.). Chapman; Hall/CRC. http://yihui.name/knitr/
Xie, Y. (2016). Bookdown: Authoring Books and Technical Documents with R Markdown. Chapman; Hall/CRC. https://github.com/rstudio/bookdown
Xie, Y. (2019). Knitr: A General-Purpose Package for Dynamic Report Generation in R. https://yihui.org/knitr/