Poglavlje 18 Zadaci za vježbu

Zadatke za vježbu pripremio je Ivan Buljan, mag.psych., koji provodi vježbe iz kolegija Statistika.

18.1 Izrada kontingencijske tablice u R-u

Sada cemo napraviti dvije varijable koje prikazuju koliko je osoba koje su uzimale lijek uspjelo/nije uspjelo smanjiti bol (Novi lijek) i koliko je osoba koje su uzimale placebo smanjilo/nije smanjilo bol (PLacebo).

Novi_lijek<- c(35,42)
Placebo<- c(86,44)

Naknadno smo dodali i trecu varijablu, a ona se odnosi na skupinu koja nije dobila nista, te je samo pracena bez da im je propisana ikakva terapija, primjetite, kako vi?e nema tablice 2x2, ve? u svakom redu trebamo dodati jo? jednu vrijednost da bi se napravila tablica 3x3

Novi_lijek<- c(35,42, 15)
Placebo<- c(86,44, 12)
Nista<- c(25, 33, 13)

Koristenjem naredbe cbind smo sve tri varijable “spojili” u jednu tablicu s kojom sad mozemo raditi i usput joj dajemo ime “Tablica”

Tablica <- cbind(Novi_lijek,Placebo, Nista)

Ako zelite provjeriti jeste li dobro napravili tablicu, to mozete napraviti samo unosom imena varijable

Tablica

##      Novi_lijek Placebo Nista
## [1,]         35      86    25
## [2,]         42      44    33
## [3,]         15      12    13

Pomocu ove naredbe (rownames), dajete imena redovima u tablici. primjetite da su imena uvijek napisana sa navodnicima

rownames(Tablica)<- c("Da", "Ne", "Ne znam")

Tablica

##         Novi_lijek Placebo Nista
## Da              35      86    25
## Ne              42      44    33
## Ne znam         15      12    13

Ponekad nam je bitno vidjeti proporcije u tablici koju smo napravili to postizemo naredbom prop.table ovisno o broju koji stavimo ,1 ili ,2 dobijemo raspodjelu proporcija prema redu ili stupcu ako ne stavite broj dobit cete prikaz prporcija u odnosu na ukupan zbroj frekvencija.

prop.table(Tablica, 2)

##         Novi_lijek    Placebo     Nista
## Da       0.3804348 0.60563380 0.3521127
## Ne       0.4565217 0.30985915 0.4647887
## Ne znam  0.1630435 0.08450704 0.1830986

chisq.test(Tablica)

## 
##  Pearson's Chi-squared test
## 
## data:  Tablica
## X-squared = 17.941, df = 4, p-value = 0.001267

Ovom naredbom brisete sve varijable i cistite environment, tako da vam ne smetaju ako zelite napraviti neku novu analizu.

remove(list = ls())

Ovo je formula za hi kvadrat, odnosno provjeru razlike u zastupljenosti izmedu grupa da biste mogli aktivirati ovu naredbu, morate prvo otvoriti stats paket

library(stats)
#chisq.test(Tablica)

Sada slijedi alternativni nacin za izradu tablice koristi se naredba matrix prvo koristenjem funkcije c poredate brojeve frekvencija kako su napisane u tablici pritom pazite da pisete brojeve prema stupcima. Kao primjer, uzet cemo samo varijable Novi_lijek i Placebo, dakle bez Nista

t<- matrix(c(35,86,42,44), ncol=2)
t

##      [,1] [,2]
## [1,]   35   42
## [2,]   86   44

colnames(t)<- c("Novi_lijek", "Placebo")

18.2 T test

Za rad u ovom dijelu treba vam matrica koja se nalazi u repozitoriju, pod naslovom t_test_vjezbe Pohranite ju na svoje računalo i uvezite u R.

#attach(t_test_vjezbe)

Shapiro Wilks test koristimo kada ?elimo provjeriti je li raspodjela rezultata zna?ajno odstupa od normalne, jer je jedano od preduvjet a za t test normalnost distribucije. Kod ovog testa, ako je p<0.05, rezultati nisu normalno distribuirani

#shapiro.test(SNS_SPOSOBNOST)

Ako želimo nacrtati stu istu distribuciju rezultata kao histogram, moramo koristiti naredbu hist

#hist(prosjek, col = "green")
#summary(t_test_vjezbe)

funkcije describe i describe by se nalaze u psych paketu, a služe vam da utvrdite vama va?ne parametre koji vam koriste u daljnoj analizi (mjere centralne tendencije i raspršenja)

#describe(t_test_vjezbe)
#describe.by(prosjek,spol)

Prilikom interpretacije t-testa, moramo obratiti pa?nju na dvije stvari prva se odnosi na p vrijednost (koja je manja od 0.05 ako postoji razlika između skupina) druga je provjeriti obuhva?a li razlika između grupa obuhvača 0 (ako obuhva?a nulu, onda nema razlike). Konaćno, uvijek je dobro pogledati aritmetičke sredine skupina, da se vidi u kojem smjeru ide razlika

#t.test(SNS_SPOSOBNOST~spol)

18.3 T test za zavisne uzorke

U ovom dijelu koristimo istu matricu koja je korištena i kod t testa za nezavisne uzorke za sljedeći zadatak smo uploadali matricu s podatcima iz repozitorija kolegija.

funkcija describe.by se nalazi u sklopu psych paketa i kori?tenjem te naredbe mo?emo vrlo brzo dobiti pregled opisne statistike za neku varijablu prema podgrupama(npr. mlađi-stariji, muško-žensko itd.)

library (psych) describe.by(SNS_PREFERENCIJA, group= Godina)