2.8 Specijalni slučajevi
Podešavanjem postavki
familiy
ilink
unutar naredbeglm()
, osim logističke regresije, mogu se dobiti drugi specijalni slučajeviOpćenito se GLM definira
glm(formula,podaci,familiy=xxx(link="xxx"))
Formula je prvi argument naredbe
glm()
koja se pak definira kao aditivni modely~x+z+...
Podaci (data) su drugi argument koji se odnose na spremnik podataka u kojem se nalaze varijable
y, x, z,...
Treći se argument odnosi na “familiju” slučajnih varijabli, tj. pripadnih distribucija vjerojatnosti, primjerice
gaussian
,binomial
,poisson
,Gamma
, itd.Izbor distribucije vjerojatnosti zahtjeva i odgovarajuću veznu funkciju
link
Uobičajene su ove postavke:
familiy=gaussian(link="identity")
familiy=binomial(link="logit")
familiy=poisson(link="log")
familiy=Gamma(link="inverse")
- Ako je zavisna varijabla kontinuirana, tj. yi može poprimiti bilo koje realne brojeve iz intervala (−∞, +∞), najčešće se pretpostavlja da je normalno distribuirana y∼N(μi , σ2), a vezna funkcija (link) između njene očekivane vrijednosti i linearnog prediktora je identiteta:
g(E(yi)⏟očekivanavrijednost)=β0+β1xi+β2zi+...⏟linearni prediktor+εig(μi)=β0+β1xi+β2zi+...+εiμi=β0+β1xi+β2zi+...+εi
Očekivana vrijednost normalno distribuirane varijable jednaka je parametru μ. Takvih “mi-ova” (sredina) ima n. Kada je vezna funkcija g(⋅) identiteta onda sredine normalno distribuiranih varijabli linearno ovise o prediktorima x, z, ... (model višestruke regresije)
Ako je zavisna varijabla dihotomna yi={0, 1} tada je očekivana vrijednost takve Bernoullijeve varijable jednaka parametru p (interpretira kao vjerojatnost nastupa nekog događaja). Ako se promatra vjerojatnost nastupa nekog događaja u n jedinica tada zavisna varijabla slijedi Binomnu distribuciju, također s vjerojatnosti p. Takvih vjerojatnosti ima n:
g(E(yi)⏟očekivanavrijednost)=β0+β1xi+β2zi+...⏟linearni prediktor+εig(pi)=β0+β1xi+β2zi+...+εilog(pi1−pi)=β0+β1xi+β2zi+...+εi
Potrebna je vezna funkcija koja će vrijednosti linearnog prediktora (−∞, +∞) preslikati u vrijednosti iz intervala [0, 1]. Takva vezna funkcija g(⋅) je logistička funkcija (model binarne logističke regresije).
Ako zavisna kontinuirana varijabla slijedi Gamma distribuciju, tj. yi može poprimiti bilo koje realne brojeve iz intervala (0, +∞), tada je očekivana vrijednost takve varijable jednaka umnošku parametara αγ. Takvih umnožak (sredina) αγ ima n:
g(E(yi)⏟očekivanavrijednost)=β0+β1xi+β2zi+...⏟linearni prediktor+εig(αiγi)=β0+β1xi+β2zi+...+εi1αiγi=β0+β1xi+β2zi+...+εi
- Potrebna je vezna funkcija za preslikavanje iz intervala (−∞, +∞) u interval (0, +∞). Takva vezna funkcija g(⋅) je recipročna odnosno inverzna funkcija.