2 GENERALIZIRANI LINEARNI MODEL
- Prethodno smo pokazali da se svaki model analize varijance može predočiti kao linearni (aditivni) model. Primjerice, jednofaktorska ANOVA je sljedeći model:
\[y_{ij}=\overline{y}+(\overline{y}_j-\overline{y})+(y_{ij}-\overline{y}_j),\] odnosno \[y_{ij}=\mu+\beta_j+\varepsilon_{ij}\]
Utjecaj promatranog faktora na zavisnu je varijablu predočen članovima \(\beta_j\)
Zajednička je sredina \(\mu\), dok su članovi \(\varepsilon_{ij}\) slučajne greške za svaki \(i=1,2,\cdots,n\) i \(j=1,2,\cdots ,k\)
Utječe li značajno promatrani faktor na zavisnu varijablu može se otkriti testiranjem nulte hipoteze
\[H_0:~~\beta_1=\beta_2=\cdots =\beta_k=0\]
- U slučaju dvofaktorske analize varijance s efektom interakcije model postaje
\[y_{ijm}=\overline{y}+(\overline{y}_j-\overline{y})+(\overline{y}_i-\overline{y})+(\overline{y}_{ij}-\overline{y}_i-\overline{y}_j+\overline{y})+(y_{ijm}-\overline{y}_{ij}),\]
odnosno \[y_{ijm}=\mu+\beta_j+\alpha_i+\delta_{ij}+\varepsilon_{ijm},\] pri čemu je:
\[\begin{align} \mu &=\overline{y} \\ \beta_j &=\overline{y}_j-\overline{y} \\ \alpha_i &=\overline{y}_i-\overline{y} \\ \delta_{ij} &=\overline{y}_{ij}-\overline{y}_i-\overline{y}_j+\overline{y} \\ \varepsilon_{ijm} &=y_{ijm}-\overline{y}_{ij} \end{align}\]
- Shodno tome mogu se testirati tri nulte hipoteze:
\[\begin{align} (1)~~~H_0:&~~\beta_j=0~~~~~~j=1,2,\cdots, k_1 \\ (2)~~~H_0:&~~\alpha_i=0~~~~~~i=1,2,\cdots, k_2 \\ (3)~~~H_0:&~~\delta_{ij}=0~~~~~~j=1,2,\cdots, k_1,~~~i=1,2,\cdots,k_2 \end{align}\]
Drugim riječima, svaki se statistički model može predočiti kao generalizirani linearni model GLM (Generalized Linear Model)
GLM omogućuje procjenu različitih modela s obzirom na:
- mjerna svojstva zavisne i nezavisne varijable
- distribuciju vjerojatnosti zavisne varijable
- veznu funkciju između zavisne varijable i linearnog “prediktora”
Model | Zavisna varijabla | Nezavsina varijabla | Distribucija zavisne varijable | Vezna funkcija |
---|---|---|---|---|
Linearna regresija | Numerička (kontinuirana) | Numerička (diskretna ili kontinuirana) | Normalna | Identiteta |
ANOVA | Numerička (kontinuirana) | Kategorijalna (dihotomna ili politomna) | Normalna | Identiteta |
Poissonova regresija | Numerička (diskretna) | Numerička (diskretna ili kontinuirana) | Poissonova | Logaritamska |
Logistička regresija | Kategorijalna (dihotomna) | Numerička (diskretna ili kontinuirana) | Binomna | Logistička |