2 GENERALIZIRANI LINEARNI MODEL

  • Prethodno smo pokazali da se svaki model analize varijance može predočiti kao linearni (aditivni) model. Primjerice, jednofaktorska ANOVA je sljedeći model:

\[y_{ij}=\overline{y}+(\overline{y}_j-\overline{y})+(y_{ij}-\overline{y}_j),\] odnosno \[y_{ij}=\mu+\beta_j+\varepsilon_{ij}\]

  • Utjecaj promatranog faktora na zavisnu je varijablu predočen članovima \(\beta_j\)

  • Zajednička je sredina \(\mu\), dok su članovi \(\varepsilon_{ij}\) slučajne greške za svaki \(i=1,2,\cdots,n\) i \(j=1,2,\cdots ,k\)

  • Utječe li značajno promatrani faktor na zavisnu varijablu može se otkriti testiranjem nulte hipoteze

\[H_0:~~\beta_1=\beta_2=\cdots =\beta_k=0\]

  • U slučaju dvofaktorske analize varijance s efektom interakcije model postaje

\[y_{ijm}=\overline{y}+(\overline{y}_j-\overline{y})+(\overline{y}_i-\overline{y})+(\overline{y}_{ij}-\overline{y}_i-\overline{y}_j+\overline{y})+(y_{ijm}-\overline{y}_{ij}),\]

odnosno \[y_{ijm}=\mu+\beta_j+\alpha_i+\delta_{ij}+\varepsilon_{ijm},\] pri čemu je:

\[\begin{align} \mu &=\overline{y} \\ \beta_j &=\overline{y}_j-\overline{y} \\ \alpha_i &=\overline{y}_i-\overline{y} \\ \delta_{ij} &=\overline{y}_{ij}-\overline{y}_i-\overline{y}_j+\overline{y} \\ \varepsilon_{ijm} &=y_{ijm}-\overline{y}_{ij} \end{align}\]

  • Shodno tome mogu se testirati tri nulte hipoteze:

\[\begin{align} (1)~~~H_0:&~~\beta_j=0~~~~~~j=1,2,\cdots, k_1 \\ (2)~~~H_0:&~~\alpha_i=0~~~~~~i=1,2,\cdots, k_2 \\ (3)~~~H_0:&~~\delta_{ij}=0~~~~~~j=1,2,\cdots, k_1,~~~i=1,2,\cdots,k_2 \end{align}\]

  • Drugim riječima, svaki se statistički model može predočiti kao generalizirani linearni model GLM (Generalized Linear Model)

  • GLM omogućuje procjenu različitih modela s obzirom na:

  1. mjerna svojstva zavisne i nezavisne varijable
  2. distribuciju vjerojatnosti zavisne varijable
  3. veznu funkciju između zavisne varijable i linearnog “prediktora”
Tablica 2.1: Specijalni slučajevi generaliziranog linearnog modela GLM
Model Zavisna varijabla Nezavsina varijabla Distribucija zavisne varijable Vezna funkcija
Linearna regresija Numerička (kontinuirana) Numerička (diskretna ili kontinuirana) Normalna Identiteta
ANOVA Numerička (kontinuirana) Kategorijalna (dihotomna ili politomna) Normalna Identiteta
Poissonova regresija Numerička (diskretna) Numerička (diskretna ili kontinuirana) Poissonova Logaritamska
Logistička regresija Kategorijalna (dihotomna) Numerička (diskretna ili kontinuirana) Binomna Logistička