2.1 Logistička regresija

  • Logistička regresija je inačica linearne regresije u kojoj je zavisna varijabla isključivo dihotomna, tj. može poprimiti binarne vrijednosti 0 ili 1

  • Binarne vrijednosti, pridružene nominalnoj varijabli, označavaju pojavu nekog događaja ili prisutnost nekog atributa

  • Binarna logistička regresija ne pretpostavlja linearnu zavisnost između zavisne i nezavisnih varijabli

  • Najmanje jedna nezavisna varijabla je numerička kontinuirana, ostale mogu biti i kategorijalne varijable

  • Binarna logistička regresija ne pretpostavlja da zavisna varijabla ili greške relacije slijede normalnu distribuciju

  • Ako se primjerice u model jednostruke (jednostavne) linearne regresije

yi=β0+ β1xi+εi

uvrsti zavisna varijabla y={0, 1} dobiva se

εi=0β0β1xiεi=1β0β1xi

Linearna regresija  s zavisnom varijablom $y_i=\{0,1\}$

Slika 2.1: Linearna regresija s zavisnom varijablom yi={0,1}

  • Procijenjen model ˆyi=0.59369+0.01062xi daje očekivane vrijednosti manje od nula i veće od jedan

  • Očekivane bi vrijednosti trebale biti između 0 i 1, pri čemu se interpretiraju kao vjerojatnosti

yi=1   ako je događaj nasupio (uspjeh) s vjerojatnosti pyi=0   ako događaj nije nasupio (neuspjeh) s vjerojatnosti q=(1p)