2.1 Logistička regresija
Logistička regresija je inačica linearne regresije u kojoj je zavisna varijabla isključivo dihotomna, tj. može poprimiti binarne vrijednosti 0 ili 1
Binarne vrijednosti, pridružene nominalnoj varijabli, označavaju pojavu nekog događaja ili prisutnost nekog atributa
Binarna logistička regresija ne pretpostavlja linearnu zavisnost između zavisne i nezavisnih varijabli
Najmanje jedna nezavisna varijabla je numerička kontinuirana, ostale mogu biti i kategorijalne varijable
Binarna logistička regresija ne pretpostavlja da zavisna varijabla ili greške relacije slijede normalnu distribuciju
Ako se primjerice u model jednostruke (jednostavne) linearne regresije
yi=β0+ β1xi+εi
uvrsti zavisna varijabla y={0, 1} dobiva se
εi=0−β0−β1xiεi=1−β0−β1xi

Slika 2.1: Linearna regresija s zavisnom varijablom yi={0,1}
Procijenjen model ˆyi=−0.59369+0.01062xi daje očekivane vrijednosti manje od nula i veće od jedan
Očekivane bi vrijednosti trebale biti između 0 i 1, pri čemu se interpretiraju kao vjerojatnosti
yi=1 ako je događaj nasupio (uspjeh) s vjerojatnosti pyi=0 ako događaj nije nasupio (neuspjeh) s vjerojatnosti q=(1−p)