Chapter 6 여러 개의 예측변수를 갖는 모형
여러 개의 예측변수를 갖는 모형의 ROC 곡선도 그릴 수 있다.
위의 ROC 곡선은 다음의 glm
객체를 통해 만들어진다.
6.1 자동화된 단계적 회귀
여러 개의 예측변수를 갖는 다중로지스틱회귀모형에서 step() 함수는 AIC 값을 기준으로 자동화된 후향적제거 과정을 통해 최종모형 선택을 도와준다.
Call:
glm(formula = male ~ height, family = binomial, data = radial)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.15418 -0.30022 0.02699 0.25143 2.17328
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -65.38126 12.72530 -5.138 2.78e-07 ***
height 0.40722 0.07918 5.143 2.71e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 158.002 on 113 degrees of freedom
Residual deviance: 63.462 on 112 degrees of freedom
(1 observation deleted due to missingness)
AIC: 67.462
Number of Fisher Scoring iterations: 6
이 경우 다음과 같이 초기모형과 최종모형을 비교할 수 있다.
Analysis of Deviance Table
Model 1: male ~ height
Model 2: male ~ height + weight + age
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 112 63.462
2 110 63.352 2 0.11025 0.9464
step_ROC함수는 위와 같은 단계적회귀를 통해 초기모형과 최종모형을 만들고 두 모형의 ROC 곡선을 그려주고 두 모형 의 AUC 값을 비교해준다.
step_ROC함수의 plot인수를 FALSE로 설정하면 ANOVA 테이블을 출력해준다.
Analysis of Deviance Table
Model 1: male ~ height
Model 2: male ~ weight + height + age
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 112 63.462
2 110 63.352 2 0.11025 0.9464