들어가기
Overview
Mixed model 은 데이터 내 관측값들 사이에 dependency 가 있는 경우에 사용하는 유용한 모델링 방법이다. 이 상황에서는 일반적으로 군집(cluster)을 이루고 있는 관측값들 사이에 상관성이 발생한다. 예를 들어, 데이터가, 관측값 단위들로 반복측정한 데이터가 있거나, 단위 관측값들이 서로 그룹을 이루는 경우가 자주 일어난다. (예, 학교에 속한 학생들, 한 지역의 여러 도시들). 이러한 상황을 다루는 법은 여러 방법이 있지만, mixed model 은 매우 일반적이고 강력한 방법이다. 또한, 응용성이 확장되는 다른 통계적 방법들과 밀접한 관계를 이룬다.
Goals
이 문서는 워크샵 교재로도 사용될 것이다. 워크샵 목표는 혼합모형을 사용해야하는 경우를 알게 해주고 이를 구현하는 다양한 표준 기술을 제공하는 것이다. 기술들을 연습하기 위한 과정들이 준비되어 있다.
준비하기
이 문서는 대부분 응용에 대해 다루고, 표준 회귀 모형을 기초적인 이해가 있다는 것만 가정한다. R 을 이용하여 회귀 모델링 복습을 조금은 하겠지만 기본적으로 경험 있는 것을 가정한다. 예제는 대부분 lme4 패키지를 이용해서 이루어 질 것이다.
이 문서에서 아래의 컬러 코딩을 사용한다:
- emphasis
- package
- function
- object/class
- link (with hover underline)
워크샵
워크샵을 하려면 다음 단계를 따르라:
- GitHub 에서 zip 파일을 다운로드한다. 어디에 다운로드 했는지 기억하라.
- Unzip 한다. 어디 위치에 폴더 압축을 푸는지 기억하라.
- RStudio 를 실행한다.
- File/Open Project 하고 방금 생성한 폴더에서 파란 아이콘 (
mixed-models-with-r-workshop-2019.Rproj
) 을 클릭한다. - File/Open File 을 클릭하고, ReadMe 파일을 연 뒤 안에 쓰여 있는 대로 실행한다.
핵심 패키지
이 문서의 코드를 실행하기 위해서 다음 패키지들만 필요할 것이다:
- lme4
- tidyverse (for data processing)
- merTools (optional)
- glmmTMB (optional)
- brms (optional)
- modelr (optional)
- nlme (base R 에 구성됨, 설치 불필요)
mixedup 라고 부르는 커스텀 패키지도 사용하는데 이는 lme4, brms, mgcv, 패키지 등의 mixed model 과 관련된 출력을 더 사용성 있고 출력하기 편하게 만들어 준다. 이제 보게 될 결과물을 많은 부분은 이 패키지로 부터 나왔다.