3 分類モデル

分類モデルとは,目的変数が離散的な場合を指す.最もシンプルなものは\(y_i \in \{ 1,0 \}, i=1,2\ldots,n\)というケースである. 二値以上のケースも考えられ,例えば\(k\)個の分類を扱う場合は目的変数として\(y_i \in \{ 0,1,\ldots,k-1 \}\)のように対応させれば良い.

例えば,植物の品種を説明するモデルや,あるウェブサービスに訪れたユーザーが有料プランを登録するかどうかを説明するモデルなどは分類モデルの枠組み考えられるだろう.

モデルの数式については,連続的な回帰モデルと変わらず

\[\begin{align} \boldsymbol y = f(\boldsymbol X^{\top} \boldsymbol\beta) \end{align}\]

という説明変数の関数として表されるが,のちに紹介するように離散の場合はモデルの定義に一工夫が必要になる.