2 プログラミング問題(10点)
Exercise 2.1 (線形回帰モデル(10点)) ボストンの住宅価格のデータセットについて線形回帰分析を行いたい.以下の設問を進める形で分析を進めよ.
この問題では一貫してmedv
という変数を目的変数とする.
※学習データと評価データを分けずに分析を進めて良い.
準備として以下のコードを実行してBoston
のデータセットをdf
というオブジェクト名で保存しておこう.
- このデータセットについてその構造や要約統計量を概要を述べよ.
- 変数間の関係を調べ,結果を述べよ.
medv
を目的変数としてAICの意味で最も良いモデルを求めよ.- 4で求めたモデルの推定結果などを確認し,考察を述べよ.
Exercise 2.2 (ロジスティック回帰モデル(10点)) 低出生体重のデータセットについて2値の判別分析を行ないたい.手法はロジスティック回帰を利用すること.
以下の設問を進める形で分析を進めよ.
この問題では一貫してlow
という変数を目的変数とする.またbwt
とid
という変数は除外する.
※学習データと評価データを分けずに分析を進めて良い.
準備として以下のコードを実行してlowbwt
のデータセットを読み込み,df
というオブジェクト名で保存しておこう.
- このデータセットについてその構造や要約統計量を概要を述べよ.
- 変数間の関係を調べ,結果を述べよ.
low
を目的変数としてAICの意味で最も良いモデルを求めよ.- 4で求めたモデルの推定結果などを確認し,考察を述べよ.