2 プログラミング問題(10点)

Exercise 2.1 (線形回帰モデル(10点)) ボストンの住宅価格のデータセットについて線形回帰分析を行いたい.以下の設問を進める形で分析を進めよ. この問題では一貫してmedvという変数を目的変数とする. ※学習データと評価データを分けずに分析を進めて良い.

準備として以下のコードを実行してBostonのデータセットをdfというオブジェクト名で保存しておこう.

library(MASS)
df <- MASS::Boston
  1. このデータセットについてその構造や要約統計量を概要を述べよ.
  2. 変数間の関係を調べ,結果を述べよ.
  3. medvを目的変数としてAICの意味で最も良いモデルを求めよ.
  4. 4で求めたモデルの推定結果などを確認し,考察を述べよ.

Exercise 2.2 (ロジスティック回帰モデル(10点)) 低出生体重のデータセットについて2値の判別分析を行ないたい.手法はロジスティック回帰を利用すること. 以下の設問を進める形で分析を進めよ. この問題では一貫してlowという変数を目的変数とする.またbwtidという変数は除外する. ※学習データと評価データを分けずに分析を進めて良い.

準備として以下のコードを実行してlowbwtのデータセットを読み込み,dfというオブジェクト名で保存しておこう.

install.packages("aplore3")
library(aplore3)
data("lowbwt")
df <- lowbwt %>% dplyr::select(-bwt, -id)
  1. このデータセットについてその構造や要約統計量を概要を述べよ.
  2. 変数間の関係を調べ,結果を述べよ.
  3. lowを目的変数としてAICの意味で最も良いモデルを求めよ.
  4. 4で求めたモデルの推定結果などを確認し,考察を述べよ.