3.2 パラメーター\(\beta_0, \beta_1\)の推定

定式化の次のステップはパラメーター\(\beta_0, \beta_1\)の推定である.様々な推定手法が存在するが,ここではまずアドホック(手探り)に考えてみよう.

3.2.1 直感で決める

例えば,Fig 3.1の散布図から直感的に(適当に)\(\beta_0, \beta_1\)を決めてみる.ここではまずは\(\tilde \beta_0^{(1)} = 60, \tilde \beta_1^{(1)} =0.1\)として,データとの関係を図示してみると

推定値を$\tilde \beta_0^{(1)} = 60$,$\tilde \beta_1^{(1)} = 0.1$とした場合の回帰直線

Figure 3.3: 推定値を\(\tilde \beta_0^{(1)} = 60\)\(\tilde \beta_1^{(1)} = 0.1\)とした場合の回帰直線

のようになる.オレンジ色の線が\(y=60 + 0.1x\)の直線である.次に別のパラメーターを適当に決めてもう一度図示してみる.二つ目は\(\tilde \beta_0^{(2)} = -10, \tilde \beta_1^{(2)} = 1.2\)として,青色で線を引いてみよう.

推定値を$\tilde \beta_0^{(2)} = -10$,$\tilde \beta_1^{(2)} = 1.2$とした場合の回帰直線

Figure 3.4: 推定値を\(\tilde \beta_0^{(2)} = -10\)\(\tilde \beta_1^{(2)} = 1.2\)とした場合の回帰直線

これまでに適当に(直感で)決めた二つの回帰直線を比べると2つ目の\(\beta_0 = -10, \beta_1 = 1.2\)の方が何となくデータに合っているように見える.

もちろん,統計モデルの推定方法ではもっと最もらしい方法があるが.ここで大切なことはある二つのパラメータの推定値が得られた時,我々はこの二つの推定値を比較しより良い方を直感的に選択できるということである.

しかしこの項での手続きはいずれも全く根拠がない,具体的には

  • どのように推定値を求めたのか
  • 推定値の良さとは何か(良いということをどのように定義するのか)

という点が明確ではない.次項からこの点を踏まえて推定方法を考えていく.