3.6 決定係数の性質

既に説明したように決定係数R2が取りうる範囲は[0,1]であり,この値が1に近いほど説明力が高く,0に近いほど説明力が低いと解釈することもできる.実際には次のような性質があるため利用する際には注意が必要である.

  1. 決定係数は因果関係を示すの根拠となる指標ではない
  2. 決定係数は目的変数と説明変数が1次関数的な関係にあるかどうかを評価している
  3. 単回帰モデルにおいてはn=2の時,常に決定係数は1をとる

決定係数は因果関係を示すの根拠となる指標ではない

yを目的変数,xを説明変数として単回帰モデルの決定係数R2は,実はxを目的変数としてyを説明変数としたモデルの決定係数と一致することが分かる.すなわち,どちらが目的変数でどちらが説明変数であるかに依存しない量である. すなわち,決定係数が因果関係を示す根拠ではない(ここでいう因果関係とはyという結果が得られる原因がxである,という関係を意味している).

実際,決定係数はxyの相関係数の二乗に等しいことが証明できる. 相関係数についてはCor(x,y)=Cor(y,x)のように順序によらないため上記の性質が成り立つ.以下に決定係数が相関係数の二乗に等しいことを示そう.

まず

(ˆyiˉy)2=(ˉyˆβ1ˉxβ0+ˆβ1xiˉy)((ˆyiyi)+(yiˉy))=ˆβ1(xiˉx)(yiˉy)=(xiˉx)(yiˉy)(xiˉx)2(xiˉx)(yiˉy)={(xiˉx)(yiˉy)}2(xiˉx)2 と変形できることを用いて相関係数は

R2={(xiˉx)(yiˉy)}2(xiˉx)2(yiˉy) と表現できる.これはxi,yiの相関係数の2乗の形になっていて.相関係数はその定義からわかるようにxi,yiが目的変数か説明変数かには関係なく決まる量である. このことからも,決定係数は因果関係を示す根拠には成り得ない.. 実際に説明変数と目的変数の関係を逆にしたモデルxi=β0+β1yi+εiを考えて最小二乗法による推定値に対する決定係数を変形しても上記のようになる.

決定係数は目的変数と説明変数が1次関数的な関係にあるかどうかを評価している

まず相関係数が1になる場合がどのような時かを考えてみよう.つまり

ni=1(yiˆyi)2=0

となる時を考えるわけだが,各iについてei=0となることを意味しているのでyi=ˆβ0+ˆβ1xiと表せる. すなわちxi,yiが全ての点が直線y=ˆβ0+ˆβ1x上に位置している状態を指す.

このことから決定係数R2=1は目的変数と説明変数の関係が一次関数で完全に表せている状況を意味している.

次に,明らかに目的変数と説明変数には関連性が見られるが相関係数R2となるケースを示す.

y_i = x_i^2

という関係の場合に単回帰モデルで推定してみよう.これは

x <- seq(-3,3,length.out=100)
y <- x^2
plot(x,y)
$y_i = x^2_i$のグラフ

Figure 3.7: y_i = x^2_iのグラフ

のように単純な2次関数の関係を持つデータである.このデータを用いて回帰モデルによって学習を行ってみると

fit <- lm(y~x) 
summary(fit)$r.squared
## [1] 1.110909e-31

となり,決定係数はほぼ0という値になる.しかし,明らかにx_i,y_iには関係がある.

以上で示したように,決定係数はあくまで1次関数のような関係性が強いかどうかの指標であり,値が0に近い値を取ったとしてもx_i, y_iの間に何ら関係性がないことを示す根拠にはならない.

単回帰モデルにおいてはn=2の時,常に決定係数は1をとる

これまでに示した通り,決定係数はデータ点全てが回帰直線上にあるとき最大値の1を取るので,もしデータ点が2個しかなければ回帰直線上に必ずデータ点全てが乗ることになる(そうででなければ残差二乗和が最小化されない).

以上の性質も踏まえて,決定係数R^2の値だけで判断するのではなく,残差の分布など総合的にみてモデルの当てはまりを判断するようにして欲しい.