7.2 偏相関
相関行列に示されているそれぞれの相関係数は,あくまでも特定の2つの変数間での関係の強さを示す値で,他の変数による影響は一切考慮していません。たとえば,相関行列のところで使用したサンプルデータの相関行列(ピアソンの相関係数)をもう一度見てみましょう(図7.14)。
この結果では,父-娘の身長の相関係数は0.56,母-娘の身長の相関係数は0.48で,娘の身長は父親の身長とも母親の身長とも正の相関関係にあります。この結果ではまた,父親の身長と母親の身長の間にも有意な正の相関(0.31)があります。つまり,父親の身長が高い場合,母親の身長も高い傾向にあるわけで,そうなると,たとえば母-娘の身長の相関係数には,父-娘の相関係数による影響も混じってしまっていることになるのです(図7.15)。
このように,お互いに相関がある複数の変数間で関係の強さを見る場合,通常の相関係数では他の変数による影響が混在した形になるため,ときとして変数間の関係の解釈が困難になってしまうことがあります。そのような場合,関連する他の変数の影響を取り除いた後の,より純粋な変数間関係を捉えるための指標として,部分相関係数や偏相関係数が用いられます。
部分相関係数とは,たとえば父親の身長データと,母-娘間の相関の影響を取り除いた後の娘の身長データの間で算出した相関係数のことをいいます。これに対し,偏相関係数は,父と娘の身長データの両方から母親の身長による影響を取り除き,そのうえで父-娘間の身長の相関を算出した値です。
部分相関係数は,重回帰分析においてその変数を分析モデルに含めるべきかどうかを判断する際などに,偏相関係数は他の変数の影響を取り除いた後の2変数間の関係について知りたい場合などに用いられます。
7.2.1 分析手順
ここでは,相関行列のところで用いたのと同じサンプルデータ(regression_data01.omv)を用いて,部分相関係数・偏相関係数を算出してみましょう。部分相関係数や偏相関係数の算出には,分析タブの「 回帰分析」から「偏相関」を選択します(図7.16)。
すると,図7.17のような設定画面が表示されます。
- 変数 相関係数を算出したい変数を指定します。
- 統制変数 相関係数から影響を取り除きたい変数を指定します。
- 相関係数 算出する相関係数の種類を指定します。
- 仮説 有意性検定における仮説を指定します。
- 相関のタイプ 部分相関係数・偏相関係数の指定を行います。
- 偏相関 偏相関係数を算出します。
- 部分相関 部分相関係数を算出します。
- 追加オプション 結果の表示方法についてのオプション設定です。
画面構成は相関行列の設定画面とよく似ていますが,設定画面右側の部分が2段に分かれているところ,「相関のタイプ」という設定項目があるところが異なります。また,追加オプションには,信頼区間に関する設定がありません。さらに,この分析メニューには「グラフ」機能はありません。
なお,「仮説」や「追加オプション」などの設定項目の動作は「相関行列」と同じですので,ここでは説明を省略します。
相関のタイプ
「相関のタイプ」では,偏相関係数を算出するか,部分相関係数を算出するかを設定します。
偏相関
ここでは,母親の身長と娘の身長について,父親の身長の影響を取り除いた偏相関係数を算出することにしましょう。
その場合,まず「母身長」と「娘身長」を「変数」欄に移動します(図7.18)。
次に,影響を取り除きたい変数(ここでは「父身長」)を「統制変数」欄に移動します(図7.19)。
このとき,「相関のタイプ」で「偏相関」が選択されていることを確認してください。すると,図7.20のような結果が表示されます。
結果の表の下の部分に「統制変数:‘父身長’」という注釈がついていますね。これは「父身長」の影響を取り除いているという意味です。最初の相関行列では母親と娘の相関係数は0.48でしたが,このように父親の影響を取り除いた母-娘の身長の偏相関係数は0.38とやや値が小さくなります。
部分相関
今度は母親の身長と娘の身長について,父親の身長の影響を取り除いた部分相関係数を算出してみましょう。
先ほどと同様に,「母身長」と「娘身長」を「変数」欄に,「父身長」を「統制変数」欄に移動したら,「相関のタイプ」で「部分相関」を選択します(図7.21)。
すると,図7.22のような結果が得られます。
偏相関係数の場合と違い,係数が2つ表示されています。偏相関係数の場合,母親の身長と娘の身長の両方から父親の身長の影響を取り除いて相関係数を求めますが,部分相関係数の場合には,父親の身長の影響を取り除くのは母親の身長と娘の身長のどちらか一方だけであるため,母・娘のどちらの身長から父親の身長の影響を取り除いたかによって値が異なるためです。
表の注釈にあるように,この結果では統制変数(「父身長」)の影響は「列」にある変数からのみ取り除かれています。つまり,右上の0.32という値は母身長から「父身長」の影響を取り除いたものと「娘身長」の部分相関係数,左下の0.36という値は娘身長から「父身長」の影響を取り除いたものと「母身長」の部分相関係数です。