4.1 Correlation Matrix(相関行列)

相関行列は,2つ以上の連続型変数間の線形関係を検討するための方法です。与えられた変数を用いて変数ペアを作成し,それぞれの変数ペアに対して相関係数を算出します。相関係数は2変数間の関係の強さと方向を表す指標です。正の相関係数は正の相関関係(一方の変数の値が大きいほどもう一方の値も大きい)があることを意味し,相関係数が負の値の場合には負の相関関係(一方の変数の値が大きいほどもう一方の値も小さい)があることを意味します。相関係数がゼロの場合は,2変数間に関連がない(一方の変数の値の大小からは,もう一方の値の大小について何もわからない)ことを意味します。

それぞれの相関係数については,「相関係数がゼロである」という帰無仮説を用いて検定を行い,p値を算出することができます。このp値が低い場合には,相関係数がゼロではない,つまり2変数間に線形(あるいはより複雑な)関係があるという可能性が高いことを意味します。

**Corrilation Matrix**

図4.1: Corrilation Matrix

  • Correlation Coefficients(相関係数) 算出する相関係数の種類を指定します。
    • Pearson(ピアソン) ピアソンの積率相関係数を算出します。
    • Spearman(スピアマン) スピアマンの順位相関係数を算出します。
    • Kendall’s tau-b(ケンドール) ケンドールの順位相関係数(タウ-b)を算出します。
  • Hypothesis(仮説) 有意性検定における仮説を指定します。
    • Correlated(相関あり) 相関係数が0でない場合に検定結果が有意になります(両側検定)
    • Correlated positively(正の相関あり) 相関係数が0より大きい場合に検定結果が有意になります(片側検定)
    • Correlated negatively(負の相関あり) 相関係数が0より小さい場合に検定結果が有意になります(片側検定)
  • Additional Options(追加オプション) 結果の表示方法についてのオプション設定です。
    • Report significance(有意性を報告) 相関係数の下に,「p-value(有意性検定のp値)」を表示します。
    • Flag significant correlations(有意な相関をマーク) 統計的に有意な相関係数の右肩に「*」などの印をつけて示します。
    • N(標本サイズ) 相関係数の算出対象となった標本サイズ(データペアの数)を示します。
    • Confidence intervals(信頼区間) 相関係数の信頼区間を算出して示します。
      • Interval [   ] % 信頼区間の幅を数値指定します。初期設定値は95%です。
  • Plot(作図) 結果の図を作成します。
    • Correlation matrix(相関行列) 変数ペアごとの散布図を作成します。
      • Densities for variables(変数の密度曲線) 各変数について密度曲線を作成します。
      • Statistics(統計量) 図の中に相関係数の値を示します。