9.1 信頼性分析

ある体温計で数分間に3回繰り返して体温を測ったとき,1回目の測定では36.6度,2回目は36.5度,3回目は36.6度だったとしましょう。この体温計では,3回の測定値がほとんど同じです。そして別の体温計で同じように3回の測定を行ったとき,1回目の測定では36.2度,2回目には35.1度,3回目は38.2度だったとします。このような場合,1つ目の体温計と2つ目の体温計のどちらを信頼するかと聞かれたら,ほとんどの人は1つ目の体温計を選ぶことでしょう。2つ目の体温計は,測定値がコロコロ変わり,正しく測れているのかどうかもわからないからです。

それは心理尺度の場合も同様です。尺度による測定値が,測定のたびにコロコロと変わるようでは困ります。測定のたびにIQの値が10も20も変わるようでは,その知能検査の結果はあてになりません。

そして,そうした尺度の信頼性について,客観的な指標を用いて確認しようとするのが信頼性分析です。信頼性にはいくつかの確認方法がありますが,jamoviでは内的一貫性の指標を用いた信頼性分析が利用できます。

9.1.1 考え方

心理学の調査では,リカート法1による心理測定尺度がよく用いられます。通常,それらの尺度は内容的に関連のある複数の質問で構成されており,それら複数の質問に対する回答値を合計したり平均したりすることによって尺度得点が算出されます。

このように,複数の質問に対する回答値を足したり平均したりして1つの尺度得点として使用するためには,当然ながらそれらの質問が同じ内容について測定しているものでなくてはなりません。このような同一尺度内における質問内容の一貫性は,内的一貫性内的整合性と呼ばれます。

内的一貫性が高い尺度では,ある質問に対して「5」と答えた回答者は他の質問に対しても「5」と答える可能性が高く,「1」と答えた回答者は「1」と答える可能性が高いというように,同じ1人の回答者の中でその回答値が似通ったものになるはずです。類似した内容を測定しているのであれば測定結果も類似した値が得られるということは,その尺度における測定結果が安定したものである(信頼性のあるものである)ことを意味するわけです。

複数の質問で構成される心理尺度を用いた測定を行う場合には,その尺度における内的一貫性が十分であるかどうかの確認が行われますが,その際の内的一貫性の指標としてよく用いられているのがクロンバックのアルファ(α)やアルファ係数と呼ばれる値です。この値はしばしば信頼性係数とも呼ばれます。このクロンバックのアルファは,次のように尺度に含まれる各質問の回答値の分散と,参加者ごとの回答値の合計の分散から算出されます。

\[ \alpha = \frac{\text{質問数}}{\text{質問数}-1}\times\left(1-\displaystyle\frac{\text{各質問の分散の合計}}{\text{各回答者の合計の分散}}\right) \]

このようにして計算すると,質問ごとの回答のばらつきが一人一人の回答のばらつきよりも小さい(つまりそれぞれの質問に対する回答値が似通っている)場合にクロンバックのアルファが1に近くなります。

このアルファの値は0から1の値をとり,その大きさについては表9.1のような目安を用いて解釈が行われます。一般に,心理尺度においてはこの値が0.8以上ある場合に内的一貫性があるとみなされます。

表9.1: クロンバックのアルファの解釈の目安
アルファの値 内的一貫性
0.9〜1.0 非常に高い
0.8〜0.9 高い
0.7〜0.8 許容レベル
0.6〜0.7 疑わしい
0.5〜0.6 低い
0.0〜0.5 著しく低い

9.1.2 基本手順

ここでは,このサンプルデータ(factor_data01.omv)を用いて尺度の内的一貫性について分析してみましょう。このデータは「メッセージアプリ志向尺度」を用いて測定されたもので,次の変数が含まれています。なお,各質問への回答は,いずれも「1:まったくあてはまらない」から「5:とてもよくあてはまる」までの5段階です(図9.2)。

サンプルデータ

図9.2: サンプルデータ

  • ID 対象者のID
  • Q1 「メッセージアプリをよく使う」への回答値
  • Q2 「メッセージアプリよりメールで連絡することのほうが多い」への回答値
  • Q3 「メッセージアプリでやりとりするのは楽しい」への回答値
  • Q4 「メッセージアプリは何かとめんどくさい」への回答値
  • Q5 「送信メッセージに反応がないとソワソワする」への回答値

このデータについて信頼性分析を実施するには,分析タブの「inline 因子分析」から「信頼性分析」を選択します(図9.3)。

信頼性分析の実行

図9.3: 信頼性分析の実行

すると,図9.4のような設定画面が表示されます。

信頼性分析の設定

図9.4: 信頼性分析の設定

  • 項目 分析対象の項目(変数)を指定します。
  • 尺度統計量 尺度全体についての統計量を算出します。
  • 項目統計量 各項目(変数)に関する統計量を算出します。
  • 追加オプション 結果表示に関するその他の設定です。
  • | 逆転項目 逆転項目に関する設定を行います。
  • | 保存 計算結果を変数値として保存します。

この画面で,内的一貫性の指標を算出したい質問の回答値が入った変数を指定します。通常は1つの尺度に含まれている質問すべてを指定しますが,その尺度が複数の下位尺度2から構成されている場合には,1つの下位尺度に含まれている質問のみを指定します。サンプルデータのメッセージアプリ志向尺度は「Q1」から「Q5」までの5つの質問で構成されていますので,これら5つを「項目」の領域に移動します(図9.5)。

分析対象の設定

図9.5: 分析対象の設定

これで基本的な分析の設定は終わりです,といいたいところですが,残念ながらそうではありません。今回のデータでは,適切な分析結果を得るためにはあと少しだけ設定が必要です。これでなぜ分析設定が完了でないのかは,出力ウィンドウにある結果の表を見てみるとわかります(図9.6)。

分析の設定上の問題

図9.6: 分析の設定上の問題

まず,この結果ではクロンバックのアルファの値がマイナスになっており,これは明らかに計算が正しくありません。そして,この表の下には何やら注釈が長々と書かれています。この注を見てみると,「項目’Q2’および’Q4’は尺度全体と負の相関関係にあるため,逆転項目として処理したほうがよいでしょう」と書かれています。

実際,このサンプルデータでは,「Q1」と「Q3」,「Q5」はメッセージアプリの使用が多いほど回答値が大きくなる質問ですが,「Q2」と「Q4」はその逆で,メッセージアプリをあまり使わない人ほど回答値が大きくなるような,逆内容の質問です。このような,他の質問とは逆内容の質問を含む項目は逆転項目と呼ばれ,内的一貫性の分析においては,これらはそのままでは分析できません。

9.1.3 逆転項目

尺度を構成する質問の中に逆転項目が含まれている場合には,分析設定画面の[逆転項目]の部分を展開し,それらを適切に設定する必要があります(図9.7)。

逆転項目の設定画面

図9.7: 逆転項目の設定画面

この画面の左側に通常の尺度項目が,右側に逆転項目が入るように,必要な変数を選択して移動します(図9.8)。

逆転項目の設定

図9.8: 逆転項目の設定

すると,図9.9のように結果の表の下にあった注釈が消え,そして算出結果も0.84という正常な値になりました。

クロンバックのアルファの算出結果

図9.9: クロンバックのアルファの算出結果

この結果から,このメッセージアプリ志向尺度の内的一貫性の値は0.84で,十分な内的一貫性を持っているといえそうです。

尺度統計量

さて,少し前後しましたが,ここからは分析設定の詳細についてみていくことにしましょう。設定画面の尺度統計量の部分では,尺度全体についての内的一貫性を吟味するための指標を設定します。

ここには,次の4つの項目があります。

  • クロンバックのα 尺度全体のクロンバック(Cronbach)のアルファを算出します。
  • マクドナルドのω 尺度全体のマクドナルド(McDonald)のオメガを算出します。
  • 平均値 尺度全体の平均値を算出します。
  • 標準偏差 尺度全体の標準偏差を算出します。

これらの項目すべてにチェックを入れると,結果の表は図9.10のようになります。

さまざまな尺度統計量

図9.10: さまざまな尺度統計量

このうち,クロンバックのアルファについてはすでに説明しましたので,それ以外の項目について見ていきましょう。

マクドナルドのω

クロンバックのアルファは計算は単純なのですが,その分,正確さにかける部分があり,近年とくにその問題点がたびたび指摘されるようになっています3。そこで,その代替的な指標として近年注目を集めているのがマクドナルドのオメガ(ω)です。この値は,オメガ係数とも呼ばれます。

クロンバックのアルファでは,尺度に含まれる各質問に対する回答値をそのまま単純に合計しますが,マクドナルドのオメガでは各質問への回答値が共通因子から受けている影響(因子負荷量)を考慮して重みづけを行ったうえで合計します。このオメガについても基本的な解釈の仕方はクロンバックのアルファと同様で,0.8を超える場合に内的一貫性が高いとみなされます。サンプルデータでは,クロンバックのアルファとマクドナルドのオメガはほぼ同じ値で,オメガを指標とした場合にも十分な内的一貫性があることが示されました。

平均値,標準偏差

尺度統計量の「平均値」と「標準偏差」にチェックを入れると,尺度全体の回答値の平均と標準偏差が算出されます。

項目統計量

項目統計量には,尺度を構成する個別の質問項目について吟味するための項目が含まれています。

  • 項目除外時のクロンバックα
  • 項目除外時のマクドナルドω
  • 平均値
  • 標準偏差
  • I-R相関

ここでも,すべての項目にチェックを入れてその結果を見てみましょう(図9.11)。

項目ごとの統計量

図9.11: 項目ごとの統計量

9.1.3.0.1 項目除外時のクロンバックα

この項目は,各質問項目を分析から除外した場合にクロンバックのアルファの値がどのように変化するかを示します。ここに表示されている値の中に尺度全体の値よりも大きなものがある場合,その項目を分析から除外することで尺度全体のアルファ係数が上昇することを意味します。今回の分析結果では,いずれの値も全体の値を下回っていますので,分析から除外すべき質問項目はなさそうです。

9.1.3.0.2 項目除外時のマクドナルドω

この項目は,各質問項目を分析から除外した場合にマクドナルドのオメガの値がどのように変化するかを示します。ここに表示されている値の中に尺度全体の値よりも大きなものがある場合,その項目を分析から除外することで尺度全体のオメガ係数が上昇することを意味します。クロンバックのアルファの場合と同様に,この結果ではオメガの値はいずれも全体の値を下回っていますので,分析から除外すべき質問項目はなさそうです。

平均値,標準偏差

ここでの「平均値」と「標準偏差」は,「Q1」から「Q5」それぞれの平均値と標準偏差を表示します。

I-R相関

一番下にある「I-R相関」の項目にチェックを入れると,I-R相関と呼ばれる指標が算出されます。I-R相関は,各質問項目(item)の回答値とそれ以外の項目(rest)の合計値の間の相関係数です。このI-R相関が著しく低い場合には,その質問項目が他の質問項目と異なる回答傾向を持っている(一貫性が低い)ことが考えられます。今回の分析結果では,「Q1」から「Q5」の中にそのような傾向はみられません。

追加オプション

追加オプションにある「相関ヒートマップ」にチェックを入れると,相関行列をヒートマップの形で視覚化した図が作成されます。ヒートマップとは,相関係数の大きさや向きを色の違いや濃淡で示したもののことをいいます。1つの尺度に含まれる質問項目の数が多い場合,ヒートマップの形で視覚化することによって,他と傾向の異なる質問項目を見つけやすくなります(図9.12)。

相関係数のヒートマップ

図9.12: 相関係数のヒートマップ

このヒートマップでは,正の相関係数が緑,負の相関係数が赤で,そして相関係数の絶対値が大きくなるほど緑または赤の色が濃くなる形で示されています。

9.1.4 保存

設定画面の一番下にある| 保存の項目では,逆転項目の処理を行ったうえで,各質問項目の回答値の合計または平均値を新たな変数として保存することができます(図9.3)。

尺度得点の保存

図9.13: 尺度得点の保存

  • 平均得点 回答値(逆転処理済)の平均値を尺度得点として保存します。
  • 合計得点 回答値(逆転処理済)の合計値を尺度得点として保存します。

2章の「尺度得点の算出」では,計算変数を用いて尺度得点を変数に格納する方法を紹介しましたが,jamoviではこのようにして簡単に尺度得点を作成することもできるのです。

このとき,「平均得点」にチェックを入れれば各質問項目への回答値の平均値が,「合計得点」にチェックを入れれば合計値が新たな変数として保存されます。


  1. 示された文章の内容について,「まったくあてはまらない」から「とてもよくあてはまる」までの5段階や7段階の選択肢から答えさせる手法。↩︎

  2. 1つの尺度の中でさらに小区分に分けられているもののことです。たとえば,ある性格特性尺度が外向性尺度,神経症傾向尺度など複数の小尺度からなる場合,外向性尺度や神経症尺度のことをその性格特性尺度の下位尺度と呼びます。↩︎

  3. とはいえ,クロンバックのアルファは現在でも尺度の内的一貫性の指標として非常によく用いられています。↩︎