6.2 分散分析

先ほど見たように,分散分析は1つの要因に3つ以上のグループ(水準)がある場合の平均値の検定として使用される分析方法です。しかし,分散分析は単に3つ以上の平均値の間に差があるかどうかを見ることができるだけではありません。測定値に影響すると考えられる要因が複数ある場合に,それらの影響を同時に分析することもできるのです。むしろ,そうした複数要因の分析こそが,分散分析が本領発揮できる場面だといえるかもしれません。

6.2.1 考え方

分散分析の基本的な考え方については,すでに先ほどの1要因分散分析のところで説明しましたが,複数の要因による影響を分析する場合には,複数の要因それぞれによる単独の影響(主効果)の他に,それらの要因による組み合わせ効果である交互作用についても検討する必要があります。

交互作用は複数要因の組み合わせ効果のことをいうわけですが,ではその「組み合わせ効果」とは具体的にどのようなもののことをいうのでしょうか。ここでは,次のサンプルデータ(anova_data02.omv)を用いて交互作用がどのようなものであるのかを簡単に見ておくことにしましょう(図6.161

サンプルデータ

図6.16: サンプルデータ

  • ID 実験参加者のID
  • 条件 呈示条件(なし,不一致,一致)
  • 課題 実験課題(文字,写真)
  • 得点 課題成績(0〜50点)

このデータは,1要因分散分析で使用したものとよく似ているのですが,このファイルには,画面の左右に表示された情報のうち,ネコの「写真」の方のボタンを押してもらうという課題と,ネコという「文字」の方のボタンを押してもらうという課題の2種類の課題を実施した結果が含まれています。この実験は,参加者を2つの課題×3つの刺激条件の組み合わせによる6つのグループに分けて実施しました。

なお,この実験ではそれぞれの条件に25人ずつの参加者を割りあてていたのですが,実験機器の不具合で,「写真・なし」の条件で参加者2人のデータが記録できていませんでした。そのため,このファイルに入力されているデータは,「写真・なし」条件のみ23人,残りの条件ではいずれも25人分です。

まずは,それぞれの条件における平均値を見てみましょう。分析タブの「inline 探索」から「記述統計」を実行し,「変数」欄に「得点」を,「グループ変数」に「条件」と「課題」を指定してください。そして,| 統計量`の部分で平均値のチェックだけをオンにすると,結果は図6.17のようになります。

各条件の平均値を算出

図6.17: 各条件の平均値を算出

また,「グループ変数」に「条件」のみを入れた場合,「課題」のみを入れた場合についても平均値を求めましょう。そしてこれらの平均値を1つにまとめたのが表6.1です。

表6.1: 各条件の平均値のまとめ
なし 不一致 一致 全体
文字 29.04 22.64 31.72 27.80
写真 33.22 30.80 33.00 32.32
全体 31.04 26.72 32.36 30.03

交互作用の説明に入る前に,まずは呈示条件と課題のそれぞれの主効果について考えます。この場合,たとえば呈示条件の主効果というのは,2つの課題の違いを考えないで,呈示条件の違いのみに注目した場合の平均値,先ほどの表でいうと,一番下の「全体」行にある31.04,26.72,32.36の違いということになります。同様にして,課題の主効果は表の右端にある27.8と32.32の2つの平均値の違いです。

このとき,たとえば不一致条件全体の平均値(26.72)は,呈示条件の違いを考えない参加者全員分の平均値(30.03)より3.31だけ値が小さく,そして一致条件全体の平均値(32.36)は全員の平均値より2.33だけ値が大きくなっています。これが呈示条件の違いによる主効果なわけです。

同様に,文字課題の平均値(27.8)は全員の平均値(30.03)より4.52小さく,そして写真課題の平均値は全員の平均値より2.29大きくなっていて,これが実験課題の主効果です(図6.18)。

呈示条件・実験課題の主効果

図6.18: 呈示条件・実験課題の主効果

では,いよいよ交互作用です。交互作用の影響は,この平均値の表のどの部分にどのように表れているのでしょうか。ここで,文字課題の不一致条件の平均値に注目してください。先ほど文字課題の主効果について説明した際,文字課題の平均値は全員の平均値から\(-\textsf{4.52}\)した値で,これが主効果だといいました。また,不一致課題の平均値は全員の平均値に比べて\(-\textsf{3.31}\)で,これが不一致条件の主効果です。

さて,もし呈示条件と課題の間に交互作用,つまり組み合わせによる効果がまったくなかったとしたら,文字・不一致条件の平均値はどのような値になると考えられるでしょうか。文字課題だと全体から\(-\textsf{4.52}\),不一致課題だと全体から\(-\textsf{3.31}\)なのですから,組み合わせによって効果が変わるようなことがなければ,文字・不一致条件の平均値は「全体(30.03)+ 文字課題(\(-\textsf{4.52}\))+ 不一致課題(\(-\textsf{3.31}\))= 24.49」で 24.49になるはずです2

ところが,実際の文字・不一致条件の平均値は(22.64)で,2つの主効果の影響を単純合計して求めた値からさらに2点ほど小さな値になっています。そしてこのずれの大きさが交互作用による影響です(図6.19)。文字・不一致条件の平均値が,文字条件の場合の影響と不一致条件の場合の影響から計算した値よりも小さいということは,文字条件と不一致条件という2つが組み合わさることによって,それらの効果を単純に合計するよりも,さらに平均値値を下げるような力が働いているということになるわけです。

文字・不一致条件における交互作用

図6.19: 文字・不一致条件における交互作用

そして分析においては,これらの交互作用の影響による分散が,主効果と同様に誤差の分散に比べて大きいといえるかどうかを確かめていくことになります。

6.2.2 分析手順

それでは分析手順を見てみましょう。分析の実行には,分析タブの「inline 分散分析」から「分散分析」を選択します(図6.20)。

分散分析の実行

図6.20: 分散分析の実行

すると,図6.21のように1要因分散分析のときとは少し違った設定画面が表示されます。

分散分析の設定画面

図6.21: 分散分析の設定画面

  • 従属変数 分析対象の測定値が入力されている変数を指定します。
  • 固定因子 分析の独立変数(実験条件など)を指定します。
  • モデル適合度 モデルの適合度について検定を行います。
  • 効果量 主効果および交互作用の効果量を算出します。
  • | モデル 分析モデルに関する設定を行います。
  • | 前提チェック 分析の前提が満たされているかどうかを確認します。
  • | 対比 さまざまな条件間対比の設定を行います。
  • | 事後検定 分散分析の事後検定に関する設定を行います。
  • | 推定周辺平均 分析モデルに基づく各条件の平均値の推定値(推定周辺平均)を算出します。
  • | 保存 分散分析モデルの誤差(残差)を変数として保存します。

1要因分散分析の場合と同様に,ここでもまずは基本設定での分析結果を見てみることにしましょう。設定画面の「従属変数」の部分に「得点」を,そして「固定因子」の部分には2種類の条件(「条件」と「課題」)を設定します。「固定因子」というのは,実験条件など,実験者によって値が固定されている変数のことです。

分散分析の分析設定

図6.22: 分散分析の分析設定

なお,この「分散分析」のツールでは,1要因の分散分析も可能です。先ほどの「1要因分散分析」は1要因分散分析に特化することで設定項目を簡素化していますが,その分,分析結果も最低限のものしか表示されません。分析データが1要因しかない場合であっても,より詳細な結果を知りたい場合には,こちらを使って分析するとよいでしょう。ただし,グループ間で分散が異なる場合のウェルチの検定を利用可能なのは「1要因分散分析」のみです。

さて,これで基本的な分析の設定は終わりです。分析結果を見てみましょう。

6.2.3 分析結果

分散分析の結果は,図6.23のような形で示されます。

分散分析の結果

図6.23: 分散分析の結果

1要因分散分析の場合に比べ,表示される項目も多くなっています。まず,表の一番左の部分は分析に使用した変数めいで,ここには「条件*課題」のように交互作用も含まれています。また,その列の一番下にあるのは,分散分析のモデルでは説明しきれないデータのばらつき(残差)で,これは誤差に相当する部分です。

変数名の隣には,「2乗和平方和)」という値が示されています。これは,それぞれの条件における測定値と平均値のずれ(偏差)を2乗した値の合計値です。その1つ隣は自由度,そしてその隣の「2乗平均平方平均)」は,先ほどの2乗和の値を自由度で割って求められる値で,これは主効果や交互作用の「分散」に相当する値です。

そしてその隣の「F」が検定統計量で,これはそれぞれの主効果や交互作用の2乗平均を残差の2乗平均で割って求められます。分散分析では,このFの値が,主効果または交互作用の自由度と誤差の自由度という2つの自由度をもつF分布において極端といえるほど大きなものであるかどうかを確かめます。

それぞれのF値が,対応するF分布においてどの程度の確率で生じうるかを示した値がその隣の有意確率pで,このpの値が有意水準を下回る場合に,その主効果または交互作用が有意と判断されます。今回の分析結果では,2種類の実験条件の主効果(呈示条件はF(2, 142)=9.62でp <.001,課題はF(1, 142)=16.71でp <.001)と,その2つの条件の組み合わせ効果である交互作用(F(2, 142)=3.27でp=0.041)がいずれも有意となりました。つまり,これらの結果が意味することは,ネコという文字に対して反応するかネコ写真に対して反応するかで課題成績が異なるということ,また,セットにして表示する情報が文字や写真と一致しているかどうかによっても課題成績が有意に異なるということ,そして課題と呈示条件の効果の大きさは,2つの条件の組み合わせ方によっても有意に異なるということです。

6.2.4 分析の詳細設定

「分散分析」の分析設定は,「1要因分散分析」に比べて複雑ですので,1つ1つ順番に確認していきましょう。まずは,変数設定欄のすぐ下にある項目からです。

モデル適合度

この部分には,「モデル全体の検定」の1項目だけが含まれています。この項目にチェックを入れると,帰無モデル(独立変数を1つも使用しないモデル)に比べて,分析モデルのデータへの適合度が有意に高いといえるかどうか(モデル全体の説明力が0でないかどうか)についての検定結果が表示されます(図6.24)。

モデル全体の検定

図6.24: モデル全体の検定

この検定は,第7章の線形回帰におけるモデル全体の適合度の検定と同じものです。この検定の結果における有意確率pが有意水準より小さい場合,モデルは有意(説明力が0でない)と判断されます。

効果量

検定統計量というのは,帰無仮説が正しい場合にこのデータのような値が得られる確率がどれくらいかを見るための値であって,差の大きさや効果の大きさを示す値ではありません。そのため,標本サイズが大きなデータの場合,ごくわずかな平均値の違いであっても,分散分析の結果が有意になる場合があります。そこで,主効果や交互作用の大きさについて評価する際には,標本サイズによる影響を受けくにい指標として効果量が用いられます。

jamoviでは,分散分析の効果量として\(\eta^2\)イータ2乗),偏\(\eta^2\)偏イータ2乗\(\eta^2_p\)),\(\omega^2\)オメガ2乗)という3種類の値を算出することができます(図6.25)。

分散分析の効果量

図6.25: 分散分析の効果量

η²(イータ2乗)

まず,\(\eta^2\)ですが,これは主効果や交互作用の偏差の2乗和をデータ全体の偏差2乗和で割った値です。つまり,その主効果あるいは交互作用の影響が,データ全体のばらつきに比べてどの程度大きいかを示します。この\(\eta^2\)の大きさの解釈の目安は表6.2のとおりです。

表6.2: \(\eta^2\)の解釈の目安
\(\eta^2\)の値 効果の大きさ
0.14
0.06
0.01
偏η²(偏イータ2乗)

ただ,このようにして効果量を算出する場合,分析モデルにたくさんの主効果や交互作用が含まれていると,必然的に1つ1つの主効果や交互作用の全体に占める影響力は小さくなってしまいます。そこで,主効果または交互作用の偏差2乗和を,その主効果・交互作用の偏差2乗和と誤差(残差)の偏差2乗和の合計で割って求めた値が偏イータ2乗(\(\eta^2_p\))です。

なお,1要因分散分析の場合,この\(\eta^2_p\)\(\eta^2\)の値は同じになりますので,解釈の際にはそれを目安にすることができます。ですが,2要因以上ある場合には,\(\eta^2_p\)の値の大きさを解釈する際の目安となるような基準はありません。また,別の要因による主効果が大きい場合には,それによって分析モデルの残差は小さくなり,結果としてこの要因の効果量も大きくなってしまうというように,偏\(\eta^2\)の値では効果が過大視されやすい傾向にあります。

ω²(オメガ2乗)

そこで,そうした影響を取り除くために,これら以外にもさまざまな効果量が考案されているのですが,その1つが\(\omega^2\)(オメガ2乗)です。\(\omega^2\)は,\(\eta^2\)と同様に主効果または交互作用の偏差2乗和をデータ全体の偏差2乗和で割って算出される値です。ただしその際,実験デザインなどが原因で効果量が小さくなりすぎたり大きくなりすぎたりすることがないように,分母と分子の値を主効果の自由度と残差の2乗平均で調整して計算を行います。この値の解釈の目安は,基本的には\(\eta^2\)と同じです。

どの値にも一長一短があり,これらの効果量のうちどれを使うかは判断がなかなか難しいところですが,現在のところもっとも一般的なのは\(\eta^2_p\)の値です。

6.2.5 モデル

分散分析の設定画面にある| モデルを展開すると,図6.26のような画面が表示されます。この画面では,分散分析の分析モデルについての設定を行います。

分析モデルの設定

図6.26: 分析モデルの設定

モデル項

今回のサンプルデータのように複数の要因(呈示条件と課題)を用いた分散分析を行う場合,基本設定では各要因の主効果と,それらの主効果によるすべての交互作用が分析に含まれます。この設定画面では,「モデル項」の欄に呈示条件の主効果(「条件」),課題の主効果(「課題」),そして条件×課題の交互作用(「条件*課題」)が入っているのがわかると思います。なお,このように,分析モデルに含める主効果や交互作用はと呼ばれます。

さて,多くの場合はこれで問題ないのですが,分析に使用する要因が3つあるいは4つというように多くなると,分析モデルが非常に複雑になってしまいます。たとえば,A,B,Cという3つの要因を用いた場合には,A,B,Cのそれぞれの主効果,A×B,A×C,B×Cの交互作用,そしてA×B×Cの交互作用という,全部で7種類もの影響について見ることになるのです。

要因が3つの場合でこれですから,要因が4つ以上になれば交互作用の数が膨大になり,結果の解釈が困難になるのは容易に想像できます。そこで,そのような場合には,分析モデルを単純化するために,結果に直接影響しない要因,あるいは研究仮説において関心の対象とならない要因を分析から除外することがあります。

今回の分析ではとくに必要ないのですが,せっかくですのでこの画面における設定方法を見ておきましょう。この段階では,すでに分析に含めることのできる要素がすべて含まれていますので,いったん,これらすべてを分析モデルから削除します。「モデル項」に含まれる項目を選択すると画面中央の「inline」の向きが「inline」に変わりますので,それをクリックすると選択した項目がモデルから除外されます(図6.27)。

分析モデルから項目を除外

図6.27: 分析モデルから項目を除外

「モデル項」が空っぽになったら,画面左側の「要因」にある「条件」と「課題」を選択し,今度は真ん中に2つあるボタンのうち下のほうのボタンをクリックしてください。すると,次の項目を含むポップアップが表示されます(図6.28)。

項追加用のポップアップメニュー

図6.28: 項追加用のポップアップメニュー

  • 交互作用 選択項目で構成される交互作用をモデルに投入します。
  • 主効果 選択した項目の主効果をモデルに投入します。
  • 全2要因 選択項目のうち2つで構成される交互作用をすべてモデルに投入します。
  • 全3要因 選択項目のうち3つで構成される交互作用をすべてモデルに投入します。
  • 全4要因 選択項目のうち4つで構成される交互作用をすべてモデルに投入します。
  • 全5要因 選択項目のうち5つで構成される交互作用をすべてモデルに投入します。

試しに「主効果」を選択してみてください。すると,「条件」と「課題」という2つの主効果だけがモデルに投入されます。ここで「交互作用」や「全2要因」を選択した場合には,交互作用のみがモデルに投入されます。

なお,今回のデータでは要因は2つしかありませんので,「交互作用」と「全2要因」で動作は同じになります。しかし,分析に使用する要因が3つある場合には,「要因」で3つの要因すべてを選択して「交互作用」をクリックすると,その3つの要因で構成されるすべての交互作用が,「全2要因」をクリックすると,そのうちの2つの要因で構成される交互作用の全組み合わせがモデルに投入されます。

分析に使用する要因が多い場合には,このようにして必要な要素だけをモデルに投入し,できるだけ単純なモデルにしたうえで分析結果を見ていくことになります。

2乗和

複数の要因を用いた分散分析の場合,分析の際に注意すべき点が1つあります。それは,各条件の中に標本サイズ(測定値の個数)の異なるものが混じっている場合,主効果や交互作用の大きさを計算する方法が複数とおりあり,そのうちのどれを用いるかによって分析結果が異なるということです。

今回のサンプルデータでは,ちょっとしたアクシデントのために「写真・なし」条件の測定値が他の条件に比べて2人分少なくなっています。このような,条件間の標本サイズが均等でないデータの場合には,各測定条件で測定値の偏差2乗を求めて合計するという方法ではなく,帰無仮説となるモデルと分析モデルの間で残差の大きさを比較することによって,主効果や交互作用が有意かどうかを判断するという方法が取られます。そして,この際の比較の仕方に複数とおりの方法があるのです。

一般に,これらの方法の違いは「タイプ1の2乗和タイプ1 SS)」や「タイプ2の2乗和」(タイプ2 SS)などのように,「タイプ○の2乗和」という名前で区別されています。その方法は全部で4つから5つほどあるのですが,そのうち統計ソフトなどで一般によく用いられているのは,タイプ1とタイプ3の方法です。なお,jamoviではこのタイプ1とタイプ3の2つに加え,タイプ2の方法を用いて結果を算出することもできます。

タイプ1

さて,これらの「タイプ」は何が違うのでしょうか。まず,「タイプ1」と呼ばれる方法について見てみましょう。この方法では,次のような考え方で主効果と交互作用の影響について検定していきます。ここでは,サンプルデータの場合(2要因分散分析)を例に説明します。

  1. まず,主効果や交互作用を1つも含まないモデル(帰無モデル)と「条件」の主効果を含む分析モデルの間でモデルの残差を比較します。帰無モデルの残差と分析モデルの残差の差が,「条件」の主効果です。

  2. 次に,「条件」の主効果を含むモデルと,そこに「課題」の主効果を加えたモデルの間で比較を行います。最初のモデル(「条件」のみ)と新たなモデル(「条件」と「課題」)の残差の差が「課題」の主効果です。

  3. 最後に,主効果のみを含むモデルと,そこに交互作用を加えたモデルの間で比較を行います。主効果のみのモデルと交互作用を含むモデルの残差の差が「条件*課題」の交互作用です。

このようにして主効果や交互作用の値を求める場合,主効果や交互作用をどのような順番で分析モデルに投入したかが分析結果に大きく影響します。最初にモデルに投入した主効果の影響が大きいと,その主効果によって大部分の残差が説明されてしまうため,あとからモデルに投入する主効果の影響が,計算上は小さなものになってしまうのです。

主効果をモデルに投入する順番によって計算結果が異なるというのは,jamoviで簡単に確かめることができます。この設定画面の左下に「2乗和」という設定項目があるので,そこを「タイプ1」に設定してください。このように設定すると,タイプ1の方法を用いた分散分析の結果が表示されます。

そしてその状態で,「モデル項」の「条件」と「課題」の順番をマウスでドラッグして入れ替えてみてください。すると,「条件」を上にした場合と「課題」を上にした場合で,結果の「2乗和」の値が変わるのがわかります(図6.29)。統計検定量のFの値はこの2乗和をもとに算出されますので,当然ながらそれらの値も変わってきます。

タイプ1の方法を用いた分析結果

図6.29: タイプ1の方法を用いた分析結果

今回のデータでは,順番を入れ替えることによる違いはそれほど大きくなく,最終的な分析結果への影響はありませんが,分析データによっては,こうした順番の影響によって,主効果が有意になったりならなかったりする場合があるのです。そのため,このタイプ1の方法は,主効果の投入順序について何らかの強い仮説があるような場合を除き,実際の分析場面で用いられることはほとんどありません。

タイプ3

順番が前後しますが,先にタイプ3の方法について見ておきましょう。タイプ3の方法では,次のようにして主効果や交互作用の影響を算出します。ここでも,サンプルデータの場合を例に説明します。

  1. まず,検討対象の主効果と交互作用をすべて含む分析モデル(完全モデル)を作成します。

  2. 次に,そのモデルから「条件」の主効果を削除したモデルを作成し,すべての項目を含む完全モデルと呈示条件抜きのモデルで比較を行います。2つのモデルの残差の差が「条件」の主効果です。

  3. 今度は,最初の完全モデルから「課題」のみを削除したモデルを作成し,このモデルと完全モデルの間で比較を行います。この2つのモデルの差が,「課題」の主効果です。

  4. 最後に,最初の完全モデルから,交互作用を削除したモデルを作成し,このモデルと完全モデルの間で比較を行います。この結果が交互作用の値です。

このように,タイプ3はタイプ1とは逆で,すべての項目を含むモデルと,そこから特定の交互作用や主効果を取り除いたモデルとの間で比較を行います。このタイプ3の方法では,どのような順番で主効果をモデルに投入しても計算結果が同じになります。そのため,条件間で標本サイズが異なるデータの場合には,このタイプ3の方法が用いられるのが一般的です。

タイプ2

最後に,タイプ2の方法についても見ておきましょう。タイプ2では,次のようにして主効果と交互作用の値を算出します。

  1. まず,検討対象の主効果と交互作用をすべて含む分析モデル(完全モデル)を作成します。

  2. 次に,そこから「条件」の影響を取り除いたモデルを作成します。このとき,「条件」の主効果だけでなく,「条件」が関係している交互作用(「条件*課題」)についても分析モデルから除外します。そして,そのモデルと完全モデルの間で比較を行います。その結果が呈示条件の主効果です。

  3. 今度は,最初の完全モデルから「課題」の影響をすべて取り除いたモデルを作成します。このときも,やはり主効果だけでなく交互作用についても削除します。そして,そのモデルと完全モデルの間で比較した結果が「課題」の主効果です。

  4. 最後に,最初の完全モデルから,交互作用を削除したモデルを作成し,このモデルと完全モデルの間で比較を行います。この結果が交互作用の値です。

このタイプ2とタイプ3の違いは,各要因の主効果の影響を取り除く際に,その要因が関与している交互作用についても分析モデルから取り除くかどうかという部分です。タイプ2の方法でも,主効果の分析の順序によって結果が変わるようなことはありません。

タイプ2の方法では,たとえば「課題」の主効果の影響を削除する場合には,「課題」が関係する交互作用もモデルから削除します。この場合,残ったモデルには「課題」の影響は含まれていません。しかし,タイプ3の方法では,「課題」の主効果の影響を削除したモデルを作成する際も,交互作用についてはそのままですので,モデルの中には「課題」の影響が一部残ったままになっています。

これは考えてみるとちょっとおかしな状況で,実際,jamoviでは,交互作用を残したままで主効果だけを取り除いたモデルというのは作成できません。「モデル項」から「課題」あるいは「条件」のいずれかの要因を選択し,その項目をモデルから除外してみてください。するとその要因が関係する交互作用も同時にモデルから外されるはずです。

このように,タイプ3の方法には少し奇妙な部分があり,その点ではタイプ2の方がスマートな方法のようにも思えるのですが,タイプ2の方法では要因数が増えると比較するモデルを作成するのが複雑になるためか,一般にはあまり用いられていません。

6.2.6 前提チェック

| 前提チェックには,次の項目が含まれています(図6.30)。

前提チェックの項目

図6.30: 前提チェックの項目

  • 等質性検定 分散の等質性の検定を行います。
  • 正規性検定 分布の正規性についての検定を行います。
  • Q-Qプロット 正規Q-Qプロットを作成します。

これらの設定については,「1要因分散分析」と同じですので,ここでの説明は省略します。

6.2.7 対比

前提チェックの下にある| 対比を展開すると,次のような画面が表示されます。この画面では,各主効果の対比コントラスト)の設定を行うことができます(図6.31)。

対比の設定項目

図6.31: 対比の設定項目

さて,「対比」とは一体何なのでしょうか。

今回のサンプルデータでは,「課題」の要因には「文字」と「写真」の2つの水準しかありませんので,課題の主効果が有意であるということは,文字課題と写真課題で課題成績の平均値が異なるということだとわかります。しかし,「条件」には「なし」,「不一致」,「一致」の3つの水準が含まれていて,分散分析で主効果が有意であったという結果だけでは,これら3つの水準間のどこに差があるのかまではわかりません。その場合,「なし」と「不一致」,「なし」と「一致」,「不一致」と「一致」というように,3つ水準から2つずつを取り出して各水準間の平均値の差について検討する多重比較が行われるのが一般的です。

しかし,研究の目的によっては,このように2つずつ取り出して比較するのではなく,別の形で水準間の差を検討したい場合があります。たとえば,ある病気に対する新しい治療薬の効果を確かめるために,代表的な既存の治療薬2種との比較を行ったとします。この場合,知りたいのは新薬の効果が既存薬より優れているかどうかなので,既存薬同士の効果の比較にはほとんど意味がありません。この場合には,既存薬1と新薬,既存薬2と新薬の比較という形で新薬の効果について検討する方が目的にそっているといえるでしょう。このように,単純な多重比較を行うのではなく,研究目的にそった形で各水準の比較を行いたい場合に使用されるのが対比コントラスト)です。

| 対比の画面には,分析に用いた2つの変数(「条件」と「課題」)が表示されており,その右側に「なし」という表示のメニュー項目があります。そしてこの部分をクリックすると,「なし」の他に選択肢として6つの対比が表示されます(図6.32)。

対比のメニュー

図6.32: 対比のメニュー

  • 偏差 
  • 単純
  • 差分
  • ヘルマート
  • 反復
  • 多項式

この6つの対比について,それぞれ簡単に見ておきましょう。

偏差対比

「条件」の対比を「なし」から「偏差」に変更すると,図6.33のような結果が表示されます。

偏差対比

図6.33: 偏差対比

この表の「推定値」の部分はそれぞれの対比における差の値,その隣が差の標準誤差,そして表の右側2つはその差が有意といえるかどうかについての検定結果です。そしてこの有意確率pの値が有意水準を下回る場合に差が有意であると判断します。この結果では,どちらの差も有意です。なお,この欄の名前が「推定値」になっているのは,これらの平均値の差には,この分散分析のモデルから算出された値(推定周辺平均)が用いられているからです。

この偏差対比と呼ばれる方法は,各水準の平均値が全体に比べて高い(低い)といえるかどうか(ある条件が他から突出しているかどうか)に関心がある場合の対比方法です。この方法では,基準レベルを除く各水準の平均値と,全体の平均値の間で比較を行います。

「基準レベル」というのは,その要因の主効果の大きさを評価する際に基準として用いられる水準のことです。jamoviの「分散分析」では,それぞれの主効果については各要因の最初の水準値を基準にして主効果の大きさを計算します。今回のサンプルデータ場合,課題では「文字」条件が,呈示条件では「なし」条件が,それぞれ主効果の大きさを計算する場合の基準として用いられているのです。

そのため,この偏差対比の結果の「推定値」の部分には,「なし」条件以外の各水準,つまり「不一致条件」と「一致条件」のそれぞれの平均値について,全体の平均値と比較した場合の差が示されています。この偏差対比で「なし条件」と全体の比較の値が欲しい場合,単に差を知りたいだけであれば後に説明する推定周辺平均の値を利用して自分で算出することもできますが,そうでなければ分析の際に基準レベルとして使用される水準を変更しなければなりません。

残念ながら,今のところ「分散分析」の設定画面では各主効果の基準レベルを変更することができないため,これを変更したい場合には,変数そのものの設定で水準の順序を変更する必要があります。ここで,その方法についても見ておくことにしましょう。設定画面右上のinlineをクリックして,「分散分析」の設定画面をいったん閉じてください。

スプレッドシート画面に戻ったら,「inline 条件」の列名の部分をダブルクリックして,変数の設定画面を表示させます。そしてその画面の「Levels(水準)」の部分で,「なし」をクリックして選択した後に,「inline」をクリックして「なし」の順番を上から2番目に変更します(図6.34)。

水準の基準レベルを変更

図6.34: 水準の基準レベルを変更

すると,分散分析結果の対比の表の部分にその変更が反映されて,「なし」の平均値と全体の平均値との対比の結果が表示されます。差の値を確認できたら,水準の順番は元に戻しておきましょう。

単純対比

2つ目の単純対比は,それぞれの要因における基準レベルの平均値と,それ以外の水準の平均値との比較です。この対比は,各実験群の平均値が統制群と比べて高い(低い)といえるかどうかに関心がある場合などに使用される方法です(図6.35)。

単純対比の結果

図6.35: 単純対比の結果

今回の分散分析では「なし」条件が基準レベルとして用いられているので,この結果の表でも,「不一致」と「なし」の差,「一致」と「なし」の差が示されています。この結果では,「不一致」と「なし」の間に有意な差(p=0.002)が見られています。

差分対比

3つ目の差分対比は,基準レベル(1番目)の水準と2番目の水準について比較を行った後に,1番目と2番目の水準を平均した値と3番目の水準の比較,そしてその後に1〜3番目の水準の平均と4番目の水準というようにして水準間の対比を行う方法です。この方法は,その主効果の要因が順序型変数の場合で,その要因の値の変化とともに平均値が増大(減少)するような影響があるかどうかを見たい場合に使用されます(図6.36)。

差分対比の結果

図6.36: 差分対比の結果

なお,この対比を用いる場合には,その主効果の各水準が適切な順序に並べられている必要があります。その変数の設定画面で,「levels(水準)」の部分が正しい順序になっているか確認しておきましょう。

ヘルマート対比

4つ目のヘルマート対比は,各水準とそれ以降の水準の平均値で比較する方法です。まず基準レベル(1番目)と2番目以降の水準の平均値を比較し,次に2番目の水準と3番目以降の水準の平均値を比較するという形で水準間の対比を行います(図6.37)。対比の方法としては,ちょうど差分対比の逆の方法です。差分対比の場合と同様に,この方法でもその要因の各水準が適切な順序に並べられている必要があります。

ヘルマート対比の結果

図6.37: ヘルマート対比の結果

反復対比

5つ目の反復対比は,各水準の平均値と,その直後の水準の平均値で比較する方法です。「反復」とあるように,この方法はその要因の各水準の値を1回目,2回目,3回目,というように繰り返し測定した場合などに用いられます(図6.38)。この対比でも,各水準の順序が適切に設定されていなければなりません。

反復対比の結果

図6.38: 反復対比の結果

多項式対比

6つ目の多項式対比は,他の対比とは少し異なる対比方法です。この対比では,それぞれの水準の平均値を他の水準の平均値と比較するのではなく,その要因の各水準の平均値の変化に1次式や2次式などによって表せる傾向があるかどうかを検討します。その要因に含まれる水準が3つの場合には1次式と2次式に対するあてはめが,水準数が4の場合には1次から3次,5の場合には1次から4次というように,その水準数\(-\textsf{1}\)の次数までの多項式に対するあてはめが行われます(図6.39)。なお,この対比では,対比に用いる要因の各水準に決まった順序があるだけでなく,それらの水準が互いに等間隔であることが前提となります。

多項式対比の結果

図6.39: 多項式対比の結果

この対比では,有意性検定の結果の見方に注意が必要です。他の対比では,帰無仮説は「平均値の差は0である」ですので,検定が有意であった場合には,その対比において「平均値に差がある」という結論になります。ところが多項式対比では,「すべての条件で平均値が同じであるとするモデル(何も説明していないモデル)」と「多項式で各条件の平均値を説明しようとするモデル」の間で「説明力の差が0である」というのが帰無仮説になっています。そのため,この対比の検定で検定結果が有意であった場合には,「何も説明していないモデルよりも説明力が高い」ということであり,その多項式がうまくあてはまっているという意味になるのです。

今回のサンプルデータでは「条件」の各水準に順序関係はないため,この対比の結果に意味はありませんが,仮にこれらの水準に明確な順序性があり,そしてそれらが等間隔になっていたとしましょう。すると,この結果では1次は有意でなく,2次が有意になっていますので,各条件の平均値は直線的に変化するのではなく,二次関数的に変化する傾向があるということになります。このデータの各水準の平均値に1次の対比と2次の対比をあてはめた場合を図にすると図6.40のようになり,確かに2次の対比の方が各条件の平均値のばらつきをうまく説明できることがわかります。

各条件の平均値と多項式対比

図6.40: 各条件の平均値と多項式対比

6.2.8 事後検定

各水準間の平均値の差について何らかの仮説がある場合には,適切な対比を用いてそれらの差について見ていくことになりますが,そうではなく,総あたり式に各水準間の平均値の差を見たい場合には,事後検定として多重比較を用いることになります。

「分散分析」の設定画面にある| 事後検定を展開すると,図6.41のような画面が表示されます。「1要因分散分析」にも同名の設定項目グループがありますが,ここで表示される内容は,それとはかなり異なったものになっています。

事後検定の設定項目

図6.41: 事後検定の設定項目

  • 修正 多重比較における検定統計量や有意水準の修正について設定します。
  • 修正なし 検定統計量や有意水準を修正せずに多重比較を実施します。
  • テューキー テューキー法を用いて検定統計量の修正を行います。
  • シェフェ シェフェ法を用いて検定統計量の修正を行います。
  • ボンフェロニ ボンフェロニ法を用いて有意水準の修正を行います。
  • ホルム ホルム法を用いて有意水準の修正を行います。
  • 効果量 多重比較における効果量の算出について設定します。
  • コーエンのd コーエンのdを算出します。
  • 信頼区間 効果量dの信頼区間を算出します。

この画面左側の主効果・交互作用の一覧から,多重比較を行いたい主効果や交互作用を選択して画面右側の欄に移動すると,その項目についての多重比較結果が表示されます。ここでは,「条件」と「条件*課題(条件×課題の交互作用)」について多重比較を行うことにしましょう。

なお,今回の分析では,「条件」と「課題」のそれぞれの主効果と,「条件×課題」の交互作用のすべてが有意でしたが,「課題」の主効果については事後検定の必要はありません。なぜなら,「課題」の要因には「文字」と「写真」の2水準しかないため,主効果が有意であれば,この2つの間に差があるということが明らかだからです。

「条件」と「条件*課題」の2つを画面右側に移動すると,図6.42のような形で主効果についての多重比較の結果と交互作用についての多重比較の結果が表示されます。

多重比較の結果

図6.42: 多重比較の結果

交互作用の多重比較については組み合わせが多くなるので,どうしても大きな表になってしまいますが,表に含まれている項目は主効果の多重比較の場合と同じです。ここでは,主効果についての多重比較結果の表を中心に,結果の見方を見ておきましょう。

「分散分析」の多重比較では,それぞれの比較結果が1行ずつ表示されていて,「1要因分散分析」の場合とは違った形になっています。この表の一番左には,比較したペアが示されています。同じ項目が連続する場合,繰り返しの部分は省略された形で表示されますのでその点に注意してください。たとえば,「条件」の主効果の結果では,「なし - 不一致」の次の行には「- 一致」としか書いてありませんが,これは「なし」が1行目の繰り返しであるために省略されているのです。

表の左から2列目(平均値の差)には,その比較における平均値の差が示されています。ただし,各水準でサンプルサイズが異なる場合には,この「平均値の差」は,実際の各条件の平均値の差とは完全には一致しません。平均値の差を算出する際に,分散分析の分析モデルから算出される各条件の平均値(推定周辺平均)が用いられているためです。

その隣の「標準誤差」は,この平均値の差の標準誤差です。それより右側には,平均値の差の検定における自由度,検定統計量(t)と,修正後の有意確率(p)が示されています。なお,最後の有意確率については,これがテューキー法による修正後の有意確率であることを示すために,「p」の部分に「テューキー」という表示が加えられています。この表に示された結果から,呈示条件の各水準間では,「なし」と「不一致」の間,「不一致」と「一致」の間に有意な差があるということがわかります。

交互作用の部分の結果についても,表のサイズは大きいですが中身は主効果についての多重比較と同じです。なお,交互作用についての多重比較では1つ注意しておくべき点があります。それは,ここでの多重比較はすべての組み合わせについて総あたり式に行われているため,この表の中には解釈が不能なペアについての結果も含まれているという点です。

たとえば,交互作用についての表の上から3番目には,「なし・文字」の平均値と「不一致・写真」の平均値の差の検定結果が示されていますが,これは呈示条件と課題の両方が異なる組み合わせでの比較ですので,ここに有意な差があったとしても,それが呈示条件の違いによるものなのか,課題の違いによるものなのかが区別できません。交互作用についての多重比較結果を見る際には,このような解釈不能な比較の結果に惑わされないようにしてください。

修正

結局のところ,多重比較というのは3つ以上ある水準の中から2つずつを取り出して,それぞれについてt検定を繰り返し行っているようなものです。そのため,そのままでは検定全体での第1種の誤り率(帰無仮説を誤って棄却してしまう確率:危険率)が,設定された有意水準を大幅に上回ってしまいます3。そこで多重比較においては,繰り返し検定を行った場合にも検定全体の危険率が有意水準未満になるように,さまざまな修正が加えられます。

多重比較における修正方法にはじつにさまざまなものがあるのですが,それらは検定全体での危険率を有意水準(5%など)未満に抑えるために検定統計量に修正を加える方法と,それぞれの比較における有意水準を修正して検定全体での危険率が有意水準を超えないようにする方法の2つに大別できます。

なお,多重比較にどの方法を用いるのが適切かについては,非常に難しい問題ですのでここでは触れません。これについては統計法のテキストなどを参考にしてください。

それでは,jamoviで使用できる修正方法について簡単に見ておきましょう。

修正なし

1つ目の「修正なし」は,まったく修正を行わずに,そのままt検定を繰り返す方法です。先ほど説明したとおり,この方法では繰り返しの数が多くなるほど検定全体での危険率が高くなります。そのため,実際の分析場面でこの方法を用いて多重比較を行うことはほとんどないでしょう。この選択項目を使用する場合があるとしたら,指定した修正法による効果を見るために,修正前のp値が知りたいというような場面くらいではないでしょうか。

テューキー法

2つ目の「テューキー」は,一般にテューキーのHSD法テューキー=クレイマー法4と呼ばれる手法による修正を行います。この方法は,検定統計量に修正を加えるタイプの方法です。この方法は,「1要因分散分析」の| 事後検定にある「テューキー」と同じものです。jamoviの初期設定ではこの方法が選択されていることからも想像できるように,この方法は分散分析後の多重比較においてもっとも一般的に用いられている方法です。

シェフェ法

3つ目の「シェフェ」は,分散分析における検定統計量Fを利用して,水準間の平均値の差が有意といえるかどうかを判断する方法です。他の方法で多重比較を行う場合,分散分析で主効果が有意であったのに,多重比較ではどのペアも差が有意でなかったといったことが起こりがちです。それは,分散分析と多重比較はそれぞれ別の考え方に基づく検定方法だからです。

しかし,シェフェ法ではそうしたことがなく,分散分析の結果と一貫したものになることが知られています。また,この方法では各水準のペアについて検定するだけでなく,ある水準と他の複数の水準のグループとの間で比較することも可能なのですが,jamoviではその方法には対応していません。

ボンフェロニ法

4つ目の「ボンフェロニ」は,1つ1つの検定の有意水準を修正することによって多重比較全体での危険率を有意水準未満に抑えようとする方法です。たとえば,サンプルデータの呈示条件のように3つの水準が含まれる要因の主効果が有意になった場合,この3つの水準から2つの水準を取り出す組み合わせは3とおりですので,多重比較は3回行うことになります。ボンフェロニ法の考え方は非常に単純で,このような場合には検定1回あたりの有意水準を全体の水準の1/3にして検定します。つまり,全体の有意水準を5%に保ちたければ,多重比較における1つ1つの検定の有意水準を5%/3=1.67%に設定するのです。

ただし,p値を用いて判断する場合には,0.05を3で割った値を基準とするよりも,算出されたp値を3倍し,その値が0.05未満かどうかという形で判断する方がわかりやすいでしょう。実際,統計ソフトで表示されるボンフェロニ修正後のp値は,元のp値に検定回数を掛けた値として算出されています。その場合には,修正後のp値が0.05未満であれば5%水準で有意という結論になります。

この方法は非常にシンプルでわかりやすく,また応用範囲も広いため,分散分析後の多重比較だけでなく,さまざまな場面で使用されています。

ホルム法

最後の「ホルム」は,ボンフェロニ法と同じく検定1回あたりの有意水準に修正を加える方法です。ボンフェロニ法はシンプルでわかりやすい反面,比較する組み合わせの数が多くなると基準が厳しくなりすぎてしまうという問題があります。たとえば,水準数が5である要因の主効果についての多重比較では,5つの水準から2つずつのペアを作る組み合わせは全部で10とおりになります。すると,その場合のボンフェロニ法修正後のp値は元の値の10倍ということになって,ほとんどの場合に差が有意でなくなります。検定の基準は厳しい方がよい思う人もいるかもしれませんが,重要な差が検出されずに見過ごされてしまうというのは,それはそれで困るのです。

そこでホルム法では,多重比較におけるすべての検定で同じ有意水準を用いるのではなく,検定1回あたりの有意水準の値を段階的に変化させることでこの問題に対処しています。たとえば,多重比較において全部で6回の検定を行い,そして全体の有意水準を5%に抑えたいとします。

その場合,ホルム法ではまず,すべての多重比較で得られたp値を値の小さい順に並べます。そのうえで,一番小さなp値については,ボンフェロニ法と同じくp値に全体の検定回数を掛けた値が0.05未満かどうかで検定を行います。そして2番目に小さなp値については,p値に残りの検定回数(5)を掛けた値を求めます。このとき,計算結果が1回目の検定のp値より小さくなった場合には,1回目の検定のp値をそのまま使用します。

そして,3番目のp値についても残りの検定回数4を掛けた値,4番目のp値については3,5番目のp値には2を掛けた値,という形でp値を修正し,そしてその修正値とその1つ前のp値の大きいほうの値を用いて検定を行います。

たとえば,多重比較で得られたp値を小さい順に並べたとき,その値が「0.001, 0.009, 0.012, 0.026, 0.032, 0.086」というものだったとしましょう。この6つのp値をホルム法とボンフェロニ法で検定した場合の結果を比較する形で示すと表6.3のようになります。

表6.3: ボンフェロニ法とホルム法の比較
ボンフェロニ法
ホルム法
p値 修正p値 判定 p値×検定回数 修正p値 判定
0.001 0.001×6 = 0.006 p<.05 0.001×6 = 0.006 0.006 p<.05
0.009 0.009×6 = 0.054 n.s. 0.009×5 = 0.045 0.045 p<.05
0.012 0.012×6 = 0.072 n.s. 0.012×4 = 0.048 0.048 p<.05
0.026 0.026×6 = 0.156 n.s. 0.026×3 = 0.078 0.078 n.s.
0.032 0.032×6 = 0.192 n.s. 0.032×2 = 0.064 0.078 n.s.
0.086 0.086×6 = 0.516 n.s. 0.086×1 = 0.086 0.086 n.s.
a p<.05:5%水準で有意 n.s.:有意でない

ボンフェロニ法では1番小さなp値だけが有意という結果になるのに対し,ホルム法では3番目のp値までが有意となって,検定結果がかなり異なるのがわかりますね。なお,ホルム法による修正p値の5つ目(下から2つ目)の値は,掛け算の結果では0.064なのですが,この値はその直前の検定で用いられた修正p値より小さな値であるため,5つ目の検定における修正p値は,4番目のものと同じく0.078になります。

効果量

「分散分析」の事後検定では,多重比較についての効果量を算出することもできます。この場合,算出されるのはt検定の場合と同じコーエンのdの値です。また,効果量については「信頼区間」のチェックをオンにすることで信頼区間を算出することもできます。

6.2.9 推定周辺平均

設定画面の| 推定周辺平均には,次の項目が含まれています(図6.43)。

推定周辺平均の設定

図6.43: 推定周辺平均の設定

  • 周辺平均値 周辺平均値の算出対象を指定します。
  • 出力
    • 周辺平均値のグラフ
    • 周辺平均値の表
  • 全般オプション
    • 均等重みづけ
    • 信頼区間 周辺平均値の信頼区間を算出します。
  • グラフ
    • 誤差線
    • 観測値

この設定項目では,推定周辺平均値についての設定を行います。「推定周辺平均値」とは,分散分析で使用した分析モデルに基づいて算出された,各条件の平均値のことです。

この推定周辺平均の設定では,各要因の主効果を「」として指定します。このとき,「」に指定されている要因が1つだけの場合にはその要因の各水準の平均値が,1つの「」に複数の要因が指定されている場合には,それらの要因の交互作用について平均値が算出されます。

今回のサンプルデータの場合,「条件」と「課題」の2つの要因がありますが,それぞれの主効果について水準ごとの周辺平均値を算出したい場合には,項を追加をクリックして「」を増やしたうえで,各「」に「条件」と「課題」を1つずつ設定するようにします。

また,交互作用の周辺平均値のグラフでは,グラフの横軸には最初に指定した要因の水準値が用いられます(図6.44)。平均値のグラフが思ったとおりの形で表示されない場合には,要因の指定順序を変更してみてください。

推定周辺平均値のプロット

図6.44: 推定周辺平均値のプロット

出力

この推定周辺平均値は,図または表,あるいはその両方で示すことができ,「出力」の「周辺平均値のグラフ」にチェックを入れればグラフが,「周辺平均値の表」にチェックを入れれば表が示されます(図6.45)。

推定周辺平均値の表

図6.45: 推定周辺平均値の表

全般オプション

その下の「全般オプション」では,周辺平均値を算出する際に,標本サイズが小さい水準の値を他の水準と同等に扱うかどうかを設定することができます。

均等重みづけ

たとえば,今回のサンプルデータでは「なし・写真」条件の参加者数が他より2人少なくなっています。もし,データそのものから各水準の平均値を求めたとしたら,付加情報「なし」条件の平均値や「写真」課題の平均値は,こうした人数のばらつきによる影響を受けてしまうことになります。

しかし,「推定周辺平均値」は分析モデルに基づいて算出される値ですので,すべての条件で参加者数が等しい場合を想定して各条件の平均値を算出することもできるのです。そのようにして平均値を算出したい場合には,「均等重みづけ」にチェックを入れます。ほとんどの場合,ここはチェックしたままでよいでしょう。

信頼区間

その下にある「信頼区間」の数値入力欄では,推定周辺平均値について算出する信頼区間の幅を変更することができます。

グラフ

設定画面右側の「グラフ」では,推定周辺平均値の図示の方法について設定することができます。

誤差線

まず,「誤差線」の部分では,グラフに示す誤差線にどの値を用いるかを設定します(図6.46)。

誤差線の設定

図6.46: 誤差線の設定

「誤差線」の横のプルダウンメニューで「なし」を選択すると,グラフには平均値の点だけが表示されます。この項目で「信頼区間」を選択すれば,「全般オプション」のところで指定した幅の信頼区間が誤差線として示されます。ここで「標準誤差」を選択した場合には,図に示される誤差線の値には標準誤差が使用されます。

観測値

また,その下の「観測値」にチェックを入れると,推定周辺平均値のグラフに実際のデータを重ねて示すことができます(図6.47)。

グラフに実際のデータを重ねて表示

図6.47: グラフに実際のデータを重ねて表示

6.2.10 保存

設定画面の一番下にある| 保存では,分析結果を新たな変数として保存する方法について設定をすることができます。「分散分析」では,分析データのうち分析モデルで説明しきれなかった部分(残差)を新たな変数として保存することが可能です。分散分析の残差を変数として保存したい場合には,| 保存にある「残差」にチェックを入れてください。


  1. Windows版のjamoviでは,変数名に日本語が含まれている際に正しく分析できません。以下の内容は,サンプルデータの変数名を英数字に変更したうえで実行してください。↩︎

  2. 人数が異なる条件が混じっているのでこのような計算では正確な値は得られませんが,人数の違いはわずかですのでここではこのように単純化して計算します。↩︎

  3. 1/3が「あたり」のくじを何度も繰り返し引いたとき,1回ごとの「あたり」確率は1/3であっても,繰り返し全体での「あたり」確率は1/3を上回ります。たとえば,このくじを2回引いた場合,2回のうち少なくとも1回で「あたり」が出る確率は,2回とも「はずれ」である場合の確率を1(100%)から引いたもの(\(1-2/3\times2/3=0.555\dots\))ですので,1/3を大きく上回ります。↩︎

  4. テューキー=クレイマー法はテューキーの方法に対して各水準間の標本サイズが異なっていても使用可能なように拡張を加えたものです。↩︎