5.1 対応なしt検定

対応なしt検定(独立標本t検定)は,お互いに関連のない(独立な)2つのグループの間で母集団の平均値に統計的な差があるといえるかどうかを確かめたい場合に使用される分析手法です(図5.2)。

対応なしt検定

図5.2: 対応なしt検定

5.1.1 考え方

統計的仮説検定は,推測統計と呼ばれる統計手法を応用したもので,手元にあるデータは関心の対象である集団全体(母集団)から無作為抽出された一部(標本サンプル)であるとみなします(図5.3)。

母集団と標本

図5.3: 母集団と標本

推測統計の詳細については統計法の入門書を参照していただきたいと思いますが,母集団からその一部を標本として無作為抽出したとき,その標本がもつ値(平均値や分散など)は母集団のもつ値(母平均や母分散など)とは必ずしも一致しません。母集団の中から無作為に標本を抽出するということは,標本抽出のたびにそこからとり出される値が異なるということですから,同じ母集団から抽出された標本であっても,その平均値や分散は標本ごとにいくらか異なる値になるためです。

もちろん,標本ごとに平均値や分散が異なるとはいえ,まったくでたらめに異なるわけではなく,そこには確率的な法則性が存在します。たとえば,平均値0,分散1で正規分布する母集団から無作為抽出された標本の平均値は0に近い値になる場合がほとんどで,10や\(-\textsf{8}\)といった値になることは確率的にごくまれです。統計的仮説検定では,こうした母集団と標本の間の確率的な関係を利用しながら,母集団の特徴について判断を行うのです。

対応なしt検定では,「両母集団の平均値は同じである(母集団間の平均値の差は0である)」という仮説(帰無仮説)についての検討を行います。もし2つの母集団(2つのグループ)の平均値が同じであるならば,そこからそれぞれ別々に抽出された標本の平均値もほぼ同じ値になるはずです。にもかかわらず,2グループの標本の平均値が大きく異なっていたとしたら,それは「両母集団の平均値は同じ」という仮説自体に無理があるということになるでしょう。

このような考え方に基づいて,対応なしt検定では,2標本の平均値の差が帰無仮説のもとではあり得ないほど大きなものである場合に帰無仮説を棄却します。このとき,この「あり得なさ」の判断基準となるのが有意確率p)です。このp値は,「帰無仮説が正しい」場合に手元の標本における平均値の差と同じかそれより大きな差が得られる確率を示しており,この値が有意水準 α(一般には0.05)より小さい場合に,帰無仮説が正しくない(つまり2グループの平均値に有意差がある)と判断します。

5.1.2 分析手順

ここでは次のサンプルデータ(ttests_data01.omv)を用いて対応なしt検定の実施方法について見ていきましょう。このデータに含まれている変数は次のとおりです(図5.4)。データファイルには,グループ1とグループ2のそれぞれ20名ずつ,計40名の課題得点データが含まれています。

サンプルデータ

図5.4: サンプルデータ

  • ID 対象者のID
  • グループ 対象者のグループ(1または2
  • 得点 対象者の課題得点

それでは,グループ1とグループ2で,課題得点の平均値に差があるといえるかどうかを検定してみましょう。対応なしt検定を行うには,分析タブの「inline t検定」から「対応なしt検定」を選択します(図5.5)。

対応なしt検定の実行

図5.5: 対応なしt検定の実行

すると,図5.6のような画面が表示されます。設定項目がたくさんあるので,まずは全体的な構成を見ておきましょう。

対応なしt検定の分析設定画面

図5.6: 対応なしt検定の分析設定画面

  • 従属変数 分析対象の変数を指定します。
  • グループ変数 グループの別が入力されている変数を指定します。
  • 検定 分析に用いる検定のタイプを指定します。
  • 仮説 検定に用いる仮説を選択します。
  • 欠損値 データに欠損値が含まれている場合の対処方法を指定します。
  • 追加の統計量 一般的な分析結果に加えて算出したい統計量を指定します。
  • 前提チェック 検定に必要な前提条件が満たされているかどうかの確認を行います。

この分析で必ず設定する必要がある項目は「従属変数」と「グループ変数」の2つです。従属変数は検定対象になる平均値を算出する変数(サンプルデータでは「得点」),グループ変数は比較したいグループの分類基準となる変数(サンプルデータでは「グループ」)です。2つのグループの平均値の差について検定するわけですから,「グループ」と「得点」の指定が必要なのは当然でしょう。

対応なしt検定の分析設定

図5.7: 対応なしt検定の分析設定

この2つを設定すると,すぐにそれが分析結果に反映されます(図5.8)。

対応なしt検定の分析結果

図5.8: 対応なしt検定の分析結果

結果の表の一番左(「得点」)は従属変数の名前,左から2番目は検定方法の名前です。対応なしt検定にはスチューデントの検定ウェルチの検定と呼ばれる2とおりの方法があり,ここに「スチューデントのt」と示されていれば,それはスチューデントの検定の結果であるということを示しています。

その隣の「統計量」の列は検定統計量(ここではスチューデントのt),その隣は「自由度」,「p」は有意確率(p値)です。このpが有意水準(一般にはα=0.05)より小さい場合に「差が有意」と判断します。ここで表示されている結果ではp=0.024ですから,グループ1と2の平均値の間には統計的に有意な差があるということになります。

さて,ほとんどの場合,これで「対応なしt検定」はおしまいです。拍子抜けするくらいに簡単ですね。

5.1.3 分析の詳細設定

先ほど見たように,jamoviを用いたt検定では設定らしい設定が不要で,分析の実行は驚くほど簡単なのですが,場合によっては分析設定の変更が必要になる場合があるかもしれません。そこで,ここでは対応なしt検定における設定の詳細について見ておくことにしましょう。

検定

検定」には,以下の項目が含まれています(図5.9)。ここでは,t検定における検定統計量の算出方法について設定を行います。

「検定」の設定項目

図5.9: 「検定」の設定項目

  • スチューデント法 スチューデント(Student)の検定による検定結果を表示します。
    • ベイズ因子 帰無仮説と対立仮説の間でベイズ因子を算出します。
  • ウェルチ法 ウェルチ(Welch)の検定による検定結果を表示します。
  • マン=ホイットニーのU マン=ホイットニー(Mann-Whitney)のU検定の結果を表示します。
スチューデント法

この項目がチェックされている場合,スチューデントのt検定を用いた検定結果が表示されます。スチューデントのt検定では,平均値の差について検討する2つの母集団は平均値だけでなく分散も等しいという仮定のもとで検定統計量を算出します。そのため,一般には「2つの母集団で分散が等しい」という仮定から大きく逸脱しないデータで検定する際の方法として使用されています。

この項目に含まれる「ベイズ因子」は,ベイズ統計の考え方を用いて仮説検定をする際に用いられる値です。この値は,対立仮説の確からしさと帰無仮説の確からしさを比で表したもので,この値が1の場合には帰無仮説と対立仮説の確からしさが同じであることを,1未満の場合には帰無仮説の方が,1より大きい場合には対立仮説の方が確からしいことを意味します。一般には,このベイズ因子の値が3.0以上である場合に,帰無仮説を棄却して対立仮説を採択します1

このベイズ因子の項目にある「事前分布」はベイズ因子の算出に使用されるもので,これは事前分布に関する設定値です。この値は初期値では「\(\sqrt{2}/2=0.707\)」に設定されています。ベイズ因子の算出にチェックを入れた場合,ベイズ因子の隣にその推定誤差(±%)も表示されます。

ウェルチ法

スチューデントの検定では2つの母集団で分散が等しいという仮定を用いて検定統計量を算出しますが,ウェルチのt検定ではそうした前提を設けずに検定統計量を算出します。そのため,一般にこの方法は2つの母集団で分散が異なっている場合に用いられます。

ウェルチの検定の項目にチェックを入れた場合,結果の表では「ウェルチのt」の行にその分析結果が表示されます。ウェルチの検定では,多くの場合,自由度が整数でなく,小数値を含んだものになります。

マン=ホイットニーのU

t検定は母集団の分布が正規分布であるという前提のもとで計算を行います。しかし実際のデータでは,このような前提が成り立たない場合,あるいは成り立つかどうかが不明な場合というのもあり得ます。

これに対し,マン=ホイットニーのU検定は,母集団の分布の形に特別な仮定を設けずに検定を行うため,正規分布でないようなデータであっても分析が可能になります。このような方法は,ノンパラメトリック検定と呼ばれます。

「マン=ホイットニーのU」にチェックを入れた場合,その結果は「マン=ホイットニーのU」の行に表示されます。

仮説

仮説」には,次の項目が含まれています(図5.10)。

Hypothesis(仮説)の設定項目

図5.10: Hypothesis(仮説)の設定項目

  • グループ1 ≠ グループ2 グループ1とグループ2で平均値が異なるかどうかを検定します(両側検定)
  • グループ1 > グループ2 グループ1の平均値がグループ2の平均値より大きいかどうかを検定します(片側検定)
  • グループ1 < グループ2 グループ1の平均値がグループ2の平均値より小さいかどうかを検定します(片側検定)

ここでは検定に使用する対立仮説の設定を行います。一般に,t検定における対立仮説には「グループ1 ≠ グループ2」が用いられます。この対立仮説は,2つのグループで平均値が異なるということのみを示しており,グループ1とグループ2のどちらの平均値が大きいかまでは述べていません。この場合,グループ1の平均値がグループ2の平均値より大きくても小さくても検定結果が有意になります。このような検定方法は両側検定と呼ばれます。

これに対し,「グループ1 > グループ2」はグループ1の平均値がグループ2より大きい場合のみ,「グループ1 < グループ2」はグループ1の平均値がグループ2より小さい場合のみ検定結果が有意になります。このように,一方のグループの平均値がもう一方よりも大きいかどうかのみ,あるいは小さいかどうかのみを確かめる検定方法は片側検定と呼ばれます。

欠損値

欠損値」には,次の項目が含まれています(図5.11)。

Missing values(欠損値)の設定項目

図5.11: Missing values(欠損値)の設定項目

  • 分析ごとに除外
  • 行全体を除外

ここでは,データに欠損値があった場合にどう対処するかについての設定を行います。この設定は,同時に複数の変数について平均値の検定を行う場合にのみ影響します。

分析ごとに除外

ここで「分析ごとに除外」を選択した場合,それぞれの検定において欠損値を分析から除外します。2種類の変数XとYについてグループ1とグループ2で平均値に差があるかどうかを検定している場合で,ある対象者のXの値が欠落している場合,Xの平均値の検定においてはその対象者のデータは分析から除外されますが,Yの平均値の検定でその対象者のデータが分析から除外されることはありません。

行全体を除外

これに対し,「行全体を除外」を選択した場合には,XまたはYのいずれかの値が欠落している対象者のデータは,XとYの両方の検定で分析から除外されます。

追加の統計量

追加の統計量」には,以下の項目が含まれています(図5.12)。

Additional Statistics(追加の統計量)の設定項目

図5.12: Additional Statistics(追加の統計量)の設定項目

  • 平均値の差 グループ間の平均値の差とその標準誤差を算出します。
    • 信頼区間 平均値の差の信頼区間を算出します。
  • 効果量 平均値の差についての効果量を算出します。
    • 信頼区間 効果量の信頼区間を算出します。
  • 記述統計 従属変数について,グループごとの記述統計量を算出します。
  • 記述統計量のグラフ 従属変数の平均値と中央値についてのグラフを作成します。
平均値の差

「平均値の差」にチェックを入れると,2グループ間の平均値の差の値と,その標準誤差が表示されます。なお,t検定の検定統計量(t)は,この「グループ間の平均値の差」を標準誤差で割ることによって算出されます。

その下にある「信頼区間」にチェックを入れると,平均値の差の信頼区間(下限および上限)が算出されます。信頼区間の幅は初期設定では95%になっていますが,数値を変更すれば99%信頼区間などを算出することも可能です。

効果量

「効果量」にチェックを入れると,平均値の差についての効果量が算出されます。また,その下にある「信頼区間」にチェックを入れると,その効果量についての信頼区間が算出できます。なお,t検定に対する効果量としては「コーエンのd(Cohen’s d)」が,マン=ホイットニーのU検定に対する効果量としては「順位双列相関係数」が算出されます。

平均値の検定で検定統計量として用いられるtは,「差の大きさ」を表す値ではありません。この値は平均値の差を標準誤差で割って求められますが,標準誤差は標本サイズが大きくなるほど小さくなるため,標本サイズの大きなデータを対象とした検定では,平均値の差が実質的に無意味なほど小さなものであっても結果が有意になる場合があるのです。

これに対し,コーエンのdという統計量は,平均値の差が標準偏差の何倍の大きさであるかを示した値です。標準誤差と違い,標準偏差は標本サイズの大小によって極端に変わるようなことがありません。そのため,どのような標本データに対しても「差の大きさ」を安定的に評価できるのです。このdの値(の絶対値)が大きいほど,平均値の差が大きいことを意味します。コーエンのdの大きさの解釈については,一般に表5.1のような目安が用いられています。APAの論文執筆マニュアル第7版日本心理学会の論文執筆・投稿の手びきに見られるように,近年では分析結果で効果量を示すよう求められることが多くなってきています。

表5.1: 効果量dの解釈の目安
dの値 効果の大きさ
0.8
0.5
0.2

なお,マン=ホイットニーのU検定の場合には効果量として順位双列相関係数という値が算出されます。これは,順序データと2値データの間の相関係数です。順位双列相関係数の解釈の仕方は,基本的にはピアソンの積率相関係数と同様です。

記述統計

追加の統計量」にある「記述統計」にチェックを入れると,分析対象の変数(従属変数)について,グループごとの平均値や標準偏差などの記述統計量が算出されます(図5.13)。

グループごとの記述統計量

図5.13: グループごとの記述統計量

記述統計量のグラフ

また,その下の「記述統計量のグラフ」にチェックを入れると,グループごとの平均値および中央値が図5.14のようなグラフで示されます。

グループごとの記述統計量のグラフ

図5.14: グループごとの記述統計量のグラフ

前提チェック

「前提チェック」には,次の項目が含まれています(図5.15)。

前提チェック

図5.15: 前提チェック

  • 等質性検定 分散の等質性についての検定を実施します。
  • 正規性検定 分布の正規性についての検定を実施します。
  • Q-Qプロット 正規Q-Qプロットを作成します。

対応なしt検定では,分析対象となる母集団の分布についていくつかの仮定(前提)を設けることによって計算を効率化しているため,それらの前提を満たしていないデータに対しては分析結果の信頼性が低くなります。t検定の前提条件についての詳細は統計法の教科書などを参照してもらうこととして,ここではそれらのうち,jamoviの設定項目と関連する2つの前提について見ておきます。

等質性検定

まず,1つ目の「等質性検定」ですが,これは2つのグループで分散が等しいかどうかについて確かめるものです。スチューデントの検定では,2つのグループで分散が等しいことを前提として検定統計量を算出します。そのため,2群の分散が極端に異なる場合には,正確な検定結果を得ることができません。そこで,2つのグループで分散が極端に異ならないかどうかを検定するのがこの設定項目です。

この「等質性検定」にチェックを入れると,図5.16のような形でルビーン検定(Levene検定)と呼ばれる分散の等質性検定の結果が表示されます。

分散の等質性検定

図5.16: 分散の等質性検定

この表の「F」の値は,2つのグループにおける分散の比で,この値が1であれば2群の分散が等しいことを,1より極端に大きければ,2群で分散が大きく異なることを意味します。一般には,このFについての有意確率(p)が0.05未満,または0.10未満の場合に2つのグループで分散が異なると判断します。この検定の結果が有意であった場合,スチューデントの検定の前提条件が満たされないことになりますので,その場合にはウェルチの検定を用いることになります。

正規性検定

前提チェックの2つ目の項目である「正規性検定」は,分析対象のデータが正規分布からかけ離れていないかどうかを確かめるものです。対応なしのt検定では,データの母集団が正規分布であることを前提としていますので,この前提が満たされない場合には,母集団に正規分布を仮定しないマン=ホイットニーのUなどのノンパラメトリックな手法を用いる必要があります。

そこでjamoviでは,シャピロ=ウィルク検定(Shapiro-Wilk検定)と呼ばれる手法を用いて正規性の検定を行います。この検定は,「標本データは正規分布する母集団から無作為抽出されたものである」という帰無仮説について検定を行います。一般に,この分析結果のp値が0.05未満の場合に,データの母集団が正規分布でないとみなします(図5.17)。

正規性検定

図5.17: 正規性検定

Q-Qプロット

前提チェックの3つ目の項目である「Q-Qプロット」は,標本データが正規分布からかけ離れていないかどうかを視覚的に確認するための手法です。正規分布する母集団から無作為抽出された標本は,母集団と同じく正規分布になるという数学的な性質がありますので,標本データが正規分布からかけ離れている場合には,母集団の分布も正規分布でない可能性が高まります。

「Q-Qプロット」の項目にチェックを入れると,出力ウィンドウに次のようなグラフが表示されます。このQ-Qプロットと呼ばれる図では,横軸に理論的な分位数,縦軸に標準化残差をとって,各測定値をグラフ上にプロットします。このとき,データが正規分布している場合には,すべての測定値は直線上に並ぶことになります。そのため,このQ-Qプロットで各測定値を示す点が直線から極端に離れていなければ,標本データはほぼ正規分布しているということになり,その母集団も正規分布である可能性が高まります。

Q-Qプロット

図5.18: Q-Qプロット

例題データの場合,両端のデータ点が直線からやや外れた位置にありますが,それ以外はほぼ直線上にあるので,正規分布から極端に離れていることはなさそうです。


  1. jamoviのt検定におけるベイズ因子は「対立仮説(H\(_1\)):帰無仮説(H\(_0\))」の比(BF\(_{10}\))の形で示されています。「帰無仮説(H\(_0\)):対立仮説(H\(_1\))」の比(BF\(_{01}\))として示されている場合には,ベイズ因子の値が0に近いほど対立仮説が確からしいことを意味します。↩︎