Welch's Test
Welch's Test タブでは、3つ以上のグループ間で応答変数の平均に差があるかを検定します。2群の Welch t 検定を k 群に一般化した手法で、群間の分散が等しいことを仮定しません。
基本的な使い方
タブを開く
メニューバーから Analysis > Welch's Test... を選択します。
分析の実行
設定パネルで以下を順に設定します。
- Dataset から分析対象のデータセットを選択
- Factor にカテゴリ変数を選択
- Response Variable に数値変数を選択
- Run Analysis をクリック

データ形式
データはロング形式で、1行が1つの観測に対応する必要があります。ワイド形式のデータは Reshape で変換できます。
帰無仮説
全ての群の母平均が等しいことを検定します。 は群の数です。各群の分散を個別に推定して F* 統計量を計算するため、等分散の仮定は不要です。理論的な背景は仮説検定の考え方を参照してください。
変数の選択
Factor (Categorical): グループを分けるカテゴリ変数を選択します。測定尺度が nominal または ordinal の列が候補になります。
Response Variable (Numeric): 分析対象の数値変数を選択します。測定尺度が interval または ratio の列が候補になります。
Significance Level
Welch の F* 検定と Games-Howell 事後検定の有意水準を設定します。α = 0.10、0.05(デフォルト)、0.01 から選択します。Games-Howell の信頼区間の幅は 1 − α で連動します。
結果の読み方
観測数
結果の先頭に分析に使用した観測数が表示されます。欠損値により除外された行がある場合はその数も表示されます。
Group Statistics
群ごとの記述統計量をまとめたテーブルです。
| 列 | 説明 |
|---|---|
| Group | 群の名前 |
| N | 観測数 |
| Mean | 平均値 |
| SD | 標準偏差(不偏分散の平方根、分母 n − 1) |
| Min | 最小値 |
| Max | 最大値 |
Welch's Test
Welch の F* 検定の結果テーブルです。
| 列 | 説明 |
|---|---|
| F* | 分散の逆数で重み付けした F 統計量。古典的 ANOVA の F 統計量とは異なる |
| df1 | 分子の自由度。k − 1 |
| df2 | 分母の自由度。Satterthwaite 近似による値で、一般に非整数 |
| Pr(>F*) | p 値。帰無仮説が正しいと仮定した場合に、観測された F* 統計量以上に極端な値が得られる確率 |

テーブルの下に、設定した有意水準での帰無仮説の棄却/非棄却の結論が表示されます。
Games-Howell 事後検定
Welch の F* 検定は「少なくとも1つの群の平均が他と異なる」かどうかを検定しますが、どの群間に差があるかは示しません。Games-Howell 事後検定は、全ての群のペアについて平均差を検定します。
F* 検定の結果に関係なく自動的に計算されます。各ペアについて Welch の t 検定と同じ標準誤差と自由度を計算し、studentized range 分布でファミリーワイズエラー率を制御します。計算手順と FWER 制御の詳細は仮説検定の考え方を参照してください。
結果テーブル
| 列 | 説明 |
|---|---|
| Comparison | 比較する2群の組み合わせ |
| Diff | 平均差。Group 1 の平均 − Group 2 の平均 |
| SE | 平均差の標準誤差。各群の分散を個別に使用 |
| t | t 統計量 Diff / SE |
| df | Welch-Satterthwaite 自由度。ペアごとに異なり、一般に非整数 |
| p-value | Studentized range 分布に基づく調整済み p 値 |
| CI Lower / CI Upper | 平均差の同時信頼区間 |

前提条件
Welch's Test と Games-Howell 事後検定は以下を前提とします。
- 独立性: 各観測が互いに独立であること
- 正規性: 各群の応答変数が正規分布に従うこと。サンプルサイズが大きい場合は中心極限定理により、Type I error rate が名目水準から大きく乖離しにくくなる。正規性の診断については仮説検定の考え方を参照
等分散性は仮定しません。群間で分散が異なる場合や、その可能性がある場合にこの検定を使用します。
エラーメッセージ
| メッセージ | 原因と対処 |
|---|---|
| Not enough valid observations (at least 3 required) | 欠損値を除いた有効な観測数が3未満です |
| At least 2 groups are required | 因子変数の水準が1つしかありません |
| Welch ANOVA could not be computed. Each group must have at least 2 observations with non-zero variance. | いずれかの群の観測数が1以下、またはいずれかの群内で全ての値が同一です |
Games-Howell 事後検定が "not available" と表示される場合も、いずれかの群の観測数が2未満または分散がゼロであることが原因です。各群の観測数が2以上あれば分析は実行できますが、Games and Howell (1976) の検証では各群6以上で Type I error rate が名目水準に近いことが確認されています。小標本では結果の解釈に注意してください。
欠損値の処理
因子変数または応答変数に欠損値を含む行は自動的に除外されます。除外された行数は結果パネルに表示されます。
関連ページ
- ANOVA -- 等分散を仮定する一元配置・二元配置の分散分析
- Two-Sample Test / Paired Test -- 2群の比較には t 検定を使用します
- 仮説検定の考え方 -- p 値と検定の背景知識
参考文献
- Games, P. A., & Howell, J. F. (1976). Pairwise multiple comparison procedures with unequal N's and/or variances: A Monte Carlo study. Journal of Educational Statistics, 1(2), 113--125. https://www.jstor.org/stable/1164979
- Welch, B. L. (1951). On the comparison of several mean values: An alternative approach. Biometrika, 38(3/4), 330--336. https://www.jstor.org/stable/2332579