Generalized Linear Mixed Model(一般化線形混合モデル)
GLMM タブでは、グループ構造を持つデータに対してランダム切片モデル , を実行できます。GLM に変量効果(ランダム効果)を加えた拡張です。数理的な背景はGLMM の基礎を参照してください。
たとえば、複数の学校から生徒のテスト結果を分析する場合、学校ごとの違い(ランダム切片)を考慮しつつ、勉強時間などの固定効果を推定できます。GLM で学校差を無視すると、標準誤差が過小推定され、p 値が実際より小さくなります。
基本的な使い方
GLMM を開く
メニューバーから Analysis > GLMM (Mixed Model)... を選択します。
変数の設定
Dataset で分析対象のデータセットを選択します。
Dependent Variable (Y) で目的変数を選択します。数値型の列のみ選択できます。
Fixed Effects (X) で固定効果の説明変数を選択します。数値型の列のみ選択可能で、カテゴリ変数を使用する場合は事前に Dummy Coding で変換してください。
Group Variable でランダム切片のグループ変数を選択します。カテゴリ変数(名義・順序尺度)または文字列型の列が選択できます。
Distribution Family で分布ファミリーを選択します。GLM と同じ選択肢です:
| ファミリー | 用途 |
|---|---|
| Gaussian (Normal) | 連続値 |
| Binomial (Logistic) | 二値データ |
| Poisson (Count) | カウントデータ |
| Gamma | 正の連続値 |
Link Function でリンク関数を選択します。ファミリーに応じたデフォルト(正準リンク)が設定されます。
Include intercept で切片項の有無を設定します(デフォルト: オン)。
詳細オプション
- Max Iterations: 最適化の最大反復回数(デフォルト: 100)
- Convergence Tolerance: 収束判定の閾値(デフォルト: 1e-6)
分析の実行
Run GLMM をクリックします。推定アルゴリズムはファミリーによって異なります(詳細)。進捗ダイアログに推定のステージが表示されます。
結果の見方
Random Effects
変量効果の分散成分を表示します。
| 項目 | 説明 |
|---|---|
| Group | グループ変数の分散 と標準偏差 |
| Residual | 残差分散 と標準偏差(Gaussian の場合のみ) |
Non-Gaussian ファミリーでは残差分散は表示されません。分散パラメータの扱いがファミリーによって異なるためです(Poisson/Binomial は 固定、Gamma は を profiled deviance から推定)。
ICC(級内相関係数)
ICC はデータの全分散のうち、グループ間の違いが占める割合です(、Gaussian の場合)。Non-Gaussian ファミリーでの計算方法は GLMM の基礎 を参照してください。
| ICC の範囲 | 解釈 |
|---|---|
| 0 -- 0.05 | グループ間の差は小さい |
| 0.05 -- 0.20 | 小〜中程度のグループ効果 |
| 0.20 -- 0.50 | 大きなグループ効果 |
| 0.50 以上 | グループ間の差が支配的 |
この表は Gaussian ファミリーの場合の目安です。Non-Gaussian ファミリーの ICC は潜在尺度で計算されるため、解釈が異なります(GLMM の基礎を参照)。また、ICC だけでなくグループサイズも考慮する必要があります(GLM との使い分けを参照)。
Fixed Effects
固定効果の係数テーブルです。
| 列 | 説明 |
|---|---|
| Variable | 変数名 |
| Estimate | 回帰係数 |
| Std. Error | 標準誤差(Woodbury 公式で を計算) |
| z value | Wald 統計量 |
| p-value | 標準正規分布に基づく両側 p 値 |
| 95% CI | Wald に基づく95%信頼区間 |
係数の解釈は GLM と同じです(リンク関数のスケール)。詳しくは GLM の係数の解釈 を参照してください。
Model Fit
| 指標 | 説明 |
|---|---|
| Deviance | 条件付き逸脱度 |
| AIC | 赤池情報量規準 |
| BIC | ベイズ情報量規準 |
Gaussian ファミリーでは AIC/BIC は REML ベースのため、固定効果の構成が異なるモデル間での比較に使えません(詳細)。Non-Gaussian ファミリーでは Laplace 近似の周辺対数尤度に基づきます。
BLUP(変量効果の予測値)
各グループのランダム切片の予測値(BLUP)を表示します。グループサイズが小さいほど全体平均に向かって縮小されます(縮小推定の詳細)。
モデルの保存と診断
Model Name にモデル名を入力し Save Model をクリックすると、モデルがプロジェクトに保存されます。保存時に診断用の派生データセットが自動生成されます。
| 列名 | 内容 |
|---|---|
fitted_values | 予測値(固定効果 + ランダム効果) |
deviance_residuals | Deviance 残差 |
pearson_residuals | Pearson 残差 |
group_random_effect | グループのランダム切片(BLUP) |
保存後、Open Model Details と View Diagnostics ボタンが使えるようになります。
注意事項
現在の制約
GLMM の現在の実装はランダム切片モデル()のみです。ランダム傾き()や交差ランダム効果には対応していません。
GLM との使い分け
ICC が小さければ、グループ構造を無視して GLM で分析しても結果はほぼ変わりません。影響の大きさは ICC だけでなくグループサイズにも依存します。設計効果 が目安になります(GLMM の基礎を参照)。ICC が大きい場合、GLM では観測間の独立性の仮定に反するため、標準誤差が過小推定されます。GLMM はグループ内の相関を明示的にモデル化することで正しい推論を可能にします。
欠損値の自動除外
欠損値、非数値、無限大を含む行は自動的に除外されます。除外された行数と理由が結果に表示されます。
収束の問題
収束しない場合は以下を確認してください:
- Max Iterations を増やす(100 → 500)
- Convergence Tolerance を緩める(1e-6 → 1e-4)
- グループ数が極端に少ない(2〜3)場合、分散成分の推定が不安定になることがあります
- 説明変数のスケールが大きく異なる場合は標準化を検討してください(内部的にスケーリングは行われていますが、極端なケースでは初期値の GLM 推定が失敗する可能性があります)