Generalized Linear Mixed Model(一般化線形混合モデル)

GLMM タブでは、グループ構造を持つデータに対してランダム切片モデル g(μi)=xiβ+uj[i]g(\mu_i) = x_i'\beta + u_{j[i]}, ujN(0,σu2)u_j \sim N(0, \sigma_u^2) を実行できます。GLM に変量効果(ランダム効果)を加えた拡張です。数理的な背景はGLMM の基礎を参照してください。

たとえば、複数の学校から生徒のテスト結果を分析する場合、学校ごとの違い(ランダム切片)を考慮しつつ、勉強時間などの固定効果を推定できます。GLM で学校差を無視すると、標準誤差が過小推定され、p 値が実際より小さくなります。

基本的な使い方

GLMM を開く

メニューバーから Analysis > GLMM (Mixed Model)... を選択します。

変数の設定

Dataset で分析対象のデータセットを選択します。

Dependent Variable (Y) で目的変数を選択します。数値型の列のみ選択できます。

Fixed Effects (X) で固定効果の説明変数を選択します。数値型の列のみ選択可能で、カテゴリ変数を使用する場合は事前に Dummy Coding で変換してください。

Group Variable でランダム切片のグループ変数を選択します。カテゴリ変数(名義・順序尺度)または文字列型の列が選択できます。

Distribution Family で分布ファミリーを選択します。GLM と同じ選択肢です:

ファミリー用途
Gaussian (Normal)連続値
Binomial (Logistic)二値データ
Poisson (Count)カウントデータ
Gamma正の連続値

Link Function でリンク関数を選択します。ファミリーに応じたデフォルト(正準リンク)が設定されます。

Include intercept で切片項の有無を設定します(デフォルト: オン)。

詳細オプション

  • Max Iterations: 最適化の最大反復回数(デフォルト: 100)
  • Convergence Tolerance: 収束判定の閾値(デフォルト: 1e-6)

分析の実行

Run GLMM をクリックします。推定アルゴリズムはファミリーによって異なります(詳細)。進捗ダイアログに推定のステージが表示されます。

結果の見方

Random Effects

変量効果の分散成分を表示します。

項目説明
Groupグループ変数の分散 σu2\sigma_u^2 と標準偏差
Residual残差分散 σe2\sigma_e^2 と標準偏差(Gaussian の場合のみ)

Non-Gaussian ファミリーでは残差分散は表示されません。分散パラメータの扱いがファミリーによって異なるためです(Poisson/Binomial は ϕ=1\phi = 1 固定、Gamma は ϕ\phi を profiled deviance から推定)。

ICC(級内相関係数)

ICC はデータの全分散のうち、グループ間の違いが占める割合です(ICC=σu2/(σu2+σe2)\text{ICC} = \sigma_u^2 / (\sigma_u^2 + \sigma_e^2)、Gaussian の場合)。Non-Gaussian ファミリーでの計算方法は GLMM の基礎 を参照してください。

ICC の範囲解釈
0 -- 0.05グループ間の差は小さい
0.05 -- 0.20小〜中程度のグループ効果
0.20 -- 0.50大きなグループ効果
0.50 以上グループ間の差が支配的

この表は Gaussian ファミリーの場合の目安です。Non-Gaussian ファミリーの ICC は潜在尺度で計算されるため、解釈が異なります(GLMM の基礎を参照)。また、ICC だけでなくグループサイズも考慮する必要があります(GLM との使い分けを参照)。

Fixed Effects

固定効果の係数テーブルです。

説明
Variable変数名
Estimate回帰係数 β^\hat\beta
Std. Error標準誤差(Woodbury 公式で (XV1X)1(X'V^{-1}X)^{-1} を計算)
z valueWald 統計量 z=β^/SE(β^)z = \hat\beta / \text{SE}(\hat\beta)
p-value標準正規分布に基づく両側 p 値
95% CIWald に基づく95%信頼区間

係数の解釈は GLM と同じです(リンク関数のスケール)。詳しくは GLM の係数の解釈 を参照してください。

Model Fit

指標説明
Deviance条件付き逸脱度
AIC赤池情報量規準
BICベイズ情報量規準

Gaussian ファミリーでは AIC/BIC は REML ベースのため、固定効果の構成が異なるモデル間での比較に使えません(詳細)。Non-Gaussian ファミリーでは Laplace 近似の周辺対数尤度に基づきます。

BLUP(変量効果の予測値)

各グループのランダム切片の予測値(BLUP)を表示します。グループサイズが小さいほど全体平均に向かって縮小されます(縮小推定の詳細)。

モデルの保存と診断

Model Name にモデル名を入力し Save Model をクリックすると、モデルがプロジェクトに保存されます。保存時に診断用の派生データセットが自動生成されます。

列名内容
fitted_values予測値(固定効果 + ランダム効果)
deviance_residualsDeviance 残差
pearson_residualsPearson 残差
group_random_effectグループのランダム切片(BLUP)

保存後、Open Model DetailsView Diagnostics ボタンが使えるようになります。

注意事項

現在の制約

GLMM の現在の実装はランダム切片モデル((1Group)(1 \mid \text{Group}))のみです。ランダム傾き((xGroup)(x \mid \text{Group}))や交差ランダム効果には対応していません。

GLM との使い分け

ICC が小さければ、グループ構造を無視して GLM で分析しても結果はほぼ変わりません。影響の大きさは ICC だけでなくグループサイズにも依存します。設計効果 DEFF=1+(nˉ1)×ICC\text{DEFF} = 1 + (\bar n - 1) \times \text{ICC} が目安になります(GLMM の基礎を参照)。ICC が大きい場合、GLM では観測間の独立性の仮定に反するため、標準誤差が過小推定されます。GLMM はグループ内の相関を明示的にモデル化することで正しい推論を可能にします。

欠損値の自動除外

欠損値、非数値、無限大を含む行は自動的に除外されます。除外された行数と理由が結果に表示されます。

収束の問題

収束しない場合は以下を確認してください:

  • Max Iterations を増やす(100 → 500)
  • Convergence Tolerance を緩める(1e-6 → 1e-4)
  • グループ数が極端に少ない(2〜3)場合、分散成分の推定が不安定になることがあります
  • 説明変数のスケールが大きく異なる場合は標準化を検討してください(内部的にスケーリングは行われていますが、極端なケースでは初期値の GLM 推定が失敗する可能性があります)

See also

  • GLM - ランダム効果を含まない一般化線形モデル
  • GLMM の基礎 - ランダム効果モデルの数理的背景