生存分析

MIDAS は2つの生存分析手法に対応しています。

  • Kaplan-Meier: 生存曲線の推定と群間比較(Log-rank 検定)。群ごとの生存時間の違いを視覚的に確認し、差の有無を検定します
  • Cox 回帰: 共変量がハザードに与える効果の推定。複数の変数が生存時間に与える影響を同時に評価します

数理的な背景は生存分析の基礎を参照してください。

データの準備

生存分析には2つの変数が必要です。

  • 時間変数: イベント発生までの時間(数値型)
  • イベント変数: イベントが発生したかどうかを示す変数。以下の形式に対応しています:
    • 数値型: 1 = イベント発生、0 = 打ち切り
    • boolean 型: true = イベント発生、false = 打ち切り

打ち切りの扱いについては生存分析の基礎を参照してください。

Kaplan-Meier

Kaplan-Meier 法はノンパラメトリックな生存関数の推定法です(定式化)。

基本的な使い方

  1. メニューバーから Analysis > Kaplan-Meier... を選択
  2. Time Variable で時間変数を選択
  3. Event Variable でイベント変数を選択
  4. 群間比較をする場合は Group Variable でカテゴリ変数を選択
  5. Run Analysis をクリック

Kaplan-Meier フォーム設定

結果の見方

群間比較の結果(生存曲線、Summary Statistics、Number at Risk、Log-rank 検定)

生存曲線

横軸に時間、縦軸に生存確率 S(t)S(t) をプロットします。ステップ関数で表示され、イベント発生時点で確率が低下します。打ち切りが発生した時点には曲線上に + マークを表示します。ステップが下がらない区間に + マークがあれば、その期間に打ち切りで対象者が減ったことを示します。各時点の信頼区間を連ねた信頼帯(デフォルト95%、pointwise)も表示されます。pointwise 信頼帯は各時点で個別に構成した区間であり、曲線全体の同時被覆を保証するものではありません。信頼区間は log 変換法で計算されます(詳細)。

信頼水準は Confidence Level スライダーで変更できます。

Summary Statistics

説明
Group群名(Group Variable 指定時)
n観測数
Eventsイベント発生数
Median生存時間の中央値。S(t)=0.5S(t) = 0.5 となる時間です。観測期間内に到達しない場合は NR (Not Reached) と表示されます

中央値の信頼区間は現在報告されません。

Number at Risk

各時間点でリスク集合(その時点でまだイベントを経験しておらず、打ち切られてもいない対象者の数)を表示します。

Log-rank 検定

Group Variable を指定した場合に表示されます。帰無仮説「全群のハザード関数が等しい」を検定します。Log-rank 検定は比例ハザード仮定のもとで最も検出力が高くなります。生存曲線が交差するような状況では検出力が下がります(詳細)。

項目説明
Chi-squared検定統計量
df自由度(= 群数 - 1)
p-valuep 値

群ごとの観測イベント数(Observed)と、帰無仮説のもとで期待されるイベント数(Expected)、およびその比(O/E)も表示されます。O/E > 1 の群は帰無仮説の下で期待されるよりイベントが多く発生したことを示します。

注意事項

  • 時間変数またはイベント変数に欠損値を含む行は自動的に除外されます

レポートへの追加

Add to Report ボタンで生存曲線をレポートに追加できます。

Cox 回帰

Cox 比例ハザードモデルは、共変量がハザードに与える効果を推定するセミパラメトリックモデルです(定式化と理論)。

基本的な使い方

  1. メニューバーから Analysis > Cox Regression... を選択
  2. Time Variable で時間変数を選択
  3. Event Variable でイベント変数を選択
  4. Covariates で共変量を1つ以上選択(数値型のみ)
  5. Run Analysis をクリック

カテゴリ変数を共変量として使うには、事前に Dummy Coding で数値変換してください。

Cox 回帰フォーム設定

結果の見方

Cox Proportional Hazards Regression

Cox Proportional Hazards Regression セクション

上段の係数テーブルには共変量ごとに以下の列が表示されます。

説明
Variable変数名
Coef回帰係数 β\beta
HRハザード比 exp(β)\exp(\beta)
CIハザード比の信頼区間。列ヘッダは選択した信頼水準に応じて変わります(例: "95% CI")
zWald 統計量
p-valuep 値

ハザード比が1より大きい場合、その共変量が増えるとハザードが上昇します。1より小さい場合はハザードが低下します。詳しい解釈は生存分析の基礎を参照してください。

下段には3種類の検定統計量が報告されます。

指標説明
Likelihood Ratio Test尤度比検定(帰無仮説: 全 β=0\beta = 0)。有限標本では一般に最も安定した結果を与えます
Wald TestWald 検定(帰無仮説: 全 β=0\beta = 0)。推定された共分散行列に基づきます
Score Testスコア検定(β=0\beta = 0 での評価)。収束に問題がある場合でも計算できます

3つの検定は漸近的に等価で、大標本では同様の結果を与えます。有限標本で結果が異なる場合は尤度比検定を優先してください。Wald 検定は最尤推定値での対数尤度の曲率に基づく局所近似であり、係数が大きい場合や尤度面が非対称な場合に不正確になることがあります。Score 検定は β=0\beta = 0 での評価であり、真の値が 0 から離れている場合に近似精度が下がります。尤度比検定は帰無モデルと適合モデルの対数尤度の差に基づくため、局所近似に依存しません(詳細)。

比例ハザード仮定の診断

比例ハザード仮定の診断(Grambsch-Therneau 検定、Schoenfeld 残差プロット、Log-Log プロット)

係数テーブルと適合度指標の下に、比例ハザード仮定の診断結果が表示されます。Cox モデルは共変量の効果が時間によらず一定であること、すなわち比例ハザード仮定を前提としています(詳細)。この仮定が崩れると、β\beta は時間を通じた加重平均としてしか解釈できなくなります。

Grambsch-Therneau 検定

スケーリング済み Schoenfeld 残差と時間の関連を検定します(Grambsch & Therneau, 1994)。時間変換として KM 変換 g(t)=1S^(t)g(t) = 1 - \hat{S}(t^-) を使用します。

説明
Variable変数名。GLOBAL は全共変量の同時検定
rhoスケーリング済み Schoenfeld 残差と Kaplan-Meier 推定に基づく時間変換値の相関係数。0 に近いほど仮定と整合的です
Chi-Squared検定統計量
df自由度。各共変量は 1、GLOBAL は共変量数
p-valuep 値

p 値が事前に設定した有意水準を下回る共変量は、比例ハザード仮定の棄却を意味します。その共変量の効果が時間とともに変化していると判断されます。共変量が複数ある場合はまず GLOBAL の結果を確認してください。GLOBAL が棄却されない場合、個別の共変量で偶然小さい p 値が出ている可能性があります。

Scaled Schoenfeld Residuals

共変量ごとに、スケーリング済み Schoenfeld 残差を時間に対してプロットします。赤い曲線は LOESS による局所回帰線、灰色の破線は推定された係数 β^\hat\beta です。比例ハザード仮定が成り立つ場合、残差は β^\hat\beta の周りにランダムに散らばり、LOESS 線は水平に近くなります。LOESS 線が右上がりや右下がりの傾向を示す場合、その共変量の効果が時間とともに変化していることを示します。視覚的な判断が難しい場合は、上の Grambsch-Therneau 検定の p 値を参照してください。

Log-Log Survival Plot

群別の Kaplan-Meier 推定値を log(log(S^(t)))\log(-\log(\hat{S}(t)))log(t)\log(t) にプロットします。Grouping Variable ドロップダウンでグルーピングに使う共変量を選択してください。連続変数は視覚的な確認のために中央値で2群に分割されます。この分割は便宜的なもので、連続変数の情報を一部失います。比例ハザード仮定の下では曲線は近似的に平行になります。曲線が交差する、または時間の経過とともに曲線間の距離が広がったり縮まったりする場合は仮定の違反を示唆します。

比例ハザード仮定が棄却された場合の対処法として層別 Cox モデルや時間依存共変量モデルがありますが、MIDAS は現在これらに対応していません。仮定の違反が確認された場合は、違反の程度と分析目的を踏まえて結果の解釈に注意してください。

注意事項

  • 収束しなかった場合、結果に警告が表示されます。収束しない場合でも Score 検定は計算されるため、モデルの有用性を判断する手がかりになります
  • 時間変数、イベント変数、共変量のいずれかに欠損値を含む行は自動的に除外されます。除外された行数は結果の n(観測数)と元データの行数を比較して確認できます

See also

参考文献

  • Grambsch, P. M. and Therneau, T. M. (1994). Proportional hazards tests and diagnostics based on weighted residuals. Biometrika, 81(3), 515--526. https://www.jstor.org/stable/2337123