ARIMA の次数選択

ARIMA(p,d,q) の自動次数選択は、差分次数 $d$ と AR/MA 次数 $p, q$ を別々の基準で決めます。 $p, q$ は AIC または BIC で選び、 $d$ は KPSS 水準定常性検定で選びます。 $d$ を AIC/BIC で選ばないのには理由があります。このページではその根拠と、MIDAS が採る手続きを説明します。操作方法は Agent API の ARIMA を参照してください。

差分次数 d を AIC/BIC で選べない理由

ARIMA(p,d,q) の対数尤度は、 $d$ 階差分した系列 $\Delta^d y$ の上で計算します。応答変数は $d$ ごとに $y$ 、 $\Delta y$ 、 $\Delta^2 y$ と入れ替わり、尤度に入る観測数も $N$ 、 $N-1$ 、 $N-2$ と変わります。

AIC は次の量です:

\text{AIC} = -2\,\ell(\hat\theta) + 2k

これは応答変数と標本を固定したときに、当てはめたモデルと真の分布の Kullback-Leibler 乖離を推定する量です。 $d$ が変わると応答変数そのものと観測数が変わるため、 $d$ をまたいだ AIC の差は比較対象になりません。差分はラグ多項式 $(1-B)^d$ による変換でヤコビアン行列式が 1 なので補正項では埋められず、条件付き尤度を異なる点数で評価していること自体が比較を壊します。BIC も同じ理由で $d$ をまたいで比較できません。 $d$ は in-sample の尤度以外の基準で決める必要があります。

厳密に比較するなら

$d$ をまたいで情報量規準を比較できる唯一の方法は、すべての候補について元の未差分系列 $y$ の厳密尤度を、同じ応答・同じ観測数で計算することです。ARIMA(p,d,q) を「単位円上に $d$ 個の根を固定した ARMA( $p+d$ , $q$ )」とみなせば、形式上は同じ $y$ 上の尤度になります。

ただし単位根を持つモデルは非定常で、周辺分布の分散が発散するため無条件尤度が定義できません。尤度を定義するには拡散事前分布で初期化したカルマンフィルタが要り、和分過程に対する AIC の漸近論自体も成り立ちが弱くなります。ほとんどの ARIMA 実装が「先に差分してから当てはめる」のはこのためで、ここを実装しても結論は変わりません。

d は単位根がいくつあるかという問い

何回差分するかは、系列が確率的トレンド（単位根）を何個持つかと同じ問いです。これは「ある定常系列にどの ARMA 構造が当てはまるか」という AIC が答える問いとは別のものです。単位根の有無を測る診断で $d$ を決め、AIC/BIC は同一 $d$ のもとでの $p, q$ 選択に使えば、それぞれの基準を本来答えられる問いに割り当てられます。

KPSS 水準定常性検定で d を決める

MIDAS は $d$ を KPSS 検定で決めます。KPSS は Kwiatkowski, Phillips, Schmidt, Shin が 1992 年に提案した検定で、帰無仮説が水準定常性、対立仮説が単位根です。帰無仮説が単位根である ADF 検定とは逆の構成です。この向きの違いが効きます。ADF は単位根近傍で検出力が低く、単位根に近い定常系列を差分しがちです。KPSS は定常性に反する積極的な証拠を要求するため、差分に対して保守的です。

検定統計量は次のように計算します。系列を平均で中心化した残差 $e_t = y_t - \bar y$ から、

\eta = \frac{1}{n^2}\sum_{t=1}^{n} S_t^2, \qquad S_t = \sum_{i=1}^{t} e_i

を作り、Bartlett カーネルで長期分散を推定します:

\hat s^2 = \frac{1}{n}\sum_{t=1}^{n} e_t^2 + \frac{2}{n}\sum_{i=1}^{\ell}\left(1 - \frac{i}{\ell+1}\right)\sum_{t=i+1}^{n} e_t\,e_{t-i}, \qquad \ell = \left\lfloor 4\,(n/100)^{1/4} \right\rfloor

統計量は $\hat\eta / \hat s^2$ です。差分次数は $d=0$ から始め、統計量が判定閾値を超える間だけ差分して $d$ を増やし、超えなくなるか上限 $\text{maxD}$ に達したら止めます。MIDAS は判定閾値に KPSS 統計量の漸近帰無分布の 5% 臨界値 $0.463$ を使います。これは絶対的な基準ではなく、差分するかどうかを決める固定の定数です。差分後に分散がほぼ 0 になった系列は定常とみなして止めます。

逐次手続きの正当性と閾値の役割

真の過程が単位根を $d_0$ 個持つとき、この手続きは次のように振る舞います。 $d < d_0$ では差分後の系列に確率的トレンドが残り、KPSS 統計量は標本数とともに発散するので、ほぼ確実に差分が進みます。 $d = d_0$ では系列が定常になり、KPSS は漸近的に正しい大きさ $\alpha$ を持ちます。 $d_0$ を超えて差分した系列は定常なので帰無仮説が成り立ち、手続きは自然に止まります。

結果として、手続きは漸近的に真の $d_0$ で確率 $1-\alpha$ で止まり、確率およそ $\alpha$ で 1 階だけ過剰差分します。閾値に対応する $\alpha$ は、過剰差分の漸近確率をそのまま制御するパラメータです。

$\alpha$ に理論的な最適値はありません。過小差分は確率的トレンドをモデルに残し、当てはめたモデルが非定常になって予測区間の較正が崩れます。過剰差分は単位根を持つ非可逆な MA 成分と余分なパラメータを持ち込みますが、害は相対的に小さいとされます。この損失の非対称性が、慣行的な 5%（ $\alpha = 0.05$ ）の根拠です。実務的な $\alpha$ の範囲 $0.01$ から $0.10$ はどれも漸近過剰差分率 1% から 10% に収まり、差分次数を AIC で選んだときの系統的な過剰差分とは性質が異なります。

留保が 3 つあります。1 つ目は、MIDAS が使う KPSS が水準（定数項のみ）定常性を帰無仮説とする点です。決定論的な線形トレンドだけを持ち単位根を持たない系列（トレンド定常）では、中心化した残差にトレンドが残って統計量が標本数とともに発散するため、真の差分次数が 0 でも差分されます。上の「確率およそ $\alpha$ で過剰差分」は確率的トレンドを持つ過程についての話で、決定論的トレンドにはあてはまりません。トレンド定常が疑われる系列は、差分ではなくトレンド項のモデル化や事前のトレンド除去を検討してください。2 つ目は、KPSS が有限標本でサイズに歪みを持ち、強い短期自己相関があると長期分散の推定次第で過剰に棄却する点です。 $\text{maxD}$ の上限がこの暴走を抑えます。3 つ目は、選ばれた $d$ がデータに依存する確率変数になる点です。後続の係数の信頼区間は、選ばれた次数を所与とした条件付きの区間になります。これは KPSS 固有の性質ではなく、あらゆる自動次数選択に共通します。

MIDAS での扱い

自動選択では、 $d$ を KPSS で決めてから $p, q$ を同一 $d$ のもとで AIC または BIC で選びます。手動で次数を指定したときは、指定した $d$ をそのまま使います。

MIDAS は選ばれた $d$ と、統計量が判定閾値を上回ったか下回ったかという操作的な事実だけを示します。p 値や有意・非有意の判定は表示しません。

参考文献

Hyndman, R. J., & Khandakar, Y. (2008). Automatic time series forecasting: The forecast package for R. Journal of Statistical Software, 27(3), 1-22. https://www.jstatsoft.org/article/view/v027i03

このページの Markdown 版もあります。