Orthogonal Polynomials
Orthogonal Polynomials タブでは、数値列から直交多項式列を生成します。生成された列を Linear Regression の説明変数に使うと、素の多項式基底 に比べてデザイン行列の条件数が大幅に下がり、回帰係数の計算精度が改善されます。
基本的な使い方
Orthogonal Polynomials を開く
メニューバーから Data > Orthogonal Polynomials... を選択すると、新しい Orthogonal Polynomials タブが開きます。
多項式列を生成する
- Dataset ドロップダウンで対象のデータセットを選択
- Source column で多項式に変換する数値列を選択
- Degree で多項式の最大次数を指定(1 ~ 30)
- Preview をクリックして結果を確認
- Output Name に出力データセットの名前を入力
- Save as Dataset をクリック

元のデータセットは変更されず、新しい派生データセットが作成されます。派生データセットには元の全列に加えて poly_1, poly_2, ..., poly_{degree} の列が追加されます。
ソース列に null、NaN、Infinity が含まれる場合、その行はスキップされます。
多項式回帰での使い方
素の多項式基底の代わりに直交多項式列を使って回帰する手順です。
- Orthogonal Polynomials タブで
x列から次数 の直交多項式列を生成し、保存する - Linear Regression タブを開き、保存した派生データセットを選択する
- 応答変数に
yを設定する - 説明変数に
poly_1,poly_2, ...,poly_dを設定する - 係数、R-squared、残差 SD はそのまま読み取れる
直交多項式基底での回帰の R-squared と当てはめ値は、素の多項式基底での回帰と同じです。係数の値は基底が異なるため変わりますが、モデルの当てはまりは同一です。
Next steps
- Linear Regression - 直交多項式列を使った回帰分析
See also
- 数値計算の基礎 - 条件数が精度に与える影響
- 数値計算の精度 - NIST StRD ベンチマークによる精度検証結果
- Dummy Coding - カテゴリ変数のダミー変数変換