DoE Analysis(実験計画法)

DoE Analysis タブは、2水準の実験計画法データを分析します。直交表の生成、ANOVA による因子効果の検定、主効果プロット・交互作用プロット・パレート図による可視化に対応しています。

タブを開く

メニューバーから Analysis > DoE Analysis... を選択します。

直交表の生成

実験条件の組み合わせを決める直交表を生成できます。メニューバーの Data > New DoE Design... または DoE Analysis タブ右上の New Design... をクリックするとウィザードが開きます。

因子の定義

各因子の名前と2つの水準ラベルを入力します。最低2因子が必要です。

直交表タイプ

因子数に応じた直交表タイプを選択します。

タイプ実験回数最大因子数
L443
L887
L161615

直交表は Hadamard 行列から生成されます。任意の2因子の水準の組み合わせが均等に出現し、デザイン行列上の因子間の相関が0になります。

反復実験

直交表の各行は1つの実験条件を表します。同じ条件で複数回実験する場合は、同一の条件行を必要な反復数だけデータに追加してください。反復がない場合、残差の自由度が少なくなり、誤差の推定精度が下がります。L4 で3因子のモデルでは主効果3項 + 切片で残差自由度が0になり、分析できません。反復を追加するか、因子数に対して余裕のある直交表タイプを選択してください。

実行順序のランダム化

Randomize run order をオンにすると、生成される実験条件の順序をランダムに並べ替えます。実験順序による系統的な偏りを防ぐために、実際の実験ではランダム化を推奨します。

データセットの生成

プレビューで直交表を確認した後、Generate をクリックするとデータセットとしてプロジェクトに追加されます。応答変数の列は空の状態で作成されるので、データテーブル上でセルをダブルクリックして実験結果を入力してください。

分析の実行

設定パネルで以下を順に設定します。

  1. Dataset から分析対象のデータセットを選択
  2. Response Variable に数値変数を選択
  3. Factors で2水準のカテゴリ変数を選択。最低2因子を選択してください
  4. Model でモデルの種類を選択
  5. Significance Level で有意水準を選択。デフォルトは α = 0.05 です
  6. Run Analysis をクリック

DoE 設定画面。3因子を選択し、全2因子交互作用モデルを設定した状態

データの要件

因子はカテゴリ変数を選択します。測定尺度が nominal または ordinal の列が因子の候補として表示されます。現在のバージョンでは2水準の因子のみに対応しています。3水準以上の因子を選択した場合、分析実行時にエラーメッセージが表示されます。

応答変数は数値型の列を選択します。

モデルの選択

Main effects only: 各因子の主効果のみをモデルに含めます。因子間の交互作用がないと仮定できる場合に使います。

Main effects + all 2-factor interactions: 全ての因子ペアの2因子交互作用を主効果に加えてモデルに含めます。交互作用がありうる場合に使います。因子数が多いと交互作用の項が増え、残差の自由度が減ります。例えば L8 で7因子を全て選択し、全2因子交互作用を含めると、主効果7項 + 交互作用21項 + 切片 = 29パラメータになりますが、データは8行しかないため分析できません。因子数が多い場合は、主効果のみから始めて必要に応じて交互作用を追加してください。

Main effects + selected interactions: 関心のある因子ペアの交互作用のみを選択してモデルに含めます。

結果の読み方

分析結果は4つのサブタブで確認できます。

ANOVA Table

各因子と交互作用の効果を検定した結果です。Type III 平方和を使用しています。

説明
Source因子名または交互作用名
DF自由度。2水準因子では各項が1
Adj SS調整平方和。他の全因子で調整された各項の寄与
Adj MS調整平均平方。Adj SS を DF で割った値
F-ValueF 統計量。Adj MS を残差の MS で割った値。p 値は F 分布の上側確率
P-Valuep 値

テーブルの下に R-squared、Adjusted R-squared、Model SE が表示されます。

ANOVA テーブルと前提条件の診断。3因子 + 全2因子交互作用モデルの結果

テーブルの行をクリックすると、主効果プロットや交互作用プロットで対応する因子がハイライトされます。

Main Effects Plot

各因子の水準ごとの応答変数の観測平均を折れ線グラフで表示します。因子ごとに1つのサブプロットを描画し、Y 軸のスケールは全サブプロットで統一されています。傾きが急な因子ほど応答に対する効果が大きいことを示します。

水平の破線は全体平均です。

Show 95% confidence intervals をオンにすると、各水準平均に95%信頼区間をエラーバーとして表示します。標準誤差はモデルの残差平均二乗 MSE から SE=MSE/ni\text{SE} = \sqrt{\text{MSE} / n_i} として計算されます。nin_i はその水準の観測数です。信頼区間の幅は残差自由度に基づく t 分布の臨界値を使います。エラーバーは個々の水準平均の精度を示すもので、エラーバーの重なりから2水準間の差の有意性を判断しないでください。因子の効果が有意かどうかは ANOVA Table の F 検定で確認してください。

主効果プロット。Temperature, Pressure, Catalyst の各水準平均と95%信頼区間

ポイントをクリックすると、対応する水準のデータ行がデータテーブル上で選択されます。

Interaction Plot

2因子の組み合わせごとに、セル平均を折れ線で表示します。X 軸に一方の因子、色分けされた線でもう一方の因子を表現します。因子のペアが nn 個あれば (n2)\binom{n}{2} 個のサブプロットが描画されます。

線が平行に近い場合、交互作用は小さいと考えられます。線が交差する場合、一方の因子の効果がもう一方の因子の水準によって異なることを示します。交互作用の有意性は ANOVA Table で確認してください。

交互作用プロット。3因子ペアのセル平均を色分けした折れ線で表示。線がほぼ平行で交互作用は小さい

ポイントをクリックすると、対応するセルのデータ行がデータテーブル上で選択されます。

Pareto Chart

各因子と交互作用の効果の大きさを、標準化効果量 t|t| で比較します。t|t| が大きい順に横棒グラフで表示します。

赤い垂直の破線は、設定した有意水準 α に対応する t 臨界値 tα/2,νt_{\alpha/2,\, \nu} です。ν\nu は残差自由度です。この線を超える棒は、その有意水準で統計的に有意です。有意な棒は青、非有意な棒は灰色で表示されます。

パレート図。Pressure, Temperature, Catalyst の主効果が有意。交互作用は非有意

棒をクリックすると、対応する因子の主効果プロットまたは交互作用プロットに切り替わります。

統計モデル

効果コーディング

2水準因子をアルファベット順にソートした最初の水準に +1、2番目の水準に -1 を割り当てます。2つの水準が ±1 に配置されるため、回帰係数は水準間の差の半分に対応します。ANOVA テーブルと主効果プロットで表示される効果推定値は、係数を2倍した値、すなわち水準間の応答平均の差です。

交互作用列は、対応する2因子の主効果列の要素ごとの積として構成されます。

係数の推定

切片と全ての項を含むデザイン行列を構築し、Householder QR 分解で最小二乗推定を行います。

Type III 平方和

各因子の平方和は、フルモデルの t 値から SSj=tj2×MSE\text{SS}_j = t_j^2 \times \text{MSE} として計算されます。2水準因子は各1自由度であるため、F=t2F = t^2 が成立します。他の全因子で調整された各因子の固有の寄与を評価するため、因子の投入順序に依存しません。Type III 平方和の詳細は ANOVA を参照してください。

前提条件

この分析は以下を前提としています。

  • 独立性: 各実験が互いに独立に実施されていること
  • 正規性: 応答変数の誤差が正規分布に従うこと
  • 等分散性: 全ての因子水準の組み合わせで誤差の分散が等しいこと

ANOVA Table サブタブの ANOVA テーブルの下に、前提条件の診断結果が表示されます。

Levene's Test for Homogeneity of Variances: 因子水準の全組み合わせをセルとして、セル間の分散の等質性を検定します。Brown-Forsythe variant を使用し、各セルの中央値からの絶対偏差に基づきます。

Residual Normality (Shapiro-Wilk): モデルの残差に対する正規性の検定です。サンプルサイズ3から5000の範囲で利用できます。

欠損値の処理

因子または応答変数に欠損値を含む行は分析から除外されます。除外された行数は結果パネルに表示されます。直交表から生成したデータで欠損値が発生すると、直交性が崩れて因子間に相関が生じます。その場合、効果の推定精度が低下し、Type III 平方和の解釈にも注意が必要です。欠損を最小限に抑えるか、欠損がある場合は結果を慎重に解釈してください。

  • ANOVA -- 水準数の制限がない一元配置・二元配置の分散分析
  • Linear Regression -- 連続変数を含む回帰分析