2009/06/03

T法と過飽和実験計画

 T法の数理は、項目数(列数)k>データセット数n(行数)となるデータの過飽和実験計画の一種であるといえる。

 過飽和実験計画(Supersaturated Design:SSD)で用いられる殆直交表(一例を図に示す)のレスポンスをT法の信号空間として教示し、各項目の主効果を未知データとして計算する。たとえば項目1の主効果は、項目1の値が1、それ以外の項目の値が0とすれば得られる。そうすると、T法の推定結果は、SSDで単純に主効果を求めた場合の結果と傾向でほぼ一致する。
 よって、T法の精度に関してSSDで言われているような以下のこと(出展は山田秀「実験計画法 方法編」p.134)が当てはまるかもしれない。








(1)候補となる因子が多数のため第1種の過誤を厳密に管理するのは困難  → つまり、効果のない項目を有意として判断してしまう危険性

(2)主要な因子が高々5個程度の少数個の状況において、その因子を選択する場合に効果を発揮  

→工程異常の原因診断など、主要な因子が限られるケースに威力を発揮するのでは  
→予測のように事前に主要な因子がどれくらいあるか分からない場合は危険を伴う
(3)kが2n程度なら主要な因子のうちの3個程度、kが3n程度のばら主要な因子の2個程度は高確率に抽出できる
→T法の事例の場合、項目数が極端に多い場合もあるため注意が必要か

(1)については、現在の品質工学では考慮していない。有意かどうかではなく、主効果がみとめられればその利得は改善(パラメータ設計の場合)や予測(MTシステムの場合)に繰り入れる。それがよいかどうかの判断は、利得の再現性であり、総合推定精度である、というのが品質工学の提案である。

(2)(3)より分かるとおり、kがnに比べて極端に多い場合は、予測精度の面であまり期待しないほうがよいといっている。項目数のほうが多くても計算はできる予測精度まで保証するわけではない。予測精度  は項目を何にするか部分が大きいが、このように手法そのものの限界も知っておくべきであろう。

ただし、SSDとT法ではデータの内容として以下の点が異なるので、以上で述べた過飽和実験計画の徴がすべてT法にあてはまるとは限らない。その違いとは、項目の値の決め方(決まり方)の違いによる「情報の質の違い」である。
SSDでは殆直交表を用いるため、項目間の相関係数は必然的に0に近い値である(おおむね、-0.333~+0.333)。しかも実験計画であるので、項目の値は人為的に任意に決められる。そのときに項目の値はほかの項目の値の影響を受けないように設定される(実験中ではすべて制御できる因子)。

一方、T法は実験計画ではなくデータの観測であるので、項目間の相関は成り行きできまる。またこの成り行きできまるそれぞれの項目の値どうしの相関関係でそれぞれの主効果も変化するので、そこにSSDにはない情報が含まれることになる。SSDとT法が比較できるのは、SSDで要因効果が求められるようなデータのケースだけであるので、上記で展開した論はT法において一般的に言えることではないのかもしれない。

0 件のコメント: