2018/03/20

スペクトルデータの場合のSN比の考察(2)

(その1から続く)

 この例に限らず、累積データで解析するのは間違いというのが、筆者の一貫した立場である。

 データを横軸に対して累積するということは、データを平均化してしまうということである(累積値は、使用したデータの平均値×データ数である)。横軸の波長ごとの出力の違いが評価に反映されにくいことになる。これは横軸が期間や時間の場合でも一般的に言えることである。したがって、売り上げなどのデータを期間で累積して、ゼロ点比例のようなデータに変換して解析するのもまずいという意見である。

 平均化されて、ばらつきの情報が失われるばかりではない。スペクトルデータにおける波長の小さい側と大きい側の重要度に優劣はないはずである。λ=400nmの強度データとλ=800nmの強度データの重要度は同じであり、公平に評価されなければならない。しかし累積した場合には、短波長側のデータは累積数が少ないためにデータの絶対値が小さくなってしまい、SN比の評価に反映されづらくなってしまう。仮に長波長側に大きなピークがあれば、その波長の様子が大きくSN比に反映されてしまうことになる。

 また物理的、技術的にも問題がある。出力強度を波長ごとに累積した値に、いったいどんな物理的、技術的意味があるのだろうか。かりに横軸が時間のようなものであればまだ理解できるが、異なる波長ごとに反射・吸収した光の強度(材料種=構造によって変わる)の足し算である。品質工学とは、対象を技術的にあるいは物理的にとらえ、対象の品質(機能の安定性)を評価する学問ではなかったか。その点でも、「形がゼロ点比例風になればいい」といいうのは、あまりにも本質を忘れた、形式的な考え方と感じてしまうのである。
 ※MTシステムの場合は予測できれば何でもよいので、任意のデータの和などの項目を作成することは許されてよいだろう。これは再現性とは別の話である。

 では100歩譲って、上記の累積値に技術的な意味があるとしよう(実際、横軸の物理量によっては意味がある場合もある)。そのような累積値でSN比を求め、再現性もあったとしよう。つまり、SN比の改善に効果のある制御因子(スペクトル分析の場合、分析条件)が見つかったとしよう。さて、この場合の有用と思われる前記の制御因子は、あくまで「累積値データのN1、N2条件の違いを安定化する」効果があるものである。平均値相当のものが安定したということである。しかしこれは、おおもとの目的であった、「各波長ごとで出力強度が安定していること」を保証しない。波長ごとの強度のばらつきが大きくても、累積や平均であれば誤差(率)は小さくなるからである。したがって、累積値で再現性があり、有用な制御因子が見つかり、最適化をしたとしても、データを累積前のオリジナルに戻した時に、果たしてばらつきが改善されているかどうかということである。これはかなり怪しいと言わざるを得ないだろう。累積データが安定していることは、オリジナルのデータが安定していることの(かなり限定された)必要条件でしかない。特に、短波長側のデータは必然的には改善できないだろう。

 オリジナルのスぺクトルデータを用いて評価した場合の再現性の問題は、評価特性の悪さに起因するのであろう(制御因子の交互作用の問題も、おおもとを辿れば評価特性の問題であることが多い)。材料分析のような分析化学的なスペクトルデータでは、波長λの強度データと、λ+Δλの強度データではまったく異なる意味をもつ。材料種によってわずかなΔλの違いでピークを持つため、精密な材料分析が行えるのである。同じ材料を計測してスペクトルデータが横軸方向にもずれてしまう現象は、分析機器側のメカニズムとノイズの作用に起因するものである(材料は固定なので実際にλがシフトするわけではない)。そのような分析機器のメカニズムや働きに立ち返った「機能」の考察が必要である。


株式会社ジェダイト(JADEITE:JApan Data Engineering InstituTE)

0 件のコメント: