見出し画像

分析・廃棄物処理とデータ解析(前半)



こんにちはかず波です。

今回は、私の考える分析や廃棄物処理でのデータ解析の価値についてお話します。

精度の高い分析データや膨大な測定データは、それだけでも価値あるものですが、的確に解析される事でさらに多くの情報を引き出せる可能性があります。

経験ある皆さんが、測定値をみただけで試料に起きた事をある程度推測出来るのは、過去に得た知識や経験と照らし合わせる事で可能なのだと思います。

データ解析を用いると、多くの切り口でデータの解釈が可能で、プロセスは違えど経験者の思考と同様な結論が得られる可能性が高いです。

さらに客観的、定量的に結果が残せますので、対外的な説得力が増しますし、実験計画や評価法決定時に大きな威力を発揮します。

なので、普段から皆さんが頭の中で描いている仮説を検証、理論化して公知のものにして利用するためには、必要不可欠なツールといえます。

ただし、ここで重要なことは、解析技術があっても、解析対象への専門的な経験や知識の基盤がなければ、結果は的外れなものになってしまうと思いますので、双方が備わってはじめて大きな成果が得られます。

解析対象になるのは、報告書等の測定値だけでなく、分析機器からの出力データや実験データ、プロセスデータ、品質管理データなど様々なものがあり、目的に応じた手法を用いて解析を行います。

解析手法の種類や内容の詳細はひとまずおいて、実際に私がその効果を実感した事例を紹介します。

VOCの測定精度と重回帰分析

以前、部下が参加したVOC調査で、あまりかんばしくない結果(全体の平均値との差が大きい、これを有意差があるといいます)となった時に、重回帰分析という手法を使って原因を明らかにして、精度向上に生かす事ができました。

VOC(揮発性有機化合物)とは、環境基準にも定められる11物質群のことをいい、ベンゼン、クロロエチレンなどが規制され、いわゆる計量証明対象物質として正確な測定が求められます。

なので、定期的に公的機関が実施する精度管理調査に参加して、目的物質を含む共通試料を多くの分析機関が測定し、まとめられた結果と自らの測定値を比較して、精度の確認を行います。

有意差の有無には、Zスコアという指標を用います。
これは、得られた測定値群の平均からの誤差が、バラツキの範疇に収まっているかを示すもので、このz値が3(2あたりから怪しくなってきます)を超えると、何かしらの異常があったものと判断されます。

参加時のz値は、項目(物質)により異なっていて、一番大きなもので3を少し超えていました。
そこで、この項目ごとのz値が何の要因で変化しているかを明らかにし、測定操作上の問題解決にアプローチしました。

まずz値(目的変数といいます)を説明する要素(説明変数といいます)を何にするか検討しました。
具体的な分析操作をパラメータにするのではなく、より一般的なパラメータである各物質の物性値を説明変数とし、その結果をもとに実際の分析操作を考察する事にしました。

その理由は、より一般的な科学的パラメータで説明出来れば、他の問題発生時にも適用可能な汎用性をもっていると考えたからです。

解析データ

目的変数
測定対象VOC物質(z値)
ジクロロメタン(1.96)、ベンゼン(3.18)、1,4-ジオキサン(-0.21)、トリクロロエチレン(2.26)、1,2-ジクロロエタン(1.02)、四塩化炭素(1.85)

説明変数(7)
使用した対象物質の物性値
沸点、融点、ヘンリー定数、密度、水/油分配係数、(溶解性パラメタの)極性力、水素結合

以上のz値に対する7つの物性値を説明変数として重回帰分析を行い、関係性の確認を行いました。

結果

まずは、各説明変数間に強い相関性がなく、独立である事を確認します。
(強い関係性がある事を「多重共線性」といい、目的変数の予測結果を不確実なものにします)

確認方法には、相関行列やVIFなどがありますが、今回は相関行列で行いました。
結果をヒートマップで示します。

ヒートマップ(相関行列)
Pythonで作成

この結果で、色の濃い要素間は相関性が高い事を、赤は正、青は負の関係であることを示しています。

ここで、ヘンリー定数と極性力が比較的強い相関性をもつ(-0.86)ため、要素から外して残った要素を用いてz値に対する重相関関数を計算しました。

その結果、残った要素(5つ)を使い回帰した結果でz値をほぼ説明出来る事がわかりました。
それぞれの影響の大きさを各係数からみると、

重回帰結果
Excelで作成

結果の考察

今回の実験誤差を示すz値は、沸点、融点、密度、水/油分配係数、水素結合力の関数でほぼ表す事が可能でした。

そして、それぞれの係数の正負の寄与率から、水から逃げやすい物質ほど、実験誤差が大きいことがわかりました。

つまり、今回の実験プロセスで、物質の揮発が関与する操作に不具合があることが判明し、後日の確認実験により、検量線用標準液の調整時に不適切な操作がある事が判明し、開放時間の上限設定など分析操作標準書(SOP)へ追記し精度向上を果たすことができました。

まとめ

このように、分析に限らず、技術的諸問題の解決に、データ解析は、その結果の定量性により、細かな数値的対応が可能な有用なツールになります

今後も私の経験談を発信してまいります!

《 記事は後半へ続きます 》




この記事が気に入ったらサポートをしてみませんか?