非検出の定義で苦労した話
ケモメトリクスというほどでもないがせっかく計算したのでメモ程度に.分析化学詳しい方からのご指摘があると幸いです.
経緯
精製操作によって夾雑化合物を非検出レベルまで低減できたことを示したいと思った.精製後の溶液を HPLC で測定してピーク面積を出し標準品で作成した濃度系列のピーク面積から作成した検量線に基づいて定量していたので,目的画分において夾雑化合物のピーク強度が検出限界 (LOD: Limit Of Detection) 以下であると示したのちに定量下限 (LOQ: Limit Of Quantification) 付近で添加回収試験を行い,良好な回収率であることを示せばよいと思った.当該分析系の LOD, LOQ について検証したことがなかったため,まずこれらの決定から取り組んだ.
実験
カラム精製前の夾雑化合物濃度は $${100 \ \mu M}$$ 程度であることをすでに確認しており,その測定では $${300 \ \mu M}$$ から三倍ずつ段階希釈を行い,空試料とあわせて五点検量線としていた.上記の方法で作成した検量線は直近四回において下図のようであった.
なお各濃度のピーク面積の平均値と標準偏差,相対標準偏差はそれぞれ下表のとおりである.
図から $${0-300 \ \mu M}$$ の範囲では十分な線型性を示していると考えられ,残差の分布も上下対称であることが読み取れる.高濃度側ほど残差の分散が大きくなっているが,段階希釈系列にすることで低濃度側を密に測定し一種の重みつき検量線とすることで対応している.なお,農林水産省の分析法の妥当性確認に関するガイドラインでは残差の分散が一定の範囲において等間隔に濃度を設定することが推奨されており,厳密にはやや長大な検量線と言える.ただし重み付き検量線として補正することも否定はされておらず,研究段階での定量系としてはこれでも十分と言える (研究開発後期の公定書収載前ごろだと修正を要求される可能性はある).
さて,この検量線データのみから LOD, LOQ を決めることはできるだろうか?
LOD の推定
LOD の概念を説明したものとしては分析化学会の「ぶんせき」に収載された解説記事などが詳しいので詳細はそちらに譲る.上記解説論文で紹介されている Currie の LOD の定義は下記の通りである.
$${LOD= mean_B + 3.29 \times SD_B}$$
ただし $${SD_B}$$ は空試料 (Blank) の測定値の標準偏差を,$${mean_B}$$ は空試料の測定値の平均値をそれぞれ示す.
これによれば LOD は空試料の分析結果のみから算出可能であるので,検量線に空試料が含まれていればその結果から LOD の推定ができる.今回の試験では blank の peak area が $${874.0 \pm 149.5}$$ だったため,$${874.0+3.29 \times 149.5\approx 1366}$$ 以上のピーク面積は「ある」と判定できるはずである.検量線の数式に従えば,この時の濃度は $${\cfrac{1366-1397.8}{438.84} \approx -0.1 \ \mu M}$$ となる.
検出限界濃度が負の数になってるじゃないか.そんなわけあるか.
空試料の信号強度から LOD を求める過程については理論的に確立されており多くの組織で利用されている方法であるので,ここに疑いを挟む余地はほぼないだろう.つまり上述の「$${874.0 + 149.5 \times3.29\approx1366}$$ のピーク面積が LOD」という推論までは正しいと期待できる.となると,問題なのはこのピーク面積を濃度に変換する過程で $${0-300 \ \mu M}$$ の範囲の検量線を用いたことであろう.検量線が長大すぎる可能性についてすでにふれたが,上端・下端付近では信頼性が下がるためブレの影響を受けたと考えられる.もう少し低濃度域の検量線を用いるべきだったのだ.
追加実験
というわけで低濃度での検量線を引き直す必要が生じたわけだが,せっかくなので LOD 付近のピーク面積になるような低濃度サンプルの希釈系列を作製し実験的に LOD を確認してみることにした.論より証拠だ.
$${11.1 \ \mu M}$$ で peak area が $${(6.9 \pm0.6) \times 10^3}$$,$${0.0 \ \mu M}$$ (blank) で peak area が $${(0.8 \pm 0.1) \times 10^3}$$ であるからおおよそ $${1 \ \mu M}$$ ごとに $${0.55 \times 10^3}$$ peak area が増えると予想できる.推定される検出限界 peak area が $${1.3 \times 10^3}$$ 付近だから,$${1 \ \mu M (=1000 \ nM)}$$ あたりに LOD が来ると思われるので,これをまたぐ形で段階希釈系列を作成すればよい.
具体的には $${2000 \ nM }$$ から二倍ずつ段階希釈を行い,空試料とあわせて六点検量線として HPLC 分析する操作を三回繰り返した.結果は下図の通りになった.さすがに RSD が大きすぎて検量線にするのは無理そうだが,事前の予想通り $${1 \ \mu M}$$ 以下にピーク面積の濃度依存性はほぼないと言ってよさそうである.
LOD の決定
すでに紹介した Currie による LOD の定義は空試料と低濃度試料の信号強度の分布が分散の等しい正規分布であると仮定し,検出の有無を判定する際の第一種・第二種の過誤をそれぞれ 5% になるように導出したものである.それにならって上記結果から blank, $${1000 \ nM, 2000 \ nM}$$ 試料を測定した際に検出されるピーク面積の確率分布を予想すると下図のようになる.
正規分布性を確認していないが,今回は blank でもわりと大きめのピークが出る試験系なのでたぶん大丈夫と思う.これが blank にピークがない試験系となると,まずピークの検出やベースラインの設定をどうするか考える必要があり,そのうえで blank の peak area の分布を考えなければならない (ポアソン分布とかになるのか?) ので議論が難解になる.$${0,1,2 \ \mu M}$$ の測定で SD がほぼ同じ大きさとなったがこれも Currie の仮定と一致するものである.
blank と $${1000 \ nM}$$ の分布が重なるのがおおよそお互いの SD 付近であるので,この二者について判別するとき第一種・第二種の過誤がおこるのはそれぞれ 15-16% といったところだろうか.LOD の水準には満たないといってよいだろう.
一方 blank と $${2000 \ nM}$$ の分布が重なるのは互いの平均値から 2SD 以上離れているので,この二者について判別するとき第一種・第二種の過誤が起こるのはいずれも 1% 以下と予想できる.LOD の水準を満たすといってよいだろう.理論値を採用すればもう少し低濃度を LOD と言えそうだが,実験的に証明されている方が安心なのでとりあえず $${LOD = 2 \ \mu M}$$ とした.
ちなみに
Currie の定義にしたがって blank から予想される LOD の分布を書き足したものが下図.$${LOD = 1.5 \ \mu M}$$ くらいかな? まあ精製前が $${100 \ \mu M}$$ 超だったことを考えると $${0.5 \ \mu M}$$ くらいは誤差と言えよう.
添加回収試験
上記図 3 から $${LOD=2\ \mu M}$$ となったので添加回収試験は当然これ以上の濃度で行う必要がある.できれば回収率が $${95 \pm 5 \%}$$ くらいと示したいので,標準品の peak area について $${RSD \le5 \%}$$ の濃度域が望ましい.表 1 から高濃度側ほど RSD が小さくなり,$${11.1 \ \mu M}$$ で $${RSD = 8.0 \%}$$ , $${33.3 \ \mu M}$$ で $${RSD=3.5 \%}$$ だから $${33\ \mu M}$$ 以上あればよさそうである.
とりあえず蒸留水と精製後試料,およびそれらに終濃度 $${1000 \ \mu M}$$ となるように添加し回収率を測定してみた.結果を下図に示す.$${1 \ \ mM}$$ 添加試料から無添加の peak area を減じた結果,蒸留水への添加とほぼ同一の値となり,回収率 $${94.9 \pm 5.3 \%}$$ と推定された.したがってマトリクスによる測定妨害はほぼなく,本試料の測定結果は非検出としてよいと考えられる.
所感
多分これで大丈夫?
もうちょっと小さい濃度で添加回収した方がよかったかな?