Explainable discovery of disease biomarkers: The case of ovarian cancer to illustrate the best practice in machine learning and Shapley analysis
卵巣がんは、地域社会に永続的な影響を与える重要な健康問題です。近年、外科的治療、化学療法、放射線治療が進歩したにもかかわらず、初期の段階でバイオマーカーを特定することができないため、わずかな影響しか与えていません。バイオマーカー探索は困難であるが、創薬や臨床治療の改善には不可欠である。機械学習(ML)技術は、従来の方法と比較して、バイオマーカーの複雑なパターンを認識するのに非常に有効ですが、診断に関する物理的な洞察に欠けることがあります。我々は、バイオマーカーの検証タスクにおいて、MLとXAI技術を組み合わせるためのベストプラクティスを紹介することを目的としている。
方法
我々は、分類タスクに焦点を当て、シャプレー値に基づくゲーム理論的アプローチで、モデルの構築と評価、結果の可視化を行った。ワークフローを説明し、CDAS PLCO Ovarian Biomarkersデータセットを用いたケーススタディでパイプラインを適用し、精度と実用性の可能性を実証しました。
結果
ケーススタディの結果は、MLパイプラインの有効性、その一貫性、従来の統計的アプローチと比較した優位性を示しています。
結論
得られたガイドラインは、臨床医に情報を提供し、がんバイオマーカーの検証や説明を行うことができる、医学研究におけるXAIの実用化のための一般的な枠組みを提供するものである。