Lo-Hi: Practical ML Drug Discovery Benchmark
本研究の学術的背景は、新薬開発の難易度の増加と、それを解決するための手段としての機械学習の利用にあります。具体的な「問い」は、現在の分子特性予測モデルの評価基準(ベンチマーク)が現実的でなく、実際の応用とは大きく異なるという問題に対する解決策を模索しています。
この研究の目的は、実際の薬物発見プロセスに対応した新しい実践的なベンチマーク、「Lo-Hi」を作成することです。このベンチマークは、「Lead Optimization(Lo)」と「Hit Identification(Hi)」の二つのタスクから成り立ちます。さらに、新しいmolecular splitting algorithmを開発し、これらのタスクの一部である、Balanced Vertex Minimum k-Cut問題を解決します。
本研究の着想は、新薬開発がますます困難になっている現状と、それに対処するための既存の機械学習モデルの評価基準が現実的でないという課題から得られました。また、本研究は、実際に新薬開発に直面する課題に対応した新しいベンチマークを提供することで、実用的な新薬開発へのモデル適用における研究動向における新たな位置付けを実現します。
本研究では、新たなベンチマーク「Lo-Hi」と新Algorithmの開発を通じて、現在のモデル評価基準が現実離れしていて楽観的すぎることを示しました。また、「Lo-Hi」を利用して、さまざまな機械学習モデルをテストし、実際の設定でどのモデルがより優れているかを明らかにしました。
本研究の有効性は、「Lo-Hi」ベンチマークを使用して最新の機械学習モデルと古典的な機械学習モデルをテストし、実際の薬物発見の設定下でどのモデルが最も良い結果を示すかを評価することによって検証しました。
この記事が気に入ったらサポートをしてみませんか?