Extracting medicinal chemistry intuition via preference machine learning
本研究の学術的背景、研究課題の核心をなす学術的「問い」は何ですか?
本研究の学術的背景は、新薬の発見におけるリード最適化プロセス(薬剤の性質を最適化するためのプロセス)が、多くの薬剤師の意見を取り入れることで目標の分子特性プロファイルに到達するための苦労の多い取り組みであることです。続けて、本研究では、ノバルティスの35人の薬剤師から何か月にわたって得られたフィードバックに人工知能の学習-to-ランク技術を適用して、このプロセスを再現しようとすることを目指しています。つまり、「薬剤師の所見をモデルに取り入れた人工知能が、化合物の優先順位付け、モチーフの合理化、バイアスを持った新規薬剤の設計などの日常的なタスクでどれだけ有益か」を調査することが学術的な課題です。本研究の目的及び学術的独自性と創造性は何ですか?
本研究の目的は、蓄積されたノバルティスの薬剤師からのフィードバックデータを機械学習モデルに適用することで、リード最適化やその他の薬剤開発のプロセスにおける意思決定を支援するための学習済みの代理モデルを作成することです。これにより、他の業界でも報告されているような既存の推薦システムと同様に、薬剤開発プロセスでの意思決定を支援できる可能性があります。この点で、本研究は学術的に独自性と創造性を持っています。
本研究の着想に至った経緯や、関連する国内外の研究動向と本研究の位置づけは?
過去の研究では、薬剤師の知識や規則ベースのアプローチ、化学情報学的な指標などを使用して薬剤開発プロセスの意思決定をフォーマライズしようと試みられてきました。しかし、今回の研究では、より精緻で複雑な意思決定プロセスをモデル化するために、機械学習モデルを提案しています。
本研究で何をどのようにして、どこまで明らかにしましたか?
具体的な主な成果として、ノバルティスの薬剤師から収集したデータを使用して学習した潜在的なスコアリング関数が、他の既存の化学情報学的な指標や規則セットではカバーされていない化学の側面を捉えられることを示しました。また、提案された学習モデルがドラッグライクネス(薬剤としての適性)という概念をQED(薬剤評価指標)よりも正確に捉えることも示しました。さらに、公開されている大規模な化合物データベースを用いてフラグメント解析を行うことで、学習した化学的好みを合理化しました。
本研究の有効性はどのように検証しましたか?
本研究では、実証データ収集のラウンドが行われ、アクティブラーニングの手法によって薬剤師のフィードバックデータが収集されました。このデータの分析結果から、学習済みのスコアリング関数が実際の化合物の優先順位付けや新規薬剤の設計において有用であることが示されました。また、QEDという他の指標と比較して、提案された学習済み関数がドラッグライクネスの概念をより正確に捉えることも確認されました。