ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking
本研究の学術的背景は、タンパク質とリガンドのドッキングを予測することが薬剤開発において重要で困難なタスクであることにあります。現在のドッキング手法は評価関数に頼っており、ディープラーニングベースの手法はタンパク質とリガンドの3D空間情報やリガンドのグラフレベル特徴を無視しているため、性能に限界があります。そこで本研究では、タンパク質リガンドドッキング予測のための等変換トランスフォーマーニューラルネットワークを提案しています。
本研究の目的は、タンパク質リガンドドッキング予測のために新しい手法を提案し、既存の手法よりも高い性能を達成することです。本手法は、リガンドのグラフレベル特徴を取り込んで特徴処理を行い、提案されたTAMformerモジュールを使用してリガンドとタンパク質の表現を学習します。さらに、予測された距離行列に基づいて精製されたリガンド構造を生成するための反復最適化アプローチも採用しています。
本研究の着想は、既存のドッキング手法の制約や課題を克服するために生まれました。これまでの研究では、タンパク質とリガンドの3D空間情報やリガンドのグラフレベル情報を考慮していなかったため、本研究ではこれらの情報を統合する新しい手法を提案しています。関連する研究動向としては、タンパク質の構造予測におけるAlphaFoldの登場や、ドッキング予測における深層学習手法の提案などが挙げられます。
本研究では、提案されたETDockモデルを使用してタンパク質リガンドドッキング予測を行いました。具体的には、リガンドのグラフレベル特徴と原子レベル特徴を統合し、相互作用特徴を捉えるために学習可能な外積を使用しました。さらに、TAMformerモジュールを使用してタンパク質とリガンドの表現を学習し、予測された距離行列を使用してリガンド構造を最適化しました。
本研究では、PDBbind v2020データセットを使用してETDockモデルの性能を評価しました。実験結果から、提案手法が既存のドッキング手法や深層学習手法に比べて優れた性能を持つことが示されました。特に、ETDockはリガンドの姿勢のRMSD(Root Mean Square Deviation)が2A以下で23.2%、5A以下で61.1%という良好な結果を達成しました。