High-throughput prediction of enzyme promiscuity based on substrate–product pairs
下記の文章は論文のアブストラクトをChatGPTに解釈させたものであり、正確性は保証しません。
本研究の背景について、詳しく説明してください。
本研究の背景は、酵素のスクリーニング手法の制約にあります。従来の手法では、特定の基質-生成物ペアを触媒する酵素を見つけることが困難でした。これは、従来の手法が事前の知識に依存しており、予測能力が限られていたためです。また、カスタムの候補酵素ライブラリを組み込むこともできませんでした。この制約に対処するために、本研究では新しい手法を開発しました。この手法は「基質-生成物ペアに基づく酵素多機能性予測(SPEPP)モデル」と呼ばれています。このモデルは、転移学習とトランスフォーマーアーキテクチャを利用して酵素の多機能性を予測し、酵素と基質-生成物ペアの複雑な相互作用を明らかにします。SPEPPは予測能力が高く、反応の事前知識を必要とせず、ユーザーが独自の候補酵素ライブラリを定義することができます。さらに、SPEPPは代謝工学や合成生物学など、さまざまなアプリケーションに統合することができます。また、プログラミングのスキルを持たない代謝工学者が利用できるウェブサーバー「EnzyPick」も開発されました。本研究の関連研究について、詳しく説明してください。
関連研究では、酵素の候補選択には主に配列の類似性や反応の類似性が使用されています。しかし、配列の類似性と機能の関連性は一致しないことがあります。そのため、酵素の選択には他の変数を考慮するバイオインフォマティクスパイプラインが必要です。一部の研究では、バイオインフォマティクスと分子モデリングの組み合わせを使用して、ターゲット反応を触媒する多様な酵素パネルを選択することが試みられています。また、酵素の候補選択には、反応の類似性や配列の類似性を考慮する候補酵素スコアリングアプローチも使用されています。しかしこれらの手法は複雑であり、ウェブインターフェースを介して容易にアクセスすることは難しいです。本研究では、これらの制約を克服するために、新しい手法を開発しました。本研究の目的について、詳しく説明してください。
本研究の目的は、基質-生成物反応を触媒する酵素を予測するためのSPEPPモデルを開発することです。このモデルは、従来の手法とは異なり、EC番号システムに依存しないため、従来の手法では未知の反応や基質に対しても正確な酵素の評価が可能です。また、ユーザーが任意のソースから候補酵素ライブラリを組み込むことができるため、酵素スクリーニングの範囲が広がります。SPEPPモデルは、代謝工学や新規経路設計、有害物質の分解など、さまざまな生物学的シナリオに適用できます。さらに、SPEPPモデルに基づいた使いやすいウェブサーバーであるEnzyPickも開発されました。本研究で用いた材料やデータについて、詳しく説明してください。
本研究では、既存の反応データベースから基質-生成物-酵素の三つ組データを使用しました。このデータは、KEGG、Rhea、BRENDA、MetaCyc、RxnFinderなどのデータベースから収集されました。このデータを使用して、基質と生成物の間の原子対原子マッピング技術を適用し、有効な基質-生成物ペアを特定しました。また、生化学的反応では補因子も重要ですが、本研究では補因子を除外し、基質-生成物変換を触媒する酵素の特異性を予測することに焦点を当てました。さらに、GPUのメモリ制限を回避するために、アミノ酸配列が1000以上の長さを持つ酵素をデータセットから除外しました。また、バランスの取れたデータセットを確保するために、実世界のシナリオでの正例と負例の比率を模倣するために、正例の20倍の非ラベル付きサンプルを生成しました。本研究で何が明らかになったか、詳しく説明してください。
本研究では、基質-生成物ペアに基づく酵素多機能性予測(SPEPP)モデルを開発しました。このモデルは、従来の手法よりも高い予測精度を実現しました。具体的には、テストデータにおいて、受信者動作特性曲線の面積が0.9を超える高いパフォーマンスを示しました。また、このモデルは、EC番号システムに依存しないため、従来の手法では未知の反応や基質に対しても正確な酵素の評価が可能です。さらに、ユーザーが独自の候補酵素ライブラリを組み込むことができるため、酵素スクリーニングの範囲が広がります。また、EnzyPickという使いやすいウェブサーバーも開発されました。本研究の有効性をどのように検証したか、詳しく説明してください。
本研究では、SPEPPモデルの予測能力を検証するために、さまざまなバイオインフォマティクスタスクにおいてモデルを評価しました。具体的には、既存の酵素スクリーニングツールと比較し、予測精度やカスタム酵素ライブラリの組み込み能力などの面でSPEPPの優位性を評価しました。また、実際のバイオインフォマティクスタスク(代謝工学、新規経路設計、有害物質の分解など)において、SPEPPモデルとEnzyPickウェブサーバーの有用性を評価しました。さらに、SPEPPモデルの予測結果を実験的に検証し、予測された酵素が基質-生成物反応を触媒することを確認しました。これにより、SPEPPモデルとEnzyPickウェブサーバーの有効性を確認しました。