見出し画像

SeqPredNN: a neural network that generates protein sequences that fold into specified tertiary structures

  1. 本研究の学術的な背景や中心的な問いは、タンパク質の構造を決定するためのアミノ酸配列を予測する「逆タンパク質折りたたみ問題」です。これが解決できれば、特定の構造に折りたたむタンパク質を設計でき、これが生物工学やバイオテクノロジーに非常に価値があるとされています。

  2. 本研究の目的は、SeqPredNN(フィードフォワードニューラルネットワーク)の開発です。これは、近くの残基の相対的な位置、方向、および主鎖の二面角などの情報だけを手がかりに、タンパク質構造におけるアミノ酸の種類を予測するためのものです。これにより、新しいバイオマテリアル、医薬品、触媒、レポーターシステムの設計のために、定義された構造を持つタンパク質を生成するための有用なツールとなることを提案しています。従来の物理ベースのタンパク質設計手法に比べ、SeqPredNNの使用は効率的で容易であるとしています。

  3. タンパク質の配列、構造、そしてそれに基づく機能との関連性は生物学における基本的な原理であり、これが本研究の着想に至った経緯です。最近では、AlphaFoldというニューラルネットワーク手法により、タンパク質の配列だけからその構造を計算で予測できるようになりました。しかし、逆の問題である「逆タンパク質折りたたみ問題」はこれまで十分に解決されておらず、これを解決することで人間の健康、ポリマーサイエンス、バイオテクノロジーの進歩に大きく寄与すると考えられています。

  4. 本研究では、SeqPredNNによって生成された配列が、予想される構造に折りたたむためのタンパク質の配列を予測しました。その結果、SeqPredNNによって予測された配列が、AlphaFoldの予測に基づいて結晶構造と比較したときの中央値TMスコアが0.638であることを示しました。また、これらの配列はユニークであり、結晶化したタンパク質の配列とは28.4%しか一致していないことが明らかとなりました。

  5. 本研究の有効性は、SeqPredNNが予測したタンパク質配列がターゲットとなる構造に折りたたむことができ、その一致度が結晶構造と比較して中央値TMスコアが0.638であることから検証されました。また、その配列は結晶化したタンパク質の配列と28.4%しか一致していないことから、原始的な配列と比べてリーズナブルな差があることが示され、これにより物理的な特性を変更する能力もチェックされました。

いいなと思ったら応援しよう!