見出し画像

AIが、タンパク質構造ファミリーのマッピングで、「パンドラの箱」を開ける。

2022年頃から、AI(Artificial Intelligence/人工知能)が新しいタンパク質(protein)を見つけることができるといわれていたが、Nature Briefingは2023年09月13日に、これまでに見たことのない形やタンパク質間の意外なつながりが、形の解析から明らかになっていると報告した。

その研究者の中に、私が在学していた(正しくは、休学中であることから、私が在学しているというべきかもしれない)ドイツのマインツにあるヨハネス・グーテンベルグ大学(Johannes Gutenberg-Universität in Mainz)の後輩で、今回のコロナのワクチンを最初に開発したBioNTechの研究者も参加していた。

タンパク質の世界はさらに明るくなった。

研究者らは、ほぼすべての既知のタンパク質の構造を含むデータベースをGoogle DeepMindの革新的なAlphaFoldニューラル ネットワークを使用して予測された2億以上のエントリをマイニングした。
この研究により、まったく新しい形状、生命の仕組みにおける驚くべきつながり、および数年前には考えられなかったその他の洞察が明らかにした。

「AlphaFoldのおかげで、私たちはまったく知らなかったタンパク質のファミリー全体を探索できるようになりました」と、Natureの2023年09月13日で、スペインのバルセロナにあるIJC(Josep Carreras Leukaemia Research Institute/ジョセップ・カレーラス白血病研究所)の計算生物学者エドゥアルド・ポルタ・パルド(Eduard Porta Pardo, a computational biologist)は言う。彼は発表された2つの研究には関与していない 1,2。

昨年、Google DeepMind は AlphaFoldを使用して、ゲノム・データを持つ生物のほぼすべての既知のタンパク質の構造を予測し、イギリスのヒンクストンにあるEMBL-EBI(European Molecular Biology Laboratory’s European Bioinformatics Institute/欧州分子生物学研究所の欧州バイオインフォマティクス研究所)がホストするAlphaFoldデータベースに約2億1,400万の構造を蓄積した。

構造クラスター(Structure clusters)
ソウル大学の計算生物学者であるマーティン・スタインガー(Martin Steinegger, a computational biologist at Seoul National University)は、データベース全体の関係をマッピングすることに興味があった。「構造宇宙の本当の大きさを知ることは興味深いことだと思いました。」と話している。

そのために、シュタイネガーとスイス連邦工科大学チューリヒ校の計算生物学者ペドロ・ベルトラオが共同率いるチーム(a team co-led by Steinegger and computational biologist Pedro Beltrao, at ETH Zurich in Switzerland)は、データベース内のすべての構造を、その形状の類似性に基づいて素早く比較できるツールを開発した。

これにより、AlphaFoldデータベースの中から、形が似ているタンパク質の「クラスター」が200万個以上特定された1。

従来、このような比較は、遺伝子がコードするタンパク質配列を使って行われてきた。
しかし、タンパク質の配列は、その構造に比べて進化の過程で急速に変化する傾向があるため、非常に遠い関係にあるタンパク質を見つけるには限界がある。

シュタイネガー教授によれば、タンパク質の構造を比較することで、塩基配列だけで比較した場合の10倍の数の関連タンパク質のクラスターを同定することができたという。

研究者たちは、タンパク質の宇宙で新たに同定された「銀河」の探索を始めたばかりだが、すでにいくつかの驚くべきつながりを発見している。例えば、ヒトや他の複雑な生物がウイルスDNAを検出し、迅速な免疫攻撃を引き起こすために使用するタンパク質が、単細胞の細菌や古細菌のタンパク質とクラスターを形成していることがわかった。

タンパク質クラスターの3分の1以上については、ほとんど何もわかっていない。
「生物学者がこの暗闇に光を当ててくれることを期待しています.」とスタインガーは言う。

見たこともない形(Never-before-seen shape)
もうひとつのチームは、タンパク質の宇宙の暗黒物質(dark matter/ダークマター)を明らかにするために、少し違ったアプローチをとった。

スイスのバーゼル大学とSIBスイス・バイオインフォマティクス研究所の計算生物学者ジョアナ・ペレイラ、ジャナニ・ドゥレイラージ、トーステン・シュヴェーデとその同僚たち(Computational biologists Joana Pereira, Janani Durairaj, Torsten Schwede, at the University of Basel in Switzerland)は、ツールの予測がどの程度優れているかを示す指標を提供しているAlphaFoldデータベースで最も正確に予測された5000万以上の構造を連結するネットワークを作成した。そして、これらのグループ分けを使って、タンパク質の世界で最も暗い一角を特定した2。

嬉しい驚きのひとつは、これまで一度も見たことのないタンパク質の形であった。

研究チームはこの構造を「ベータ・フラワー(Beta-flower)」と名づけた。

これは、ベータ・バレル(Beta-barrel)と呼ばれる既知のタンパク質形状に見られるヘアピンカーブを多数含み、花びらのように見えるためである。
「ベータ・フラワー」を含むタンパク質は互いに遠縁の関係にあるが、どのような働きをしているのかは明らかになっていない、とペレイラは言う。

「この研究によって、パンドラの箱(Pandora’s box)が開けました。どれを優先させるかを決めなければなりません」とペレイラは付け加えた。
ペレイラと同僚たちは、他の研究者たちがこのネットワークを使って、自分の好きなタンパク質がより広い分子の世界にどのように適合しているかを確認することを望んでいる。

ユニヴァーシティ・カレッジ・ロンドンの計算生物学者クリスティン・オレンゴ(Christine Orengo, a computational biologist at University College London)は、タンパク質の世界をナビゲートする新しい方法ができたことに興奮している。

しかし彼女は、タンパク質全体に対して非常に正確であるとみなされるアルファフォールド予測の中には、研究者が興味を持つタンパク質の機能的な部分(domains/ドメイン)の形状をあまり正確に表していないものがあることに注意を促している。このような異常はさておき、研究者は新しいタンパク質ファミリーの宝庫を手に入れることができるはずだ、とオレンゴは言う。

グーグル・ディープマインドでアルファフォールド・チームを率いるジョン・ジャンパー(John Jumper, who leads the AlphaFold team at Google DeepMind)は、どちらの研究にも関与していないが、研究者たちは彼と彼の同僚たちが解き放った宇宙を探索する新しい方法を開発しているのを見るのが楽しみである。

彼はこの研究を、かつて考えられなかったようなスケールでタンパク質の構造が研究される新しい分野の始まりと見ている。
「私は、もっと多くの研究がなされることを期待しています。」と話している。

AIを利用すると、データ量が大きくなるので、量子コンピューティングがさらに大きな「パンドラの箱」を開けることになる。

2023年03月27日---AI、もう一つの危険因子。
2023年03月27日---AIと法律。何が今必要か、走りはじめたAIの未来。
2022年12月07日---新薬を発見する方法。チャットボットと検索クエリを支えるAI。
2022年12月07日---植物が気孔を開閉する仕組みに関する画期的なメカニズムを発見。
2022年11月02日---食料安全保障に多様な取り組み、空気で作るタンパク質や昆虫食。
2022年10月24日---免疫系を回避するハイブリッド・ウイルスが初めて観測された。
2022年09月29日---エーザイのアルツハイマー病治療薬の試験で精神機能の低下が抑制された。
2022年09月25日---世界の認知症今後認知症疾患はより多く発生するようになる。
2022年09月16日---科学者たちはAIを使って、画期的な新しいタンパク質を夢見ている。

doi: https://doi.org/10.1038/d41586-023-02892-z

References
Barrio-Hernandez, I. et al. Nature https://doi.org/10.1038/s41586-023-06510-w (2023).

Article

Google Scholar

Durairaj, J. et al. Nature https://doi.org/10.1038/s41586-023-06622-3 (2023).

Article

Google Scholar

Download references

Reprints and Permissions

Nature Careers
Jobs
Senior Scientists
Sanofi Institute for Biomedical Research (SIBR) is seeking multiple highly motivated individuals with doctoral degrees to join our institute locate...
Suzhou
Sanofi Institute for Biomedical Research

Lab Head, Degrader Technologies
Sanofi Institute for Biomedical Research (SIBR) is seeking a highly motivated individual with extensive knowledge and research experience in degrad...
Suzhou, Jiangsu, China
Sanofi Institute for Biomedical Research

Tenure-track or Senior Tenured Professor
Tenured or Tenure Track Professor Position in the Department of Genomics and Computational Biology at UMass Chan Medical School.
Massachusetts (US)
UMass Chan Medical School Genomics and Computational Biology

Faculty Positions in Data Science, Artificial Intelligence and Machine Learning

The institute invites researchers working actively in the areas of computational statistics, machine learning and related areas.
Hyderabad, Andhra Pradesh (IN)
Tata Institute of Fundamental Research, Hyderabad

ATLAS - Joint PhD Program from BioNTech and TRON with a focus on translational medicine
9 PhD positions for ATLAS, the joint PhD Program from BioNTech and TRON with a focus on translational medicine.
Mainz, Rheinland-Pfalz (DE)
Translational Oncology (TRON) Mainz

Nature (Nature) ISSN 1476-4687 (online) ISSN 0028-0836 (print)

https://www.nature.com/articles/d41586-023-02892-z


いいなと思ったら応援しよう!