見出し画像

Unraveling the functional dark matter through global metagenomics

  1. 本研究の核心となる学術的「問い」は、メタゲノム(環境中に存在する全ての微生物の遺伝子を解析する手法)がもたらす膨大なたんぱく質の多様性とそれが反映する多様な機能・活動を解析するための新たな手法の開発です。従来の分析は既知の微生物ゲノムやそのたんぱく質群との比較に限られていましたが、その枠を超えて未開拓の機能多様性を探索することはできるのでしょうか?

  2. 本研究の目的は、参照ゲノムに頼らないたんぱく質群をメタゲノム中の配列から生成するための計算手法を開発し、これまで探索可能だった範囲を超えた機能の多様性を調査することです。本研究の学術的独自性と創造性は、メタゲノムから新しく発見されたたんぱく質群を注釈付けし、可能であれば、その3次元構造を予測することで、新たな構造を明らかにした点にあります。

  3. メタゲノム解析は、さまざまな生態系から微生物を研究・分類する方法として主要な手法となってきました。最近の技術進歩により、大規模なシーケンスがもっとも手軽に、早く、そして手頃な価格で可能になってきました。しかし、これまでのアプローチは、機能注釈を参照たんぱく質データベースに対する相同性検索に依存していました。そのため、組み立てられたメタゲノムデータに予測された遺伝子が参照たんぱく質家族にマップされない場合、それらは通常無視されてしまいます。この依存性を排除し、未探索の機能多様性の広さを推定するために、我々は新たな手法を開発しました。

  4. 本研究では、2万6931のメタゲノムから、既知のゲノムやPfamデータベースに一致しない約117億の新たなたんぱく質配列を特定しました。これらの配列をクラスタリングして新たなたんぱく質群を作成し、それぞれのタックス(生物分類群)、生物相、地理的分布、遺伝子近傍の分布を注釈付けしました。さらに、配列の多様性が十分にある場合には、たんぱく質の3次元モデルを予測し、新たな構造を明らかにしました。

  5. 本研究の有効性は、新たに特定したたんぱく質配列が既存の参照ゲノムやPfamデータベースに一致しないこと、そしてこれら新たな配列から作成したたんぱく質群が既存の参照ゲノムから得られたたんぱく質群の数を倍増させ、その上で予測された3次元構造が新規構造であることを通じて検証されました。

この記事が気に入ったらサポートをしてみませんか?