見出し画像

人工タンパク質が輝きを増す

生命科学でここ数年の大きなトピックといえば、Google DeepMind社のAI(Alphafoldシリーズ)による3次元タンパク質構造予測です。以前にもふれたので関連投稿を載せておきます。

DeepMind以外でも、Meta(旧Facebook)社が同じように3次元タンパク質情報をデータベース化する活動を進めています。

その出身者が立ち上げた会社で素晴らしい進展がありました。

ようは、
最大規模のAIモデルの一つであるタンパク質言語モデルを発表し、新たな蛍光分子の作成に成功した、
というはなしです。

このモデルは、医薬品開発や持続可能性研究などへの応用を目指したEvolutionaryScale社によって設計されました。

その開発したAIツール「ESM3」は、27億以上のタンパク質配列と構造、及びそれらの機能に基づいて訓練されており、ユーザーが指定した仕様に合わせて新しいタンパク質を作成できます。
記事によると構造としてはChatGPTに似た出力を行うとのこと、言語モデルを超えた世界モデルとしての応用を感じます。

今回設計されたのは、従来の緑色蛍光タンパク質(GFP)の改良版で、当初はうまくいきませんでしたが、最新の結果では自然のGFPと同等の明るさを持つタンパク質も生成できるようになりました。

GFPは、遺伝子編集で任意の部位に発現させることで、レントゲンのように生物内部の動きを可視化するツールとして必須となっています。詳細については過去投稿に委ねておきます。

ただ、今回設計されたアミノ酸配列は、トレーニング データ セットで最も近い蛍光タンパク質の配列の 60% 未満しか一致しません。
自然の突然変異率に基づくと、このレベルの配列の違いは「5 億年以上の進化」に相当するらしいです。

あらためて、生物進化の層の厚さを感じますが、その符合率でさえ本来に近い明るさを実現したという能力にも驚きです。

開発内容は非公開ですが、少なくとも1000億パラメータ以上の大規模基盤モデルを実装しているようです。

実際このESM3は、あまりにも性能が高いため、計算能力のリスクを管理するために米国政府への報告が義務付けられています。
また、だれでもアクセス可能なオープンソース版のESM3は、危険なウイルスや病原体を生成できないように設計されています。

今回は発光タンパク質ですが、記事内では他にも応用の声はあがっています。特に持続可能性や医薬品開発など多岐にわたる応用を視野に入れており、例えばプラスチックを食べる酵素などが企画されています。

ある有名な言葉を借りると、
「人工タンパク質の夜明けは近いぜよ!」
ですね。

いいなと思ったら応援しよう!