
DIYバイオとAIとの可能性について語る
(解説されているのはあくまで個人の感想です)
合成生物学とタンパク質
DIYバイオのベースになっている合成生物学では、ある特定の条件に適切な振る舞いを行うように生物を「設計」します。
この振る舞いを成り立たせるのがタンパク質です。

「タンパク質」と聞くと、食品などに含まれている必須成分などと考える方もいると思いますが、それは栄養学上での話です。
生物学上での「タンパク質」は、「アミノ酸」と呼ばれる物質が繋がって特定の構造をとっている言わば「分子レベルの機械」で、自身が持つ配列から構造が決まり、その構造にによって化学反応や遺伝子の調節など、さまざまな役割が決まります。

タンパク質の情報は遺伝子に記録されており、遺伝子を組み合わせることで、条件に応じて細胞の性質や振る舞いを変化させることができます。
記録されているタンパク質によって遺伝子の働きがことなるため、適切なタンパク質が記録されている遺伝子を探すことは、細胞を正しい形で「プログラミング」するのに非常に重要になります。
タンパク質の設計と合成生物学

合成生物学では現在、自然界に存在するタンパク質を使うことがほとんどです。
例えば、βカロテンを作る微生物を作りたい場合、自然界でβカロテンを合成する過程に関わる酵素を使います。
しかし、この方法では、自然界に存在しない機能を持たせることができないため、限界があります。

そこで重要になってくると思うのはタンパク質工学です。
目的の機能を持ったタンパク質を一から(de novoで)作ることで、自然界にはない新しい機能を持たせることができるでしょう。
タンパク質工学の第一人者は、つい昨年、ノーベル化学賞を受賞したデビッド・ベイカー博士です。
彼は、自然界にはない反応を引き起こす酵素や、核酸に結合する自然界にはないタンパク質を設計しています。
彼はRossetaというツールを開発しており、彼が考案した手法で実際にタンパク質を設計することができます↓
AIとタンパク質工学

タンパク質が設計できるようになったとしても、素人が簡単に解析できるようになるのかは話が別です。
従来、タンパク質の構造を決定するのに使われていたX線結晶解析法では、解析にとても高度な機材が必要でした。
また、解析にはタンパク質を結晶化させる必要があるのですが、これにも高い技術力が必要になります。
また、先程述べたRossetaというツールを使うためには、高度な構造物理学的な知識が必要です。
実際、ガイドを見てみても非常に難解で、素人が内容を完全に理解するのは不可能に近いでしょう。

それを解決するのが、近年話題になっている「タンパク質言語モデル」というAIです。
タンパク質の構造や機能はそのタンパク質を成り立たせるためのアミノ酸配列から決まるので、アミノ酸配列を言語とみなし、AIでタンパク質を生成しようというわけです。
「Alphafold」というAIは、ChatGPTに使われている「Tranceformer」と呼ばれる技術を基にして、タンパク質を構成しているアミノ酸の配列を入力するだけで、たった数分でそのタンパク質の構造をほぼ正確に予測することができるようになりました。
その功績から開発者ら2人は、先ほどのベイカー教授と同じくノーベル化学賞を受賞しています↓
また、Meta社からのスピンアウト企業「EvolutionaryScale」が開発している「ESM3」というモデルでは、構造を予測するだけでなく、タンパク質のアミノ酸配列や構造データ、機能のキーワードなどのを組み合わせて作ったプロンプトをもとに、望みのタンパク質をデザインすることができます↓
ChatGPTなどに「こういう文章書いて!」と指示することで望みの文章を生成してもらうのと同じです。
他にも、タンパク質や小分子に結合するタンパク質構造を設計する「RFdiffusion 」や「RFDiffusion-All-Atom」、そこからアミノ酸配列を予測する「ProteinMPNN」「LigandMPNN」などが開発されています。
このように、AIは専門家さえ難解であったタンパク質の設計や解析を、簡単にさせられる力を秘めているのです。
一般人が使えるようにするには?

AIの台頭でタンパク質工学が専門知識なしで使えるようになるほど簡便になったとしても、それが一般市民にとっても使いやすくなっているかどうかも話が別です。
ESM3を使うためには、Pythonというプログラミング言語が必要です。
そのため、プログラミング言語を知らない一般の方にとってはまだハードルがあります。
そのため、わかりやすいUIで、直感的にタンパク質を設計するツールが開発されていけば、ハードルがさらに低くなることが予想されます。