見出し画像

Deep Generative Design of RNA Family Sequences

2023年度研究会推薦博士論文速報
[バイオ情報学研究会]

角 俊輔
(東京大学 定量生命科学研究所 特任助教)

邦訳:RNAファミリー配列の深層生成設計

■キーワード
合成生物学/RNAバイオインフォマティクス/生成モデル

【背景】RNA合成生物学においてRNA配列改変は重要な問題
【問題】人間には高精度なRNA配列改変は困難
【貢献】設計成功率の高いRNA生成モデルを作成

 RNAは,DNAと並んで生命活動に欠かせない重要な分子です.RNAは,遺伝情報を伝えるメッセンジャーRNA(mRNA),タンパク質合成を行うリボソームRNA(rRNA)など,いろいろな機能を持つものが存在することが分かってきました.そこで,逆に,医薬品などに役立ちそうなRNAを人工的に作成しようとする試みが近年盛んです.その例の最たるものとして,近年のコロナウイルスに対するmRNAワクチンなどが挙げられます.

 しかし,RNAの配列(文字列の並び)はとても多様で,実験だけでは望みの配列を見つけるのが難しいという問題がありました.RNAの配列は長さが増えるほど指数関数的に多様になるため,実験だけで探すのには時間や資源などの限界があります.さらに,RNAは配列間の相互作用によって決定される構造(RNAの折りたたみ方)も大事であり,問題は複雑です.そこで,コンピュータを使ってRNAの配列を効率的に設計する方法が求められていました.

 この研究では,AIの一種である深層生成モデルを使って,「RfamGen」というRNAの配列を設計する方法を開発しました.RfamGenは既存のデータの特徴を学習し,それを基に新しいデータを生成することができます.RfamGenはこの深層生成モデルを使って既存のRNAの特徴を学習し,新しいRNAの配列を生成します.

 RfamGenの特徴は,RNA familyという概念を取り入れていることです.RNA familyとは,配列と構造が似ているRNAのグループのことです.RfamGenは,このRNA familyの特徴をとらえることができる「Covariance Model(CM)」という数理モデルと,深層生成モデルの一種である「Variational Autoencoder(VAE)」を組み合わせています.これにより,既存のRNAの特徴を再現しながら新しいRNAの配列を生成することができます.

 RfamGenが生成したRNAの配列を調べたところ,既存のRNAと似た特徴を持ちながらも,新しい配列であることが確認できました.また,生化学実験で実際にRfamGenが生成したRNAを使ってみたところ,配列が望みの機能を持っていることが確認できました.さらに,自己切断リボザイムという特定のRNAを使って,RfamGenの性能を詳しく調べました.自己切断リボザイムは,自分自身を切断する機能を持つRNAです.RfamGenを使って1000個の自己切断リボザイムの配列を生成し,それらの機能を調べました.比較のために,データベースに登録されている約800個の自然界に存在する配列を調べました.その結果,RfamGenが生成したRNAの配列は,ほとんどすべてが自己切断活性を持っていました.さらに,RfamGenが生成したRNAの配列は,自然な配列よりも高い活性を持っていることがわかりました.このほかにも,RfamGenは配列の可視化や配列の活性予測を可能にすることも副次的に分かりました.

 これらの結果から,RfamGenは効率的なRNA配列の設計方法であり,RNAを使った医学や産業の発展に役立つと期待されます.RfamGenを使えば,望みの機能を持つRNAを効率的に設計することができます.これにより,RNAを使った新しい医薬品の開発や,産業用の優れた酵素の創出など,さまざまな分野での応用が期待できます.

(2024年5月31日受付)
(2024年8月15日note公開)

ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー
 取得年月:2024年3月
 学位種別:博士(医学)
 大学:京都大学

ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー

推薦文[メディア知能情報領域]バイオ情報学研究会
本研究では,深層生成モデルを用いて機能性RNAの配列を自在にデザインするRfamGenというプログラムを開発しました.少ない学習データから効率的に機能性RNAを生成でき,天然RNAよりも高い活性を持つ配列も作れることを示しました.RNA工学や医療応用の発展が期待されます.

研究生活  私は,合成生物学という分子システムを人工的に設計する分野が何やら楽しそうだなと,気軽な気持ちで博士課程に進みました.その後で機械学習を使った分子設計が重要だと思い至り,他の大学の先生に研究指導委託をお願いしたい旨を教授に相談して,生物系と情報系の2人の先生からご指導を受けることができました.技術と応用の両方面に関して問題を考えることができたのは私にとって非常に贅沢な時間で,良い選択だったと思っています.

博士課程も今も,研究生活は全体的に非常に楽しくエキサイティングです.しかし,上手くいかないときも多くあり,順調な博士課程だったとは言えません.自分の研究を信じてやってきたつもりですが,実際のところ,家族・友人・ラボメンバー・同分野の方々からの励ましのおかげで乗り切ることができました.多くの博士課程は楽ではないと思いますが,研究が好きなら検討する価値は十二分にあります.これをきっかけとして,多少なりとも関心を持っていただけたら幸いです.