見出し画像

顕微鏡vsシークエンス~バイオテクノロジーにおける収斂進化~

顕微鏡を用いたイメージングは、17世紀にロバート・フックが細胞構造を観察して以来、様々な生物学的現象の構造・機能を視覚的に明らかにするために用いられてきた。

DNAシークエンス技術は1970年代にフレデリック・サンガーにより開発され、2000年代序盤のヒトゲノム解読プロジェクトを経て現代の次世代シークエンサーへと発展し、生物や種の機能を網羅的に明らかにするために用いられてきた。

このように、顕微鏡は画像をイメージングし、シークエンサーは配列を解読する手法のため、一見全く異なる手法のように思える。しかし、現代の生物学では同じ目的のために顕微鏡を用いたイメージングとシークエンスベースの手法が開発されているという場面が多々ある。これはまるで生物が類似の環境に適応する際に独立に同様の解決策を見つける収斂進化のようであり、非常に興味深い。ここでは、空間的顕微技術、転写物の総体の特定(トランスクリプトーム)、タンパク質の構造決定について紹介する。


①空間的顕微技術

生物を構成する細胞や分子とその位置関係を観察するために、顕微鏡が多大な貢献をしてきた。光学顕微鏡は生きたままの細胞や蛍光マーカーでラベル付けした分子を最大0.2 μm程度の解像度で観察するために用いることができ、電子顕微鏡はより高い解像度(0.2 nmほど)の画像を得ることができる。近年では光学系や解析方法の工夫、試料自体を拡大するExpansion microscopyなどにより光学顕微鏡でも光の波長に制限される解像度を突破する超解像顕微鏡が開発されている。

そんな中、シーケンスすることによる新しいモダリティの空間的顕微技術として、2019年に提唱されたのがDNA microscopyである。この論文の第一著者の研究室ホームページの例に則って、この技術を説明を行う。まず、地球上のすべての人の位置を特定する方法を考える。一つは、人工衛星を打ち上げて上空から地球の写真を撮るという”outside-in”のアプローチである。もう一つは、それぞれの人の持つBluetooth間の相対的な位置関係から全体の位置関係を事前知識なしに再構築するという”inside-out”のアプローチである。この例での”人”を”生体分子”に置き換えると、前者は顕微鏡による観察、後者はDNA microscopyに対応する。

出典: DNA Technologies for the Next Generation of Biology (wlab.bio)

DNA microscopyでは、マーカーとしてランダムな人工DNAをそれぞれの生体分子に結合させる。その後、分子を拡散させて相互結合したネットワークを形成させる特殊なPCR法により、組織内の生体分子の近接性をDNAの配列情報にエンコードし、超並列シークエンスと計算機アルゴリズムにより元画像をデコードする。DNA microscopyにおいて位置情報のマーカーとなるDNA分子の長さ(10塩基対で約3.4 nm)は光学的な顕微鏡の解像度を制限する光の波長(数百nm)より短いため、光学限界を突破できる可能性がある。オリジナルの論文は2次元的な培養細胞への応用で細胞集団らしきものを再構成できるという程度だったものの、3次元のゼブラフィッシュ幼生全身への応用や、シングルセルプロテオミクスへの応用が発表されている。

また、シークエンスによって生体分子・細胞の近接情報を読み出すというアイデアは、ゲノムについてはHi-Cが、神経細胞の結合(コネクトーム)についてはMAPseqなどが以前から提案されており、これらの手法はすでに広く使われている。

②トランスクリプトーム

遺伝子発現を調べるための方法として、古典的にはマイクロアレイなどの核酸の結合をイメージングする手法が使われてきた。しかし、この手法では、既知の遺伝子しか調べられない、定量化が煩雑でスケールしにくいなどの問題点がある。近年は次世代シーケンサーを用いて網羅的にRNAをシークエンスし、トランスクリプトームを明らかにするといった手法がとられるようになってきた。シークエンス手法はその汎用性と拡張性から、1細胞のトランスクリプトームを得るシングルセルトランスクリプトーム、空間情報も同時に読む空間トランスクリプトームやメチル化やアセチル化情報も取得するエピトランスクリプトーム、クロマチンの開閉情報の取得、アイソフォームを含めた定量化などに応用されている。

一方で、光学的な手法のみで遺伝子発現を推定する試みとして、ラマン散乱分光がある。ラマン散乱とは、特定の波長の光を標的となる分子へ照射した際に、その分子が持つ固有振動モード等に依存して波長がずれた光が散乱される現象で、“分子の指紋”と呼ばれる。スペクトルとして観測される生体内の情報を非破壊、非標識で取得できるという利点があり、光学顕微鏡と組み合わせた顕微ラマン分光では微小な化学物質のスペクトルと空間情報を同時に得ることができる。しかし、ラマンスペクトル低次元の情報から数千、数万次元に及ぶトランスクリプトームを推定するのは不可能に思える。ラマンスペクトルとトランスクリプトームの変動に強い相関があり、トランスクリプトームの変動が低次元に拘束されているために機械学習を用いるとこれが可能であるという研究がなされており、今後どこまでこれが適用可能なのか楽しみである。

③タンパク質の構造決定

DNAが生物のゲノム情報を格納する分子的実体であるとすれば、タンパク質は生体内で実際の機能を担う分子的実体であり、その機能は構造によって規定される。タンパク質の構造決定は従来はX線結晶構造解析やNMRといった方法によって行われてきた。

近年はクライオ電子顕微鏡(CryoEM)により多数の単分子を低温で動きを止めた状態で撮影し、画像の統計的な処理と3次元再構築を行うことで構造を決定するという手法が発展し、これにより実験的に構造決定されるタンパク質の数が増大している。もともとは高分解能を得るのが困難であることが難点であったが、2020年にはCryoEMを用いて2Å以下の原子分解能でタンパク質の構造決定が達成され、話題になった。

そんな中2021年にタンパク質構造決定の業界に衝撃を与えたのがAlphaFoldである。

AlphaFoldはタンパク質のアミノ酸配列からタンパク質の構造を決定するアルゴリズムで、実験と同精度の構造を網羅的に出力することができる。タンパク質のデータバンクに登録されている実験的に決定されたタンパク質の構造数は数十万のオーダーであるのに対し、現在AlphaFold DBでは2億以上のタンパク質の構造予測がアクセス可能になっている。また、AlphaFoldをもとに開発されたAlphaMissenseは、ヒトプロテオームの1塩基置換に病原性があるかを予測するモデルであり、その応用は医療分野へも波及している。

他にもMetaの開発したESMFoldは構造予測の計算負荷が軽く、細菌等のメタゲノムから6億以上のタンパク質の構造を予測している。また、別のタンパク質構造予測アルゴリズムRoseTTAFoldと画像生成などで成功を収めている拡散生成モデルを組み合わせ、様々な目的に合わせたタンパク質骨格をde novoでデザインすることができるRFdiffusionという手法も開発されている。

まとめ

トランスクリプトームを光学的な手法を用いて計測する手法も紹介したものの、全体的には今までイメージングベースで行われていたことがシークエンサーの驚異的なスピードでの発達により、配列解読でもできるようになってきたということが多そうだ。もちろんそれぞれの手法に利点、欠点があり今後どうなっていくかは分からないが、機械学習の分野で画像解析にCNNが用いられていたものが、もともと自然言語処理で発達したTransformerベースの手法に置き換えられていっているのと類似していて面白い。

参考文献

DNA Microscopy: Optics-free Spatio-genetic Imaging by a Stand-Alone Chemical Reaction: Cell
Volumetric imaging of an intact organism by a distributed molecular network (biorxiv.org)
Molecular Pixelation: Single cell spatial proteomics by sequencing | bioRxiv
Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome | Science
High-Throughput Mapping of Single-Neuron Projections by Sequencing of Barcoded RNA: Neuron (cell.com)
Sequencing the Connectome | PLOS Biology
The dawn of spatial omics | Science
Linear Regression Links Transcriptomic Data and Cellular Raman Spectra - ScienceDirect
Revolutionary cryo-EM is taking over structural biology (nature.com)
Single-particle cryo-EM at atomic resolution | Nature
Highly accurate protein structure prediction with AlphaFold | Nature
AlphaFold Protein Structure Database (ebi.ac.uk)
Accurate proteome-wide missense variant effect prediction with AlphaMissense | Science
Evolutionary-scale prediction of atomic-level protein structure with a language model | Science
De novo design of protein structure and function with RFdiffusion | Nature

顕微鏡とDNAシーケンシング、二つの技術が進化し、生物学的現象を視覚化し、機能を解明する道を開いた。現代の生物学では、これらが組み合わさり、空間的顕微技術、トランスクリプトームの特定、タンパク質の構造決定といった新たな領域が開拓されている。それはまさに、科学の新たな地平を切り開く冒険である。

ChatGPTを用いて要約
サムネイル画像はDALL-Eにより生成