ノーベル賞2024自然科学部門の橋渡し
2024年ノーベル物理学賞は「人工ニューラルネットワークによる機械学習を可能にする基礎的な発見と発明」に対してJohn Hopfield博士とGeoffrey Hinton博士に、ノーベル化学賞は「コンピューターによるタンパク質設計手法の開発とタンパク質構造予測プログラムの開発」に対してDavid Baker博士、Demis Hassabis博士、John M. Jumper博士に、ノーベル生理学・医学賞は「miRNAと転写後の遺伝子発現の調節におけるその役割の発見」に対してVictor Ambros博士とGary Ruvkun博士に贈呈された。
今回のノーベル賞は、大雑把に分野でいうと、計算論的神経科学、バイオインフォマティクス、分子生物学からの受賞である。分子・神経・情報科学を勉強してきた僕にとって、ここまでなじみのある分野の研究がノーベル賞を独占することは今後ないだろうし、それぞれのトピックに詳しい人は多くても、そのどれもに精通する人は少ないと思われるので、簡単な解説とそれらのつながりを記す。
ノーベル物理学賞:ニューラルネットワーク
人工ニューラルネットワークは、脳を模倣した情報処理をするネットワーク構造で、情報処理の素子であるニューロンとそのつながりであるシナプスからなる。古くは脳のネットワークの機能を再現するために使われていたが、1980年代の誤差逆伝搬の(再)発見、2010年頃のデータ量と計算能力の増大によるブレークスルーを経て現代のディープラーニングブームにつながっている。
受賞対象の1つのホップフィールドネットワークは、スピンシステムからインスピレーションを得て、連想記憶を実現するネットワークとして提唱された。ネットワークに不完全なパターンが与えられると、保存されたパターンの中で最も類似しているパターンを見つけることができる。
もう1つの受賞対象のボルツマンマシンは、統計物理学のアイデアを使用して作られた情報のクラスタリング(教師なし学習)ができるネットワークである。可視ノードと不可視ノードの2種類のノードから構成され、それらが相互に結合した確率的ネットワークで、エネルギー関数を最小化するように学習が行われる。
ノーベル化学賞:タンパク質構造予測・設計
タンパク質はDNAの情報から20種類のアミノ酸の組み合わせがひも状に結合することででき、3次元的に折りたたまれることで特有の構造をとる。構造は機能に直結するので、タンパク質構造予測は構造生物学におけるグランドチャレンジであった。
この問題は長らく非常に困難な問題として知られていたが、2億種類ものタンパク質について8割から9割の精度で解いたといわれているのがAlphaFold2である。
配列からタンパク質の構造を予測するという問題の逆問題である、理想の構造を実現する配列を設計するという問題がタンパク質設計である。David Baker博士のチームは、Rosettaというソフトウェアを用いて、目的の構造と類似するタンパク質の検索、検索したタンパク質断片のエネルギーランドスケープを介した最適化を行った。実際に設計された自然界に存在しない初めての新規のタンパク質が以下のTop7というタンパク質で、創薬などにつながるde novoタンパク質設計の道を切り開いた研究であった。
ノーベル生理学・医学賞:マイクロRNA
すべての細胞は基本的に同じ遺伝子を持つが、異なる組織で特有の遺伝子発現の調節を受けることで、異なる機能を発揮する。最も重要で最もよく研究されているのはDNAの転写段階における調節である。一方で、転写が終わればその後は調節が効かなくなるわけではなく、メッセンジャーRNAができたのちにタンパク質に翻訳させる段階でも調節は行われる。これは、転写後調節と呼ばれている。
今回の生理学・医学賞の対象はそんな転写後調節で重要な役割を果たすマイクロRNAの発見であった。マイクロRNAはタンパク質をコードしない約22塩基の1本鎖RNAで、特定のメッセンジャーRNAへ相補的に結合し、翻訳を抑制したり分解したりすることで遺伝子発現の抑制を行う。
ノーベル物理学賞と化学賞:AI革命
ノーベル物理学賞と化学賞は、どちらもAI・機械学習・ディープラーニング関連の研究が受賞したとして話題になった。より正確に言うと、ノーベル物理学賞の対象となったホップフィールドネットワーク・ボルツマンマシンはディープラーニングの原型である人工ニューラルネットワークの初期の形であり、ディープラーニングをタンパク質構造予測・設計に応用したのがノーベル物理学賞の対象となったAlphaFoldやRosettaであるといえるだろう。
より詳細なネットワーク構造に踏み込むと、AlphaFoldを世間に知らしめたAlphaFold2はTransformerという注意機構を用いることでタンパク質構造予測でブレークスルーを達成したが、最新のAlphaFold3では生成モデルの一種である拡散モデルをベースとしている。ボルツマンマシンは生成モデルの原型であり、ホップフィールドネットワークとトランスフォーマーには対応関係があることが知られているというつながりがある。
化学賞受賞者の1人Demis Hassabis博士はDeepMind立ち上げ前に認知神経科学分野でヒト海馬の記憶の想起に関する研究をしており、海馬の連想記憶のモデルであるホップフィールドネットワークも取り扱っていたと考えられる。
ノーベル化学賞と生理学・医学賞:セントラルドグマ
タンパク質構造とマイクロRNAは、分子生物学のセントラルドクマという大きな枠組みからとらえると重要性が分かりやすい。セントラルドグマとは、DNAに蓄えられた情報がmRNAに転写され、タンパク質に翻訳されることで機能するという原則だ。過去にも核酸の配列決定やタンパク質の翻訳に関する研究がノーベル賞を受賞している。
タンパク質の構造は機能に直結するため、タンパク質の構造予測・設計は翻訳される遺伝子の機能を知るために重要である。一方で、生物学は例外も重要で、タンパク質に翻訳されずに他の遺伝子の発現抑制を担うマイクロRNAは翻訳されない遺伝子の機能として重要である。ノーベル賞を頻発するセントラルドグマは今でも生物学における中心なのだなあと思う。
次世代シークエンサーが開発されて配列コストが低下して以来、ゲノム配列がものすごい勢いで蓄積している。バイオインフォマティクスの分野では、これらの配列情報を生かして解析が主流であり、マイクロRNAのターゲットとする抑制遺伝子の予測やタンパク質の立体構造予測が盛んにおこなわれているというつながりもある。
ノーベル生理学・医学賞と物理学賞:線虫
マイクロRNAとホップフィールドネットワークは共通項を見つけるのが難しい。少し主観的になるが線虫という1ミリの虫を介してつなげてみたい。マイクロRNAは線虫が大きくなる突然変異体の遺伝子を調べてみたらタンパク質に翻訳されない他のmRNAに相補的なRNAをコードしていたという経緯で見つかっている。このように線虫はミクロな分子レベルとマクロな表現型レベルをつなぐのに適したモデル生物である。
一方で、線虫はすべての神経の解剖学的つながりが解明されており、2次元でしか動かないため行動計測がしやすいといった特徴から、分子生物学のみでなく、神経科学の分野でも広く使われている。(ちなみに、長らく成体の神経系のつながりが分かっていたのは線虫のみであったが、2024年にやっとショウジョウバエの成体脳のコネクト-ムが明らかにされた。)さらに線虫もホップフィールドネットワークのように温度と餌、化学物質と餌の連合学習をすることができる。
もちろんマイクロRNAの解析にもディープラーニングの技術は使われており、例えばHyenaDNAは、ゲノムからマイクロRNAなどのノンコーディングRNAを含めた機能予測を行うDNA言語モデルである。
John Hopfield博士はネットワークの研究以前は、DNA複製における動的校正を用いたエラー訂正のメカニズムという、セントラルドグマ関連の研究をしていたというつながりもあるようだ。
今年のノーベル賞ウィークを通じて、「あの発見がついにノーベル賞をとったんだ」、というわくわく感があった。やっぱり生物学を広く学んでいてよかったなあと思うし、このわくわくを少しでも共有できていたとしたら幸いである。
参考文献
https://en.wikipedia.org/wiki/John_Hopfield
https://en.wikipedia.org/wiki/Geoffrey_Hinton
https://en.wikipedia.org/wiki/David_Baker_(biochemist)
https://en.wikipedia.org/wiki/Demis_Hassabis
https://en.wikipedia.org/wiki/John_M._Jumper
https://en.wikipedia.org/wiki/Victor_Ambros
https://en.wikipedia.org/wiki/Gary_Ruvkun
https://zenn.dev/tonets/articles/dd8c3855eadb2b
https://arxiv.org/abs/2112.04035
https://www.nature.com/articles/s41586-024-07558-y
https://arxiv.org/abs/2306.15794