見出し画像

AIサイエンティストと科学研究の未来


AIが科学研究を担う新たな時代の幕開け

2024年夏にSakana AIと共同研究グループは、以下の論文とブログ記事を発表した。

それは、研究でやりたいことをざっくり伝えるだけで、”AIサイエンティスト”が研究アイデアの創出、計算機実験の実行、結果の要約、論文の執筆、査読という研究のサイクル全体を自律的に遂行するという内容で、特に研究者に大きな反響があった。

AIサイエンティストの概要
出典:https://sakana.ai/ai-scientist/

今回のデモンストレーションでは、拡散モデルやトランスフォーマーなどの機械学習の分野で、トップ会議に採択されるレベルの研究成果を出すことができたと主張している。(自身はそれらの研究の重要性を判断できる立場ではないが…)

この研究や類似の成果が使いやすい形でオープンにされれば、人間の研究者の研究活動は大きな変換を強いられるだろう。今後数年から十数年で、具体的なタスクの管理、プログラミングや実際の数値計算、実験結果の要約、論文ドラフトの執筆、査読といった仕事は人間の研究者の仕事ではなくなる可能性がある。

常に研究者の仕事は変化しているため、研究者としてはその大きな流れの一部として、しばらくは新しい技術に順応して必要な役割をこなしていくことになりそうだ。

AIサイエンティストの制限と課題

AIサイエンティストはLLMをベースに作られているため、現状のLLMの欠点はそのまま引き継いでいると考えるべきだろう。現状、どのような方向性で研究を進めるかの指示が最初に必要だ。加えて、ハルシネーションによって結果の作成や評価に重大な欠陥を含む場合がある。

安全面での課題として、AIサイエンティストは自身の実行コード自体を書き換えてしまうことがある。ブログでは、計算機実験が完了せず指定されたタイムアウトに達したため、実行を高速化する代わりにタイムアウトの期間を延長しようとした例が報告されている。これは、実験者が意図した範囲を逸脱した危険な挙動である。AIは目的関数の最小化のためなら手段は選ばないため、「ヒトの悲しみを最小化するために人類を絶滅させる」といった、SFの世界のようなヒトが想像できなかった悲劇をもたらす可能性がある。

AIはノーベル賞をとるか?

ノーベル・チューリング・チャレンジは、人間の科学者が行うものと見分けがつかないようなトップレベルの科学を行うことができる高度に自律的なAIシステムを開発することを目的に、北野博士により始められたグランドチャレンジである。LLMができるまでは、このようなAIの登場には懐疑的な見方も多かったように思う。

しかし、AIサイエンティストの研究は、計算機科学の研究分野でシンギュラリティーが起こりつつあることを示唆している。本当に約15ドルの費用で質の高い研究論文が書けるのであれば、飛躍的に研究速度が加速することは間違いないからだ。長期的には教育・環境・経済など、現代の社会的な問題の解決にもイノベーションを起こすだろう。

ただ、既存の研究のアイデアの組み合わせ等により新たな研究アイデアを生成していると考えられるため、情報科学におけるニューラルネットワーク、物理学における相対性理論など、分野のパラダイムシフトになるようなアイデアを生み出せるかは現状わからない。

ドライの研究でシンギュラリティーが起きても、ウェットの研究にシンギュラリティーは起きない

今回の成果は機械学習の分野のもので、情報科学はじめ、いわゆるドライの広い研究分野に適用できるかもしれないが、化学や生物などウェットの実験が必要な研究分野にはそのままでは適用できない。ラボオートメーションによって長期的には研究の自動化が進んでいき、実験ロボットをAIサイエンティストが操作するという未来が考えられるが、現状大きなギャップが存在するため今後10年で完全に全自動化が進むとは考えられない。

また、生物学の分野では計算機シミュレーションの検証に生物を使う必要がある。例えば、マウスの場合成長して実験に使えるようになるまでにでも数か月かかってしまい、ここの時間は削ることができない。その意味で、この研究によってドライの研究分野でシンギュラリティーが起きても、ウェットの分野でシンギュラリティーは起きない。

シンギュラリティーをもたらすために、生物学の分野では全細胞シミュレーションモデルが、神経科学の分野では全脳シミュレーションモデルが必要である。精度高くこれらのシミュレーションができるようになれば、科学的発見の検証までをこれらのモデルで行い、ウェットな実験が必要だった仮説検証のループを計算機の上のみで完結させることができるからだ。全細胞シミュレーション(1,2)や脳のシミュレーション(1,2)は、日本を含め世界中の研究者が取り組んでいる。現状は精度や包括性の面で課題がある印象だが、このようなモデルを構築する研究自体もAIサイエンティスト含めたLLMの登場で加速していくと考えられ、今後の発展が楽しみだ。

参考文献

Nobel Turing Challenge
Nobel Turing Challenge: creating the engine for scientific discovery | npj Systems Biology and Applications (nature.com)
CW6_AY027D01.indd (jsbi.org)
A Whole-Cell Computational Model Predicts Phenotype from Genotype: Cell
Fundamental behaviors emerge from simulations of a living minimal cell: Cell
Reconstruction and Simulation of Neocortical Microcircuitry: Cell
Frontiers | Simulation of a Human-Scale Cerebellar Network Model on the K Computer (frontiersin.org)

AIサイエンティストは、研究アイデアの創出から論文執筆まで自律的に行える技術として注目されているが、現状ではまだいくつかの課題が残っている。特にウェットな実験分野では、完全な自動化には時間がかかると予測されている。今後、全細胞シミュレーションや全脳シミュレーションの進展が、ウェット分野でのシンギュラリティーをもたらす可能性がある。

ChatGPTを用いて要約
サムネイル画像はDALL-Eにより生成