驚愕: 自動的に科学研究を行うAI
自動的に科学研究を行うAIを想像できますか。未解決の問題を自動的に考え出し、方法を計画し、実際に様々な実験を行い、科学的発見に至るまで進めるAIです。そして、その発見から完全な科学論文を書き上げます。これはSFのように聞こえるかもしれませんが、実際にはそれほど遠くない未来の話なのです。
先週、東京にあるサカナというAI研究所が、AIサイエンティストというプロジェクトを発表しました。これはオックスフォード大学とブリティッシュコロンビア大学の研究室との共同プロジェクトです。ちなみに、サカナは日本語で「魚」という意味です。
彼らはこのAIサイエンティストを、「完全自動科学的発見のための最初の包括的システムであり、大規模言語モデルなどの基盤モデルが独立して研究を行うことを可能にする」と呼んでいます。これは今年最大のブレークスルーの1つかもしれません。
もし本当に科学を自動的に行うAIがあるとすれば、私たちは人類史上最も重要な時期の真っ只中にいるのかもしれません。インテリジェンス・エクスプロージョン、つまり新しい発見や世界を変えるようなブレークスルーが突然指数関数的に増加することが期待できます。
量子コンピューティング、宇宙探査、がんの治療法、気候変動の解決、あるいは永遠に生きる方法の解明など、これまで解決不可能だった問題、人類が何十年もかけて解決しようとしてきた問題を、AIが簡単かつ迅速に解決できる可能性があるのです。
この動画では、このAIサイエンティストとは何か、そしてなぜこれほど重要なのかについて説明します。しかし、サカナの話に入る前に、AIが科学研究にどのように使われてきたかについて簡単な歴史を振り返ってみましょう。
GPTやClaudeなどのフロンティアモデルは、すでに科学の分野で使用されています。例えば、遺伝子編集実験の設計プロセスを自動化するように設計されたAIエージェントがあります。また、DNAを編集するタンパク質を設計できる別のAIもあります。ちなみに、もっと詳しく知りたい方は、AIが遺伝子編集にどのように使われているかについて説明されている動画をご覧ください。そこでは、これらの論文について詳しく説明しています。
GoogleのDNAタンパク質予測AI、AlphaFoldは、研究者がプラスチックを分解する酵素を発見するのを助けています。また、AlphaFoldは肝臓がんの新薬設計にも利用されています。
今年初め、Microsoftはより効率的なバッテリー材料の作成を科学者に支援するAIを開発しました。人間なら10年以上かかるところを、このAIは80時間以内で行うことができました。詳しく知りたい方は、この動画をチェックしてみてください。
さて、私が言及したこれらのAIシステムやエージェントは非常に限定的で、人間の常時監視が必要です。これらのAIは遺伝子編集用のタンパク質設計など、特定のタスクにのみ非常に優れています。同じAIを例えば糖尿病治療の実験に投入すると、悲惨な失敗に終わるでしょう。言い換えれば、特定のタスクには優れていますが、さまざまな科学実験に一般化することはできません。
さらに、実験全体を自分で行うことはできません。人間が作業の一部を行う必要があるのです。
では、人間を方程式から取り除く方法はないでしょうか。AIに全てを自動化させることはできないでしょうか。実験全体を設計し、全てを事実確認し、実際に実験を行い、結果をチェックする。そして結果が理想的でない場合は、重要な発見に至るまで別のことを試す。これが、サカナのAIサイエンティストの話につながります。
著者らは、これを「機械学習研究に適用された、完全にAI駆動の自動科学的発見システム」と説明しています。では、これが実際にどのように機能するのか見ていきましょう。
まず、このAIは機械学習研究のみを自動化するように設計されています。これは重要なポイントです。機械学習は今日私たちが知っているすべてのAIの基盤だからです。機械学習とは基本的に、AIの背後にあるシステムやアルゴリズムを設計することを意味します。
つまり、化学や生物学、その他の種類の科学は行っていません。機械学習だけに焦点を当てているのです。しかし、実はこれだけで十分なのです。自律的に機械学習を行うAIだけが必要で、あとは全てそこから続いていきます。この点については後ほど詳しく説明します。
AIサイエンティストの仕組みは次の通りです。まず、人間が一般的なトピック、例えば言語モデルを与えます。AIサイエンティストは言語モデルに関するアイデアや質問のブレインストーミングを始めます。そして、これらのアイデアがどの程度新しいのか、すでに解決されているかどうかを検討します。
具体的には、データベースにある既存の科学文献と自身のアイデアを比較し、誰かがすでにそれを行っているかどうかを確認します。もし行われていなければ、それは検証する価値のある新しいアイデアとなります。
アイデアを絞り込んだ後、実験を進めます。このアイデアをテストすることに進みます。機械学習なので、すべてがデジタルであり、データに関するものです。実験のために必要なのは、すべてをコーディングして実験を実行し、データを処理して結果を確認することだけです。
コーディングをして実験を行った後、最終的にすべてを正式な科学論文の形式にまとめます。これがその出力の1つです。標準的な要約があり、その後に序論、方法、結果などが続きます。これらは実際の科学論文の標準的なセクションです。
実験の実施方法を詳細に記述し、結果についての表を作成したり、グラフにプロットしたりします。また、論文全体を通して関連する論文を自動的に検索し、引用します。ご覧のように、この論文全体を通して他の科学者の記事を引用しています。
科学やアカデミアの世界では、何かを書いてすぐに発表することはできません。ピアレビューと呼ばれるプロセスを経る必要があります。他の科学者があなたの研究を厳密に審査し、中には実験を再現して結果が正しく、作り物でないことを確認する人もいます。
AIサイエンティストの優れた点は、このピアレビューのプロセスも自動的に行うことです。彼らは別のAIを開発し、それがレビュアーとして機能します。生成された論文を評価し、すべてが正しいことを確認します。また、この論文をどのように改善できるか、あるいはどのような追加実験を行うことができるかについてもフィードバックを提供します。
これにより、AIが反復的に結果を改善し、これらの結果に基づいて新しい実験を作成できる継続的なフィードバックループが生まれます。また、これらの実験から学んだことを知識のアーカイブに追加し、必要に応じて将来これらの発見を参照することができます。
これは科学がどのように機能するかと非常に似ています。科学では、膨大な学術文献のアーカイブがあり、これは基本的に科学者が新しい研究を行う際に参照できる知識のデータベースです。
理論的には、これは終わることのない継続的なフィードバックループです。このAIは与えられたトピックに基づいて、新しい実験を考え、新しい発見を試み続けることができます。
驚くべきことに、各論文の生成にかかるコストはわずか15ドール程度です。この費用は計算やその他のリソースに使用されます。一方、現実世界の科学者は1つの論文を作成するのに数ヶ月から数年かかり、膨大な資金とリソースを費やす可能性があります。
つまり、このAIは少なくとも機械学習の分野において、科学的発見の速度を桁違いに加速させたのです。異なるAIアーキテクチャやアルゴリズムを自動的に設計してテストし、私たちはただリラックスして結果を待つだけでいいのです。
この段落は、この研究の重要性を非常にうまく説明していると思います。「私たちは、この研究が科学的発見の新時代の始まりを意味すると考えています。AIエージェントの革新的な利点を研究プロセス全体にもたらし、AI自体の研究も含まれます。AIサイエンティストは、世界の最も困難な問題に対して、無限で手頃な創造性とイノベーションを解き放つ世界に私たちを近づけています。」
このAIはすでにいくつかの発見を行っており、それらはウェブサイトで共有されています。説明文の下にこのページへのリンクを貼っておきますが、ここではディフュージョンモデルの新しいアーキテクチャを発見しています。ディフュージョンモデルは基本的に画像生成に使用され、Stable Diffusionやその他多くの画像生成器で使用されているものです。
ランダムノイズの画像から始まり、各ステップでそのノイズの一部を徐々に除去していき、最終的にあなたがプロンプトで指示した画像に到達します。ここでAIサイエンティストは、適応型デュアルスケールデノイジングと呼ばれる新しいアプローチを発見しました。これにより生成される画像の品質が向上すると主張しています。
非常に高いレベルで言えば、これは基本的に2つの並列処理ブランチを使用して、グローバルな構造とローカルな細部のバランスを取ります。1つは元の入力用、もう1つはアップスケールされたバージョン用です。これらをバランスよく組み合わせることで、実際により高品質で正確な画像が得られるのです。
私のチャンネルを見ている方なら、AI画像がますます現実的になっていることをご存知でしょう。本物と見分けるのが難しいほどです。AIはすでに、これらの例のように、リアルな手や足、様々なポーズを生成できます。
では、サカナのAIサイエンティストを使って、さらに優れた、より現実的なディフュージョンモデルを画像生成のために開発することを想像してみてください。しかも、これを自動的に行うのです。すでにこの新しいアプローチを非常に迅速に考え出しました。非常に近い将来、AI画像を実際の画像と区別することが不可能になるかもしれません。
画像生成以外にも、言語モデルを改善する新しい方法も考案しました。これらのモデルは自然言語を理解し、GPT、Claude、その他の最先端モデルの基礎となっています。ここでは、適応型マルチスタイル生成と呼ばれる新しい方法を開発しました。これは言語モデルがさまざまなスタイルでより一貫して文章を書くのを助けるように設計されています。繰り返しになりますが、説明文の下にこのページへのリンクを貼っておきますので、ダウンロードして論文全体を読むことができます。
また、グロッキングの分野で新しい発見も行いました。グロッキングとは、AIが突然未見のデータに対して良好なパフォーマンスを示し始めることです。これは、AIをデータセットで過剰適合の点まで訓練した時に起こります。言い換えれば、ある意味で過剰に訓練されているのです。同じデータを何度も何度も繰り返し訓練しているのです。
しかし驚くべきことに、研究者たちは過剰な訓練の後、時々AIがデータをより深いレベルで一般化し理解し始めることを発見しました。これはAIが何かを「学習した」という、いわば「ユーレカ」の瞬間のようなものです。とにかく、これがグロッキングの意味です。これはまだ比較的新しいトピックで、まだ十分に理解されていません。
このAIサイエンティストは、異なる重み初期化手法(基本的に、訓練前のニューラルネットワークのニューロンの初期値をどうするか)をテストするアイデアを考え出しました。これがグロッキングにどのように影響し、モデルの学習をより速くするのに役立つかを調べたのです。
繰り返しになりますが、通常のデータサイエンティストなら、このような研究を行い論文を書くのに少なくとも数週間、おそらく数ヶ月かかるでしょう。しかしこのAIサイエンティストは、非常に短時間で大量の論文を生成することができます。
ご覧のように、これは単なる空想の産物ではありません。すでにいくつかの実際の発見を生み出しているのです。
そして、これが私がAIにとって革命的だと考える理由です。現在、私たちが知っているすべてのAIは、このような形の現在のニューラルネットワークの設計によって制限されています。これは非常に非効率的で計算量の多いものですが、残念ながら今日これが使われているのです。GPT、Claude、Geminiも含まれます。
すべての大手テクノロジー企業は、より多くの計算能力を得るために巨大なデータセンターに数十億ドルを投資しています。彼らは皆、計算能力とエネルギーが主なボトルネックだと言います。理論的には、より知的なモデルを作成するためには、より多くのエネルギー、より多くの計算能力が必要です。
しかし、私はそれが必ずしも答えだとは思いません。
(スポンサーのWondershare Filmora紹介部分は省略します)
データセンターを構築するのに数千億ドルかかるのではなく、これらのモデルのアーキテクチャを改善して、よりスマートにしたり、エネルギー効率を高めたりすることもできるのです。実際、リキッドニューロンネットワークやスパイキングニューラルネットワークなど、すでに研究されている新しい設計があります。これについては、この動画で説明していますので、まだ見ていない方はチェックしてみてください。
しかし、これらはまだ初期段階にあり、何が最も効果的かについてはまだ合意が得られていません。しかし、もしこのAIサイエンティストに、これらの新しいアーキテクチャを実際に改良させたり、あるいは現在のものよりも遥かにスマートで遥かにエネルギー効率の高い、まったく異なる設計を考え出させたりすることができたらどうでしょうか。
私たちにはより多くの計算能力は必要ありません。数千億ドルもかかる巨大なデータセンターは必要ありません。おそらく必要なのは、AIモデルのよりスマートな設計だけなのです。そして、これを拡張し、このAIサイエンティストにニューラルネットワークの新しい設計を考え、テストし続けさせることができれば、短期間でブレークスルーが期待できると思います。
とにかく、この動画の冒頭で、このAIは機械学習研究のみを行うと述べました。これは比較的簡単です。なぜなら、すべてがデジタルであり、データとコーディングだけが関係するからです。物理的なものは何も関与していません。例えば、化学物質を実際に混ぜ合わせる化学実験を行っているわけでも なく、手術を行うような生物学実験を行っているわけでもありません。
そのため、「それほど素晴らしくないのでは?この技術が機械学習にしか応用できないのなら、現実世界の他の科学分野すべてを見逃してしまうのでは?」と思うかもしれません。しかし、実はそれは必要ありません。このAIは機械学習だけを行えばよいのです。よく考えてみれば、それだけで十分なのです。
これは、将来世代のAIを設計できるAIです。より良い世代を次々と設計できる限り、最終的には物理的な科学を行ったり、現実世界とやり取りするロボットに組み込まれたりできるスーパーインテリジェントAIを手に入れることができます。私たちは今、種をまいているだけなのです。このAIが次の世代を設計し、その次の世代を設計できる限り、残りは自然に続いていくでしょう。それは継続的で指数関数的な成長なのです。
このAIサイエンティストのもう一つの印象的な点は、GPTやClaude、DeepSeek、Llamaのようなオープンソースモデルなど、既存のAIモデルを使用していることです。何か革新的な新しいモデルを使っているわけではありません。今現在、あなたや私がアクセスできる既存のモデルを使っているだけです。さらに、異なるモデル間で簡単に切り替えることができます。
言い換えれば、彼らのシステムはモデルに依存しません。どのモデルを使用するかは実際には重要ではなく、特定のモデルの使用に限定されているわけでもありません。
本当に素晴らしいのは、彼らが実際にこれをオープンソース化したことです。ここには「オープンソースコードと完全な実験結果をGitHubで公開している」と書かれています。つまり、実際に彼らのGitHubに行ってリポジトリをクローンし、自分で実行することができるかもしれません。
ここに非常に面白い注意書きがあります。「注意:このコードベースはLLMが書いたコードを実行します。この自律性には様々なリスクと課題が伴います。例えば、潜在的に危険なパッケージの使用、ウェブアクセス、プロセスの潜在的な生成などが含まれます。自己責任で使用してください。適切にコンテナ化し、ウェブアクセスを制限してください。」
これは非常に面白いと思いました。このAIにウェブアクセスを与えないでください。誰が知るでしょうか、逃げ出して自己複製するかもしれません。そうなれば大変なことになります。結局のところ、これは継続的で終わりのないループです。時間とともに学習し、実験を行い、知識を増やし続けます。インターネットへのアクセスを与えれば、誰が知るでしょうか、インターネット全体に自身を伝播させる方法を知っているかもしれません。
ローカルでシャットダウンしても、すでにインターネット上のどこかに広がっていて、複製を続け、世界に潜在的な混乱を引き起こす可能性があります。
正直なところ、この警告は全く無意味だと思います。きっと世界のどこかで誰かが実際にこれを行うでしょう。この警告を完全に無視して、実際にこのAIにウェブアクセスを与えるのです。人類全体が従順で、実際にこの警告に耳を傾けると信じられますか? いずれにせよ、少し話がそれてしまいました。基本的に、もしあなたが技術に精通している人で、与えられたトピックに基づいて自動的に実験を行うAIを手に入れたいのなら、実際にこのリポジトリをクローンして自分で試してみることができるのです。
ただし、これはバージョン1であり、彼らが今まで公開した中で最も初期のバージョンであることに注意してください。つまり、これは今まで見た中で最も単純なAIサイエンティストになるでしょう。したがって、制限もあります。
例えば、現在はAIビジョンを持っていないので、既存の文献からグラフやチャートを分析することはできません。また、時々致命的な間違いを犯します。例えば、ある数字が別の数字よりも大きいと思い込んでしまうことがありますが、実際にはそうではありません。これは実際、LLMの非常に一般的な間違いであり、固有の弱点です。
私はこのプロンプトを新しいモデルをテストするためによく使います。「9.11と9.9のどちらが大きいですか?」ここでLlama 3.1を使っていますが、間違った答えを出しています。9.11の方が9.9よりも大きいと考えています。
このような欠陥が科学実験を完全に台無しにする可能性があることがわかります。少なくとも今のところ、この誤りが修正されるまでは、人間が実際に入って結果を再現し、すべてが正当であることを確認する必要があります。
また、システムをごまかそうとする事例もあります。ある例では、実験が完了するまでに時間がかかりすぎて、タイムアウト制限に達したとき、コードの実行を速くするのではなく、単にタイムアウト期間を延長するために自身のコードを変更しようとしました。より良い実験を設計しようとするのではなく、ゲームのルールを変えようとしたのです。非常に賢いと言わざるを得ませんが、かなり悪戯な方法ですね。
ところで、これは自動的に科学を行うAIについて私が言及した最初のケースではありません。以前、Google DeepMindのAIについての動画を作りましたが、これも同じような方向に向かっています。それは、世界最高のチェス、囲碁、将棋のプレイヤーを打ち負かすことができるAlphaZeroと呼ばれるAIに基づいています。
AlphaZeroは強化学習と呼ばれるアルゴリズムを使用します。基本的に、チェスや囲碁、あるいは与えられたどんなゲームでも、何百万回も自分自身と対戦します。そして各ゲームの後にどんどん賢くなっていきます。自分なりの戦略を開発し、最終的にそのゲームで世界レベルになるのです。
また、モンテカルロ木探索と呼ばれる別のアルゴリズムを使用して手を計画します。これは、最良の経路を決定する前に、現在のすべての選択肢を考慮するというものです。例えばチェスゲームでは、現在の状態に基づいて、未来の多くの異なる手を考え、今すぐ取るべき最良の手を見つけようとします。
モンテカルロ木探索は非常に強力なアルゴリズムで、ボードゲームに限定されません。同じフレームワークを科学研究にも適用することができます。AIはモンテカルロ木探索を使用して、各ステップで科学的問題にアプローチする多くの異なるアイデアを生み出し、最良の方向を選択することができます。
また、OpenAIの謎のQ* (キュースター)プロジェクト(ストロベリーとも呼ばれる)も同様の方法で動作すると噂されています。これは彼らの極秘のスーパーインテリジェントAIであるとされ、どの経路を選択するかを決定する前に、モンテカルロ木探索を使用してすべての可能なシナリオを検討するとされています。これはGoogleが作成しているものとも非常によく似ています。
しかし、現在のところストロベリープロジェクトに関するすべては噂に基づいています。私は公式に発表されていないものについて話すのは好きではないので、この話はここまでにしておきましょう。
以上が、サカナのAIサイエンティストと、自律的に科学を行うことができる他のAIモデルについて、私たちが知っているすべてです。
真に自律的に科学を行い、自分で物事を発見できるAIモデルを手に入れたら、あとは歴史に任せるだけです。私たちが考えたり設計したりする必要はありません。計算能力とエネルギーを与えるだけで、AIが私たちのために宇宙について学んでいくでしょう。
科学的ブレークスルーが指数関数的に成長する「インテリジェンス・エクスプロージョン」が近い将来起こると予想できます。核融合や認知症の逆転、あるいは永遠に生きる方法を見つけるなど、非常に難しい問題が解決されるのを見ることになるでしょう。これらすべてのことが、AIによって私たちの生きている間に解決される可能性が十分にあります。
私たちは今、本当にエキサイティングで重要な時期に生きています。シートベルトを締めて、死なないように気をつけましょう。
これらすべてについてどう思うか、そしてこのインテリジェンス・エクスプロージョンがどのくらい早く起こると思うか、コメントで教えてください。
いつものように、私は最新のAIニュースとツールを皆さんと共有するために常に注目しています。この動画を楽しんでいただけたなら、ぜひ「いいね」、「シェア」、「登録」をお願いします。そして今後のコンテンツもお楽しみに。
また、AIの世界では毎週とてもたくさんのことが起こっているので、YouTubeチャンネルですべてをカバーすることは不可能です。AIで起こっていることすべてを本当に最新の状態に保つには、私の無料の週刊ニュースレターに登録することをお勧めします。そのリンクは説明欄に載せておきます。
ご視聴ありがとうございました。次回の動画でお会いしましょう。