見出し画像

18 デミス・ハサビス卿 - AIによる科学的発見の加速

6,950 文字

本日はこのような場所でお話しできることを大変光栄に思います。今日はできる限りの内容をカバーしたいと思います。最後に、量子コンピューティングとAIの関係について少し議論を呼びそうなスライドも1枚用意しましたが、時間が許せば触れたいと思います。
私の講演は「AIによる科学的発見の加速」についてです。ご存知の通り、DeepMindは2010年に設立され、人工汎用知能(AGI)を構築するためのアポロ計画のような取り組みを行っています。AGIとは、平均的な人間が持つすべての認知能力を備えた汎用的なAIシステムのことです。これはAI研究における大きなマイルストーンになると考えています。
DeepMind、そして現在のGoogle DeepMindのミッションは、人類全体の利益のためにAIを責任を持って構築することです。私たちは実際、ゲームから始めました。多くの方がご存知の通り、私たちの最初の大きな成果は2015年と2016年のAlphaGoでした。これは自己学習プロセスを通じて囲碁をマスターしたシステムで、今日見られる最新のAI研究の多くにインスピレーションを与えました。
なぜ囲碁が重要だったのでしょうか。90年代にディープブルーがチェスでガリー・カスパロフを破ったことは皆さんご存知ですが、囲碁が解決されるまでにはさらに20年かかりました。その理由は、囲碁がチェスよりもはるかに複雑なゲームだからです。囲碁には10の170乗の可能な局面があり、これは宇宙の原子の数よりもはるかに多いことからもその複雑さがわかります。
そのため、特定のゲームで最善手を決定するためにすべての可能性を列挙することは不可能でした。囲碁はあまりにも複雑で、プロ棋士に勝てるプログラムの開発は少なくとも10年以上先のことと考えられていました。世界チャンピオンに勝つことは言うまでもありません。
2016年、私たちは韓国で100万ドルの賞金をかけた有名な対戦を行い、世界中で2億人以上が観戦しました。AlphaGoは4勝1敗で勝利を収めました。単に勝っただけでなく、人類が3000年以上囲碁を打ち、数百年にわたってプロとして研究してきた中で一度も見られなかった新しい手や戦略を生み出しました。第2局の有名な第37手がその例で、これによってその試合に勝利しました。
AlphaGoの仕組みについて手短に説明させていただきます。これは、現在の最先端AIの未来について話す際に重要になってくるからです。これらのアイデアの一部は今また重要性を増しています。
私たちがAlphaGoとその後継バージョンのAlpha Zeroを訓練した方法は以下の通りです。まずランダムに初期化されたニューラルネットワークから始めて、それに10万回の自己対戦をさせ、そのデータセットを使ってバージョン2のシステムを訓練しました。バージョン2が目指したのは、特定の状況や局面でバージョン1がどのような手を指すか、またどちらが勝つ確率が高いかを予測することでした。
これら2つの予測ができれば、膨大な探索空間を現実的な時間で処理できる範囲まで絞り込むことができます。バージョン2を訓練し、バージョン1のデータに基づいて若干の改善を加えた後、バージョン1とバージョン2の間で100回の対戦を行い、どれだけ改善されたかを評価します。バージョン2がバージョン1に対して一定の統計的閾値(この場合は55%の勝率)を超えて勝てば、次のデータの生成者としてバージョン1をバージョン2に置き換えます。
その後、バージョン2で新たに10万回の自己対戦を行います。このとき生成されるゲームの質はバージョン1のときよりも若干高くなっています。そして、バージョン2が何をしたかを予測するバージョン3を訓練します。このプロセスを17回繰り返すと、ランダムな着手から世界史上最強のレベルまで到達します。現代のコンピュータでは8時間以内にこれを達成でき、この進化をリアルタイムで観察できるのは驚くべきことです。
もし新バージョンが旧バージョンに勝てない場合は、旧バージョンでさらに10万回の対戦を行い、そのデータをデータベースに追加します。これで20万回分のゲームデータを使って新バージョンを訓練することができます。これは非常に強力な自己学習システムです。
このモデルを使えば、探索木の各ノードを囲碁の局面と考え、現在の局面から可能な手のほとんど無限とも言える数の中から、限られた時間で青色で示された枝のようなごく一部だけを探索し、計算時間(例えば1分)が尽きたときに、ピンク色の枝で示されるような最善の継続手を出力することができます。
このモデルを使って効率的に探索プロセスを導くことができ、この非常に汎用的なシステムについては後ほど触れたいと思います。
私たちはゲームを実験場として使いました。DeepMindの初期段階では、アルゴリズムのアイデアを非常に効率的かつ迅速に証明するための完璧な実験場としてゲームを活用しました。ゲームでは進歩が明確にわかりやすく、勝敗やポイントなど明確な評価基準があるため、アルゴリズムの進歩を容易に確認できます。
しかし、もちろんこれは手段であって目的ではありません。私たちが目指したのは、単にゲームが得意なだけでなく、現実世界の問題に転用できる汎用的なアルゴリズムを生み出すことでした。
私たちは単純なAtariゲームから、現在のコンピュータで最も複雑なリアルタイム戦略ゲームまで、さまざまなゲームで画期的な成果を上げました。Alpha Zeroのようなプログラムは、囲碁やチェスだけでなく、あらゆる二人完全情報ゲームで世界チャンピオンレベルを超える性能を示しました。
これらのブレークスルーを達成した後、2016年から2017年頃にゲームから学んだ技術を使って、より重要な問題に取り組むことにしました。これは私が人生をかけてAIに取り組んできた理由であり、私の情熱でもあります。AIを科学的発見自体を加速させるためのツールとして使用することです。
問題を選ぶ際に、これらの手法に適した問題として何を探すのか。私は一般的に3つの基準を設けています。1つ目は、問題を巨大な組み合わせ探索空間または解空間の探索として記述・表現できることです。これらの手法に適しています。2つ目は、最適化して改善できる明確な目的関数や評価指標が必要です。そして3つ目は、モデルを学習するための大量のデータ、あるいは理想的には正しい分布から合成データを生成できる正確で効率的なシミュレーターが必要です。
実際、科学における多くの問題がこのように考えることができます。私の最初のリストにあり、20年以上前に初めて出会って以来考え続けてきた問題が、生物学における有名な大課題であるタンパク質折りたたみ問題です。アミノ酸配列のみからタンパク質の3次元構造を予測するという問題です。
会場の生物学者の方々はもちろんご存知でしょうが、この問題について詳しくない方のために説明すると、左側のようなアミノ酸配列(タンパク質の遺伝的配列と考えることができます)から、右側のような体内でのタンパク質の精巧な形状を即座に予測する必要があります。もちろん、タンパク質の3次元構造はその機能について多くを語ってくれます。機能を決定する唯一の要因ではありませんが、多くの情報を与えてくれます。
この問題が解決できれば、創薬や生物学的メカニズムの基礎的理解に非常に有用だと考えられます。2020年に開発されたAlphaFold 2は、この計算生物学における長年の課題の解決策として専門家から評価されました。私たちは、ほとんどのタンパク質について、1オングストローム未満の平均誤差で予測することができました。これは実験誤差と競合できるレベルで、生物学者にとって有用であるという閾値を常に満たしていました。
このシステムは正確なだけでなく、非常に高速だったため、その後1年かけて、現在科学で知られている2億のタンパク質すべての構造を予測し、毎年新しく発見される遺伝子配列のタンパク質構造も予測し続けています。これらは誰でも利用できるオープンソースのデータベースに追加され、欧州のEMBL-EBIにいる私の同僚たちが管理しています。
200万人以上の生物学研究者や医師がこれらの予測を利用し、これまでに25,000回以上引用されています。構造生物学分野に非常に大きな影響を与えました。私たちは特定のプロジェクトでも協力してきました。画面に表示されているものがその一部ですが、特に誇りに思っているのは、WHOのDNDiとの協力で、グローバルサウスなど世界の貧しい地域における顧みられない病気に関する取り組みです。
ウイルスや細菌のタンパク質構造を提供することで創薬を加速し、大手製薬会社が投資していない地域や疾病に対して直接創薬を進めることができるようになりました。科学者たちが予測やその基礎となるモデルを驚くべき範囲で活用している様子を見るのは、本当にやりがいがあります。
これらのシステムの進歩は続いており、今年初めにはAlphaFold 3をリリースしました。もちろん、生物学は静的なシステムではありません。AlphaFold 2は、これらのタンパク質構造の静的なスナップショットを提供すると考えることができますが、生物学は動的なシステムです。本当に重要なのは、これらのシステムや分子がどのように相互作用するかです。
AlphaFold 3は、タンパク質同士の相互作用、さらにはタンパク質と小分子(薬物分子など)、タンパク質とRNA、タンパク質とDNAの間の相互作用を予測することで、その方向への次のステップとなっています。これは、おそらく10年後には仮想細胞のシミュレーションや仮想細胞の予測が可能になるかもしれないという、その構築の始まりだと考えることができます。
私たちは生物学とAIの分野で、さらに広範な取り組みも行っています。画面には科学や数学の分野での取り組みの一部が表示されていますが、網膜スキャンからの網膜疾患の診断など医療分野でも多くの成果を上げています。また、EPFLと協力して核融合炉でのプラズマの制御や、気象予報にも取り組んでいます。
私たちは「GraphCast」という最先端の気象予報システムを持っており、従来のナビエ・ストークス方程式による手法よりもはるかに正確に、そしてはるかに迅速に10日間の気象予測を行うことができます。また、新しい特性を持つ新材料の設計や、それらの特性を事前に予測することにも取り組んでいます。
これは科学のためのAIに関する取り組みの一部に過ぎません。AGIへの道筋や、創造性と生産性のためのツールなど、他の分野でも取り組んでいます。もちろん皆さんは生成AIモデルをご存知でしょう。私たちも画像生成、動画生成、音楽生成で最先端のモデルを持っています。今では当たり前になってきましたが、5年前、10年前を考えると、テキストプロンプトだけで現実的な画像や動画、音楽のような創造的なものを生成できるAIシステムがあるというのは、まだ驚くべきことだと思います。
現在、注目を集めているのは、マルチモーダル基盤モデルと呼ばれるものです。これらの基盤モデルは、皆さんが使用したことのあるチャットボットや大規模言語モデルよりも汎用的です。これは次世代のモデルで、私たちのGeminiプログラムはその中で最も高性能なものの1つです。テキストだけでなく、画像、音声、動画、コードなど、マルチモーダルな推論が可能です。
これは私たち人間が相互作用するさまざまなモダリティを統合するものです。システムが本当に有用であるためには、私たちが置かれている文脈全体を理解する必要があると考えています。
今年、私たちはProject Astraというプロトタイプを開始しました。これは日常生活で役立つユニバーサルAIアシスタントという考えで、物事を推薦したり、やりたくない管理業務をこなしたり、科学の分野では研究アシスタントのような役割を果たすことができます。これは、GeminiをベースにしたProject Astraシステムが現実世界でどのような機能を持つことができるかを示す、非常に初期のプロトタイプのデモの2分間のビデオです。
[ビデオの内容:AIとの対話シーン。音を出すものの識別、創造的な頭韻の作成、コードの説明、場所の特定、メガネの位置の記憶、システムの高速化提案、シュレディンガーの猫の連想、バンド名の提案など]
これは、文脈を完全に理解するアシスタントがどのように役立つかの始まりに過ぎません。今は少し楽しい段階ですが、将来的にはグラスのような形で日常生活で携帯して使用するようなものになるかもしれません。
次に来るのは、そして今後1、2年で見られる大きなブレークスルーは、私たちがエージェントベースシステムと呼ぶものです。これらは単にQ&Aを行い、質問に受動的に応答するだけでなく、実際に世界で能動的に行動できるシステムです。計画を立て、推論し、世界で行動し、タスクを実行したり目標を達成したりできるシステムです。
私たちが本当に必要としているのは、最初にお見せしたAlphaGoシステムと現在のGeminiモデルを組み合わせたものです。それが私たちが取り組んでいることで、これらの計画システムの強みと、Geminiのような世界モデルの強みを組み合わせることです。ゲームモデルの代わりに、言語とこのマルチモーダルモデルを使って計画を立てるのです。
最後の数分で少し挑発的な話題に触れたいと思います。もちろん、先ほどの素晴らしい講演をされた量子コンピューティングの同僚たちには最大の敬意を表しつつ、AlphaGo以来、私は私たちが実際に何をしているのか、古典的なシステムの限界は何なのかについて長い間考えてきました。
古典的なチューリングマシンは、以前考えられていたよりもはるかに多くのことができると言えると思います。私たちは古典的なシステム(チューリングマシンで具現化される)の限界を押し広げるチャンピオンのような存在だと考えています。
ブロック教授も言及されていましたが、量子コンピューティングの研究者の多くは古典的なコンピューティングを、一見もっともらしいですが、私の意見では少し時代遅れの見方をしています。つまり、量子システムをシミュレートするには、単純にブルートフォース的なやり方でやる必要があるという見方です。
実際には、もっとエレガントな方法で、基礎にある構造をモデル化することができると思います。もちろん、基礎となる構造がない状況もあり得て、その場合はすべての状態を列挙する以外に選択肢はありません。すべての状態が本当に独立またはランダムであれば、学習すべき構造はありません。
しかし、私の推測では、自然界に存在するほとんどのシステム、あるいはすべてとは言いませんが、ほぼすべてのパターンには何らかの基礎となる構造があり、それは古典的なアルゴリズム、古典的なコンピューティングアルゴリズム、学習アルゴリズムによって効率的に発見しモデル化できる可能性があります。
もしそれが正しければ、P=NPを含む計算量理論、さらには情報やエントロピーの定義のような基礎物理学にも大きな影響を与える可能性があると思います。次のコーヒーブレイクで話し合うと面白いかもしれません。
複雑性理論家が見落としているのは、テスト時に解を求める前に、大規模な事前計算を行うという考え方です。これは実際にニューラルネットワークモデルで起こっていることで、モデルの訓練に膨大な事前計算を行い、その後テスト時に新しい質問に答えるために、そのモデルを非常に効率的な方法で使用しています。
これにより、従来のコンピューティングシステムで考えられていた問題の一部を回避することができると思います。
最後に、昨日の議論でも多く触れた責任の問題について触れたいと思います。AIは医療から気候まで、人類の最大の課題を解決する驚くべき可能性を秘めています。しかし、それは責任を持って安全に構築され、誰もの利益のために使用されなければなりません。
昨日お話しした方々にも申し上げましたが、AIについては「急いで物事を壊す」べきではないと思います。これはあまりにも重要で深遠な技術なので、代わりに科学的方法に大きく依存すべきです。AGIのような変革的な技術には、その能力に対して特別な注意、ほとんど畏敬の念とも言えるような注意が必要です。
しかし同時に、社会として私たちが切実に必要としている最大の課題に取り組むために、それで何ができるかについて大胆である必要もあります。つまり、大胆さと責任を兼ね備える必要があると言えます。
最後に、私の夢は常に、もし私たちがAGIを構築できれば、それは宇宙を理解するための究極の汎用ツールになり得るということです。
ありがとうございました。[拍手]

いいなと思ったら応援しよう!