見出し画像

GoogleディープマインドのCEO:AIに対して「慎重な楽観主義」で臨むべき | アマンプールとカンパニー

次に、気候変動から大統領選挙まで、これまで番組で議論してきた様々な問題に影響を与える可能性のあるものについて取り上げます。それは人工知能です。デミス・ハサビスは、世界有数のAI研究グループの一つであるGoogleディープマインドの共同創設者兼CEOです。彼はウォルター・アイザックソンに、なぜ多くの議論を呼んでいるこの技術に慎重に楽観的なアプローチを取るのかを語っています。
ありがとうございます。デミス・ハサビスさん、番組へようこそ。
お招きいただきありがとうございます。
現在、ロンドンのオフィスにいらっしゃるようですね。背後にあるのは、おそらくアラン・チューリングの1950年の論文の初版だと思います。その論文で彼は、機械は考えることができるかという問題に取り組むことを提案しました。現在、GoogleのGeminiやOpenAIのChatGPTなど、多くの大規模言語モデルがありますが、チューリングテストをパスし、人間を騙せるようなチャットボットから、人工汎用知能(AGI)と呼ばれる本当に真剣なものへと、どのように進化していくのでしょうか。あなたはそれを聖杯と呼んでいますね。
そうですね、素晴らしい質問です。もちろん、過去10年以上にわたって信じられないほど印象的で急速な進歩がありました。おっしゃるように、現在のシステムはチューリングテストをパスできるようになっていますが、汎用知能からはまだ程遠いです。私たちに欠けているのは、計画立案、記憶、道具の使用などです。これらによって、システムが積極的に問題を解決し、実際にタスクを実行できるようになります。現在あるのは受動的なシステムですが、私たちには能動的なシステムが必要なのです。
待ってください、計画立案について説明してください。私たち人間がどうやっているのかは分かりますが、機械はどうやるのでしょうか。
実は、私たちは過去にゲームを使って計画立案について多くの実験を行ってきました。2016年に発表した最も有名なプログラムの一つが、囲碁の世界チャンピオンを打ち負かすためのAlphaGoです。これは、ボードゲームのモデルを構築し、どのような手が良いかを判断するものでした。しかし、本当に上手くプレイするにはそれだけでは不十分です。頭の中で様々な手を試し、どの道筋が最良かを計画し、見極める能力も必要です。
現在の言語モデルにはそのような能力がありません。私たちは、タスクをサブタスクに分解し、より大きな目標を達成するために各サブタスクを適切な順序で解決する能力、つまり計画立案能力を構築する必要があります。現在のモデルにはまだその能力が欠けています。
人工知能の開発において、ゲームの使用がなぜそれほど重要なのか教えてください。
ゲームは、私自身が人工知能に興味を持つきっかけになりました。イングランドのジュニアチームでたくさんチェスをプレイし、自分の思考プロセスを改善しようとしたことが、知能の機械化や人工知能について考えるきっかけになったのです。2010年にディープマインドを立ち上げた時、私たちはゲームをアルゴリズムのアイデアのテスト場、実証の場として使いました。
ゲームが優れているのは、ゲームに勝つことやスコアを最大化するといった明確な目標があるからです。そのため、人工知能システムの進歩を追跡しやすいのです。現代のAIシステムの基礎となるアルゴリズムのアイデアを開発するのに非常に便利な方法だったのです。
私たちのほとんどは、ChatGPTなどのチャットボットを使ったことがあると思います。あなたは人工汎用知能、つまり人間ができることなら何でもできるタイプの知能への移行について話すだけでなく、実世界の知能についても言及していますね。ロボットや自動運転車など、視覚情報を取り入れて物理的な世界で行動できるものです。これはどれほど重要で、どのようにしてそこに到達するのでしょうか。
それは非常に重要です。時に具現化された知能と呼ばれるこの考え方は、自動運転車やロボット工学がその例です。これらのシステムは、おっしゃるように実際に現実世界、つまりビットの世界だけでなく原子の世界とも相互作用できるのです。この分野では今後数年間で大きな進歩が見られると思います。
これには計画立案能力や、特定の目標を達成するために行動を実行し、計画を遂行する能力も含まれます。実世界への応用はそれだけではありません。私が非常に情熱を注いでいる分野の一つ、そして私がキャリアの全てをAI構築に費やしてきた理由は、AIを科学的問題や科学的発見に応用することです。たとえば、タンパク質折りたたみという大きな課題を解決したAlphafoldプログラムがその一例です。
Alphafoldについてもう少し詳しく教えてください。RNA、DNA、タンパク質の形状を決定すると考えられているものすべてを理解できるようですが、実際にはタンパク質の折りたたみが重要だということですね。これはどれほど重要で難しい課題だったのでしょうか。そして、これは私たちに何をもたらすのでしょうか。
タンパク質折りたたみ問題は、生物学における50年来の大きな課題の一つです。1970年代にノーベル賞受賞者のアンフィンセンによって提唱された生物学における最大の課題の一つでした。その考え方は、タンパク質の3次元構造を決定できるかというものでした。
生命におけるあらゆるものはタンパク質に依存しています。あなたの筋肉や体のすべて、体のすべての機能はタンパク質によって支配され、サポートされています。タンパク質の機能は、体内でどのように折りたたまれるかという3次元の形状に依存しています。
この仮説は、タンパク質の2次元、つまり1次元の遺伝子配列のみに基づいて、タンパク質の3次元構造を予測できるかというものでした。これは時にアミノ酸配列とも呼ばれる数字の文字列だけから、タンパク質の3次元構造を予測できるかということです。
もしこれができれば、生物学や体内のプロセスを理解する上で非常に重要になります。また、薬や病気の治療法の設計、何かがうまくいかない時の理解、タンパク質の特定の部分に結合する薬の設計にも役立ちます。つまり、生物学における本当に基礎的で根本的な問題なのです。
私たちはAlphafoldでこの問題をほぼ解決することができました。
多くの大規模言語モデルが競争していますね。まるでレーストラックのようです。あなたたちのGoogleのGeminiがOpenAI、XAIのGrok、そしてMetaのモデルと競争しています。Anthropicも独自のモデルを持っていると思います。GoogleのGeminiの最新モデルを特徴づけているのは、マルチモーダルであること、つまりテキストだけでなく画像や音声も扱えることのようです。これについて説明していただけますか。また、これは他と差別化する要素なのでしょうか。
はい、Geminiシステムを設計する際の重要なポイントの一つは、おっしゃるように最初からマルチモーダルにすることでした。これは、言語やテキストだけでなく、画像や動画処理、コード、音声など、私たち人間が使用し、存在するさまざまなモダリティを扱えるということです。
私たちは常に、AIシステムやモデルが私たちの周りの世界を理解し、世界のモデルを構築し、世界がどのように機能するかを理解するために、これが重要だと考えてきました。もし私たちがデジタルアシスタントのような役割を期待するなら、AIには周りの世界についてしっかりとした基盤と理解が必要です。
そのためには、マルチモーダルである必要があります。テキストや言語だけでなく、これらのさまざまなタイプの情報を処理できなければなりません。そこで、私たちは最初からネイティブにマルチモーダルな能力を持つようGeminiを構築しました。
私たちは、周りの世界を理解できるユニバーサルアシスタント、デジタルアシスタントのようなものを想像していました。それによってより役立つものになるでしょう。また、ロボット工学や実世界で動作するものについて考えると、実世界の問題、空間的な関係、そしてあなたがいる文脈とも相互作用し、対処する必要があります。
私たちは、これが汎用知能にとって根本的なものだと考えています。
ここ1、2週間の大きなニュースは、Meta(Facebook)がLlamaを発表したことでした。これはある意味でGoogleのGeminiやOpenAIのシステムと競合するものです。マーク・ザッカーバーグは、これを発表する際にオープンソースであることを大きくアピールしました。あなたは誰よりもこの議論をよく知っていると思います。完全版のGoogle Geminiがオープンソースでない理由と、マーク・ザッカーバーグがこれは重要だと言っていることについて、あなたの考えを聞かせてください。
確かに非常に重要な問題です。Googleディープマインド、そしてGoogle全般として、私たちはオープンソースソフトウェアを強く支持しています。先ほど議論したAlphafoldもオープンソースです。世界中で200万人以上の生物学者や科学者が重要な研究作業にそれを使用しています。ほぼすべての国でそうです。
私たちは現代のAIシステムを構築するために必要な基盤技術やアーキテクチャに関する論文を何千本も発表してきました。その中で最も有名なのは、現代のほぼすべての言語モデルや基盤モデルの基礎となるアーキテクチャであるTransformerに関する論文です。
私たちは、情報を共有することが科学的進歩を最も速く達成する方法だと強く信じています。これは常にそうでした。科学がうまく機能する理由です。
しかし、この特定のケース、つまりAGIシステムに関しては、より強力になるにつれて考慮すべき点があります。今日のモデルについては問題ありませんが、人工汎用知能に近づくにつれて、悪意のある行為者、個人から国家に至るまで、これらのシステムを悪用する問題について考える必要があります。
これらのモデルには二面性があります。明らかに良い目的に使用できます。そのために私は30年間このキャリアを歩んできました。病気の治療や気候変動への対処、科学や医学の発展に役立てるためです。しかし、悪意のある行為者によって誤って使用されれば、害を及ぼす可能性もあります。
私たちがコミュニティとして、研究コミュニティとして解決しなければならない問題は、AIの素晴らしい良い使用例をすべて可能にし、善意のある行為者、研究者などの間で情報を共有して分野を発展させ、人類に利益をもたらす素晴らしい新しいアプリケーションを生み出すと同時に、悪意のある行為者がそれらの同じシステムを別の方法で悪用して有害なことを行うのを制限する方法です。
これが、オープンシステムと閉鎖システムに関するこの議論で解決しなければならない難問だと思います。これらのシステムが改良されるにつれて、まだ明確な答えやコンセンサスはありません。もちろん、マーク・ザッカーバーグとMetaの素晴らしい新しいモデルを祝福します。この話題に関する議論を刺激するのに役立つと思います。
AIシステムを本当に素晴らしいものにする要因の一つは、使用できるトレーニングデータです。あなたはGoogleにいて、YouTubeを所有していますね。この番組もすぐにYouTubeに掲載されるでしょう。Google Geminiは、誰かが止めない限り、YouTubeで学習することができます。また、私の本を読むこともできます。私が書いた本なら何でも読めるでしょう。Google Geminiがこれらのデータや知的財産を、何らかの取り決めなしに単に取得してしまうことを、どのように規制すればよいのでしょうか。
はい、Googleは非常に慎重にこれらの著作権の問題を尊重し、YouTubeやウェブ全般においてオープンウェブ上のコンテンツのみを学習に使用しています。もちろん、コンテンツ契約も結んでいます。
これは業界全体、研究業界全体にとって今後興味深い問題になるでしょう。Googleには、ウェブサイトが望めば学習からオプトアウトできるシステムもあり、多くの人がそれを利用しています。
長期的には、帰属や、この入力データがある割合で出力に貢献したことを示し、そこから商業的価値を導き出してコンテンツ作成者に還元できるような新しい技術を開発する必要があると思います。その技術はまだありませんが、開発する必要があります。
YouTubeのContent IDに類似したものです。YouTubeは長年これを運用しており、うまく機能しています。クリエイターコミュニティがYouTubeの提供する配信から大きな利益を得ることができるようになっています。これは、AI分野で私たちが目指している良い例だと思います。YouTubeのエコシステムがどのように発展してきたかは良い例です。
あなたの人生の興味深い経歴の中で、ゲームプレイヤーやゲームデザイナーであることと同じくらい重要なことがあります。それは、認知神経科学の博士号を持っていることです。あなたは人間の脳を愛していますね。AIを行うにあたって、人間の脳がどのように機能するかを理解することはどれほど重要ですか?そして、シリコンベースのデジタルシステムと人間の脳の「ウェットウェア」の間には、常に根本的に異なる何かがあるのでしょうか?
そうですね、私は約20年前の2000年代半ばに博士号を取得しました。当時、そしてディープマインドの初期の2010年代初頭には、機械学習や数学からの着想と同様に、神経科学や人間の脳からの着想を得ることが非常に重要でした。
脳の働きを奴隷的にコピーしようとしているわけではありません。おっしゃるように、私たちの脳は炭素ベースで、コンピューターはシリコンベースですから、メカニズムが同じである必要はありません。実際、かなり異なる方法で機能しています。
しかし、知能の背後にある多くのアルゴリズム的原理、システム、アーキテクチャ、原則は共通しています。現代のAIの基礎となる初期のニューラルネットワークは、元々神経科学と脳のシナプスにインスピレーションを受けていました。
実装の詳細は異なりますが、アルゴリズムのアイデアは非常に価値がありました。現在のAI革命の幕開けとなった学習システム、強化学習、自己学習システムなど、生物学的システムや私たちの脳と非常によく似たものです。
最終的には、AGIを構築できれば、それを使って私たち自身の心を分析し、神経科学をより深く理解し、ついには私たち自身の脳の働きを理解できるようになるかもしれません。この相互に影響を与え合う好循環が素晴らしいと思います。
あなたはこう言っています。「AIによる絶滅のリスクを軽減することは、世界的な優先事項であるべきだ」と。そのリスクとは何でしょうか。
そうですね、私や多くの人々が署名したオープンレターについてですが、これを議論すべき事項として取り上げることが重要だと考えました。まだ誰もそのタイムスケールや懸念を知りません。現在のシステムは印象的ではありますが、人工汎用知能からはまだかなり遠いところにあります。
また、そのリスクレベルもわかりません。非常に簡単に対処できることが判明するかもしれません。これらのシステムの制御可能性、解釈の仕方、目標を設定した時に意図しない副作用を起こさないようにする方法など、考えるべきことがたくさんあります。
多くのSF小説がこのようなシナリオについて書かれています。アシモフの本のほと�どがそうですね。私たちはこれらすべてを避けたいのです。システムを良いこと、素晴らしいことに使用できるようにしたいのです。病気の解決、気候変動への対処、新しい材料の発明など、今後10年程度で実現すると思われる信じられないようなことがたくさんあります。
しかし、これらのシステムをよりよく理解する必要があります。その過程で、意図しない結果を引き起こす暴走システムや、悪意のある行為者がこれらのシステムを悪用するリスクについても理解が深まると思います。
結果的に、そのような可能性は非常に低いかもしれません。そうであることを願っています。しかし現時点では、多くの不確実性があります。科学者として、私が対処する唯一の責任ある方法は、慎重な楽観主義でアプローチすることだと考えています。
私は非常に楽観的です。人類の創意工夫によってこれらすべてを解決できると確信しています。そうでなければ、30年前に私自身がこの旅を始めなかったでしょう。しかし、それは当然のことではありません。
研究が必要な未知の部分があります。これらのシステムの分析に焦点を当て、単なるブラックボックスではなく、実際に理解し、制御できるようにする必要があります。これらのシステムで知識がどのように表現されているかを調べる必要があります。そうすれば、リスクとその確率を理解し、それらに対処することができるようになります。
要するに、これは単に、すべての人が夢中になっているエキサイティングな商業的可能性と同時に、リスクにもっと注意を払うべきだという呼びかけだったのです。しかし、楽観的であり続けながら、このような変革的な技術にふさわしい敬意を持ってアプローチすべきだと考えています。
デミスさん、ご出演ありがとうございました。
お招きいただき、ありがとうございました。

いいなと思ったら応援しよう!