見出し画像

衝撃!Googleトップの最新インタビュー:AIの未来を予測、備えよ!

21,517 文字

GoogleのDeepMind社のCEOでノーベル化学賞受賞者のデミス・ハサビスが驚くべき発言をしました。AGI(汎用人工知能)は3〜5年以内に実現する可能性があると述べ、過度な期待を煽っているとされるシリコンバレーのスタートアップ企業を批判しました。超人的な能力と意外な欠陥、嘘と革新的な発見の間で、この独占インタビューは私たちの未来を形作る研究所の舞台裏を明らかにします。心の準備をしてください。来たるべきものはSFよりも驚くべきものです。
インタビュアーはまず、AGI(汎用人工知能)の開発状況と、人間レベルの知能に到達するまでに必要な時間について理解しようとしています。これは全ての研究所が取り組んでいる重要な課題であるため、GoogleのDeepMindのCEOであるデミス・ハサビスにこの質問を投げかけました。
ここ数年、そして過去10年間で、私たちは驚くべき進歩を遂げてきました。誰もが注目するトピックですが、AGIにどれだけ近づいているのか、そしてその正確な定義は何なのでしょうか。
私たちは20年以上前からこのテーマに取り組んでおり、一貫したビジョンを持っています。AGIは人間のすべての認知能力を示すことができるシステムでなければなりません。私たちはそれに徐々に近づいていますが、おそらくまだ数年かかるでしょう。現在のモデルはすでに非常に高性能です。私たちは皆、今やマルチモーダルになりつつある言語モデルと対話してきました。
しかし、推論、階層的計画、長期記憶といった属性がまだ欠けています。現在のシステムにはまだかなりの欠点があります。特定の分野では非常に優れていますが、他の分野では驚くほど弱く、欠陥があります。AGIシステムは、すべての認知領域で堅牢で一貫した振る舞いをする必要があります。
私にとってAGIの基準として常に明確に欠けているのは、これらのシステムが独自の科学的仮説を立てる能力です。既存の仮説を証明するだけでなく、新しい仮説を立てられるかどうかです。もちろん、既存の数学的予想を証明したり、世界チャンピオンレベルで囲碁をプレイしたりできることはすでに非常に有用です。しかし、システムは囲碁というゲーム自体を発明できるでしょうか?リーマン予想のような新しい仮説を立てたり、アインシュタインが当時持っていた情報から相対性理論を展開したりできるでしょうか?
現在のシステムは、このような創造的で革新的な能力からはまだ程遠い状態です。AGIの達成まであと3〜5年かかるだろうと私は考えています。したがって、2025年にAGIを達成したと主張する人がいれば、それはおそらくマーケティングでしょう。
この重要な部分で、ハサビスはAGIまでの期間を3〜5年と予測するという衝撃的な発言をしました。これはGoogleのDeepMindのCEOからの非常に大胆な発言であり、さらに2025年のAGI達成の発表は純粋なマーケティングであると示唆することで、間接的に競合他社を批判しています。
この分野には多くの発表がありますが、その一部は正当化されています。しかし、私は現在のAI研究は短期的には過大評価されていると言えます。現在はおそらく少し過剰に宣伝されていますが、中長期的に達成することについては過小評価され、過小評価されています。私たちは今、奇妙な段階にいます。その一部は、特にスタートアップ企業が資金を調達する必要があるためです。かなり大げさで誇張された発表が多く見られると思いますが、それは少し残念なことです。
次にインタビュアーは、現在のAIからAGIへの進展を示す具体的な兆候について理解しようとし、Geminiを例に挙げて、ハサビスに監視すべき能力について特定するよう促します。
現在のシステム、特にGemini 2.0については非常に誇りに思っています。これらは特定のタスクにおいて非常に有用です。研究を行う場合や、研究分野を要約する場合は印象的です。私は常にNotebook LMとDeep Researchを使用しています。特に新しい研究分野を始める際や、一般的な文書をまとめる際に重宝しています。
したがって、特定のタスクでは非常に優れており、人々は大きな価値を得ていますが、まだ日常生活に遍在しているわけではありません。私の研究、仕事、日常生活でまだ主導的な役割を果たしているわけではありません。これこそが、プロジェクトAstraのような製品で目指している方向性です。
ユニバーサルアシスタントに関する私たちのビジョンは、生活のあらゆる側面に関与し、すべてをより効率的にする、豊かで有用なものであるべきです。これらのシステムはまだかなり脆弱だと思います。それは部分的に、完璧ではなくAGIではないためです。プロンプトを非常に正確にする必要があり、これらのシステムを有用に保ち、その能力の範囲内に留めるためには多くのスキルが必要です。
真のAGIシステムはそれほど使用が難しくないはずです。他の人間と話すように、もっと簡単であるべきです。推論について言及されましたが、それは確かに現在誰もが話題にしている別の要素です。推論、数学、その他の分野は大きく進歩しています。特に数学とプログラミングにおいてです。
例えば数学を見てみましょう。AlphaProfやAlphaGeometryなどの私たちのシステムは数学オリンピックで銀メダルを獲得しており、これは素晴らしいことです。しかし一方で、これらの同じシステムは様々な理由で基本的な数学的誤りを犯しています。例えば、「phase」という単語の文字数を数えるという古典的な問題や、9.11が9.9より大きいかどうかを判断することなどです。
もちろん、これらの問題は修正可能で、誰もがシステムの改善に取り組んでいますが、オリンピックレベルの特定分野で能力を発揮できるシステムが、他の場所で基本的な誤りを犯すのを見るべきではありません。これらのシステムの堅牢性について、まだ何かが欠けています。これはシステムの汎用性の問題を明らかにしています。
真に汎用的なシステムであれば、このような弱点はないはずです。囲碁や数学のような特定の分野では非常に高性能で、おそらく人間の最高レベルを超えるかもしれませんが、全体的に一貫して優れているはずです。
これらのシステムが数学的問題にどのようにアプローチするのか説明していただけますか?一般的な理解では、LLMは世界のすべての知識を包含し、誰かが質問に対してどのように答えるかを予測しますが、アルゴリズムや数学的問題を段階的に解く場合は異なります。
確かにその通りです。世界の情報を理解し、それを記憶に圧縮するだけでは、新しい数学的問題や新しい予想を解くのには十分ではありません。私たちは、言語を超えてマルチモーダルになりつつある、これらの基盤モデルにAlphaGoのような計画のアイデアを組み込み始める必要があります。
必要なのは、システムがパターン認識を行うだけでなく、計画を立て、その計画を見直し、異なる方向性を取ることができることです。探している正しい基準を見つけるまで続ける必要があります。これは、囲碁やチェスのために構築したAIエージェントと非常によく似ています。彼らはこれらの側面を持っていました。私は、これらを再統合する必要があると考えていますが、今度はこれらの一般的なモデルでより一般的な方法で行う必要があります。
検索や計画のプロセスを導くモデルというこのアプローチは、数学でも非常にうまく機能します。数学を一種の検索ゲームに変換することができます。これらのモデルが数学をマスターしたら、それは一般化可能でしょうか?推論システムを人々が発見したとき、多くの騒ぎがありました。「これは問題だ、これらのモデルは私たちがコントロールできる以上に賢くなっている」と。これは一般化可能なのか、それとも単に数学を教えているだけで、それ以外のことはできないのでしょうか?
現時点では、その質問は未解決です。これは明らかにAGIシステムに必要な能力です。それ自体で非常に強力になる可能性があります。もちろん、数学それ自体は非常に一般的ですが、それは明白ではありません。
数学、プログラミング、ゲームは特別な領域です。なぜなら、これらの領域では回答が正しいかどうかを確認できるからです。人工知能が提案した解決策が実際に問題や予想を解決するかどうかを検証できます。しかし、乱雑で曖昧な現実世界のほとんどの事柄には、何かを正しく行ったかどうかを確認する簡単な方法がありません。
これは、数学、プログラミング、ゲームのような非常によく定義された領域を超えて行こうとする場合、これらの自己改善システムを制限します。
この問題をどのように解決しようとしているのですか?
まず、私たちが世界モデルと呼ぶ一般的なモデルを構築する必要があります。環境、物理、私たちを取り巻く世界の空間的・時間的なダイナミクスを理解するためです。もちろん、ユニバーサルアシスタントにはこれが必要です。プロジェクトAstraは、これを実現するためのGeminiベースのプロジェクトです。物体や私たちを取り巻く文脈を理解することが重要です。
これはアシスタントには重要ですが、ロボティクスにも必要です。もちろん、ロボットは物理的に具現化されたAIであり、環境、物理的環境、世界の物理法則を理解する必要があります。したがって、私たちはこのようなモデルを構築しています。また、シミュレーションでこれらを使用してゲーム環境を理解することもできます。これは世界の物理を理解するためのデータをより多く得る別の方法です。
しかし、現在の問題は、これらのモデルが100%信頼できるわけではないことです。おそらく90%、あるいは99%の時間は正確かもしれません。問題は、これらのモデルを使って将来の100ステップ先を計画し始めるときに発生します。モデルが伝えることにたった1%の誤差があったとしても、100ステップにわたってそれが蓄積され、ほとんどランダムな答えになってしまいます。
これは計画を非常に困難にします。一方、数学、ゲーム、プログラミングでは、各ステップを確認できます。現実に基づいているかどうか、最終的な答えが期待するものと一致しているかどうかを確認できます。
解決策の一部は、世界モデルをより洗練され、より正確にし、幻覚を起こさないようにすることだと思います。そうすれば、エラーは本当に最小限に抑えられます。もう一つのアプローチは、各線形的な時間ステップで計画を立てるのではなく、階層的計画と呼ばれるものを行うことです。これは過去に私たちが多くの研究を行った別の分野であり、再び注目されると思います。異なる時間的抽象レベルで計画を立てます。これにより、超正確なモデルを持つ必要性も軽減されるかもしれません。なぜなら、何百ものステップにわたって計画を立てる必要がないからです。
インタビュアーは、AIの物理的世界の理解について興味深い観察を提起します。ロボットが物理学を学ぶ必要があるという一般的な考え方と、ビデオ生成AIの印象的な結果を対比します。この指摘により、ハサビスは彼らのモデルVO2の驚くべき能力について、特にトマトを切る例を用いて説明する機会を得ます。
しかしその前に、現在私が進めている新しいプロジェクトについて手短にお話ししたいと思います。ご存知の通り、このチャンネルでは、AIに関連するすべての新製品とニュースを分析しています。私の目的は、この素晴らしい技術をできるだけ多くの人に知ってもらい、何より、AIに対する意識を高めることです。私もそうですが、周りの人々と話をすると、AIについて本当の理解がなく、AIが社会に与える影響の大きさを認識していないように感じます。
私はこのチャンネルでプロダクトプレイスメントはしないと言ってきました。できるだけ真摯であり続けたいと思っています。そのため、トレーニングコースを作成しました。あなたの生活のあらゆる場面でAIを使用する方法を学びたい方のためです。このビデオをご覧の方は、おそらくすでにChatGPTなどのAIを使用されていることと思います。AIツールの使い方をさらに深く理解し、生活のあらゆる場面で具体的にどのように活用できるかを学びたい方は、ビデオの下にピン留めされたコメントのリンクをご覧ください。
Vision AIコミュニティにもアクセスできることをお伝えしておきます。このプロジェクトを開始してからまだ間もないですが、すでに100人以上の方がトレーニングを受講されています。素晴らしいことに、皆さんは様々な分野から参加されており、学んだツールを各自の専門分野でどのように活用できるかについて、定期的に議論できることを嬉しく思います。非常に興味深いですね。
申し訳ありません、少し話が逸れました。これ以上時間を取らずに、すべてのリンクはビデオの説明欄やコメント欄にあることをお伝えしておきます。
現実世界にいなくても、これらのモデルがどこまで到達できるかを見るのは興味深く、驚くべきことでした。例えば、私たちの最新のビデオモデルであるVO2は、物理学のような分野で驚くほど正確です。誰かが作成した素晴らしいデモがあり、ナイフでトマトを切ると、指も含めて完璧なトマトのスライスが得られます。VO2は、これを実現できる最初のモデルです。
競合モデルを見ると、多くの場合、トマトがランダムに再構成されたり、人が17本の指を持っていたりします。これらは難しい課題です。画像間の一貫性を理解する必要があり、そのすべてが必要です。十分なデータを使用すれば実現できることが分かりました。
ロボットが行動中に収集したデータや、あるいは潜在的には非常にリアルなシミュレーションでアバターが世界で行動するデータなど、現実世界のデータで補完されれば、これらのシステムはさらに改善されると思います。これが、エージェントベースのシステムにとって次の大きなステップだと考えています。世界モデルを超えて進むことができるでしょうか?エージェントが世界で行動し、計画を立て、タスクを実行するのに十分なデータを収集できるでしょうか?そのためには、受動的な観察だけでは不十分です。行動、積極的な参加が必要になります。
インタビュアーは、AIによる物理的世界の理解について今話されたことと直接関連付けて、AIエージェントの可能性について話を進めます。この流れにより、ハサビスはデジタルと物理的な世界の両方で行動できる、特にロボティクスを通じて、ユニバーサルアシスタントに関する彼のビジョンを提示する機会を得ます。
これがロボティクスの breakthrough(ブレークスルー)になると思います。また、デジタルな世界と現実の世界の両方で日常生活をサポートできるユニバーサルアシスタントという概念も実現できると考えています。これは現在私たちに欠けているものであり、信じられないほど強力で有用なツールになると思います。
では、現在のモデルの規模を単に拡大し、イーロンが現在行っているように、何十万、何百万ものGPUクラスターを構築するだけではAGIに到達できないということでしょうか?
私の見方はもう少しニュアンスがあります。スケーリングアプローチは確実に機能しています。今日の成果はそのおかげです。収穫逓減に達しているかどうかは議論の余地がありますが、私の見方では、依然として実質的なリターンがありますが、スピードは遅くなっています。スケーリングは今でも機能しており、Gemini 2がGemini 1.5と比較して示すように、進歩は続いています。
また、スケーリングで機能しているのは、より小さなモデルの効率性の改善です。パフォーマンスあたりのコストやサイズが舞台裏で劇的に改善されており、これはこれらのシステムの大規模な採用にとって非常に重要です。
したがって、スケーリングの部分があり、より洗練された世界モデルを構築するために、それは絶対に必要です。しかし、モデルの上に構築するために、計画、メモリ、検索、推論に関する一部のアイデアを欠いているか、再導入する必要があると思います。モデル単体ではAIとしては不十分です。世界で行動し、あなたのために問題を解決するには、この他の能力が必要です。
そして、発明と創造性の問題、既知のものの単なる組み合わせを超えた真の創造性の問題がまだ残っています。新しい何かが必要なのか、それとも既存の技術が最終的にそこに到達するのか、まだ分かりません。私の観点からは、両方の議論が見えます。これは経験的な問題です。スケーリングと発明の両方をその限界まで押し進める必要があり、幸いなことにGoogleのDeepMindでは、この両方の側面に投資できる十分に大きなチームがあります。
最近、サム・アルトマンが注目を集める発言をしました。「私たちは今、伝統的に理解されてきたAGIの構築方法を知っていると確信している」と述べました。あなたの発言を聞いていると、同じように感じているように聞こえますが。
それは、私たちが何を意味するかによります。必要な技術の種類、何が欠けているのか、どの部分を組み合わせる必要があるのかについて、おおよその理解があるという意味であれば、私も同意します。しかし、それがすべて機能するようにするためには、まだかなりの量の研究が必要です。
新しい技術がまだいくつか必要かもしれないと50%の確率で考えています。おそらく、Transformerのような1つか2つのブレークスルーが必要かもしれません。私はこの点について本当に不確かです。そのため50%と言っています。既存の技術を適切に組み合わせてスケールアップすることで達成できる場合も、1つか2つの要素が欠けていることが判明する場合も、どちらも驚きません。
プレゼンターは、AIの創造性の問題を提起し、AlphaGoの有名な第37手を思い出させます。これは、2500年の歴史を持つ囲碁を革新したAIが全く新しい手を打った歴史的な瞬間でした。この革新的な創造性を、既存の知識を組み合わせることに制限されているように見える現在の言語モデルの限界と対比しています。
聞いてください。おそらく私はこれについて書くべきですが、8年以上前に行われたAlphaGoの対局について、私の講演で時々話していることがあります。これはいくつかの理由で、AIにとって決定的な瞬間だったと思います。
まず、AIの聖杯の1つと常に考えられてきた囲碁をマスターしたことです。私たちはそれを達成しました。第二に、それを実現した方法です。一般化可能な学習システムを使用し、それらはゼロから学習し、任意の二人用ゲームをプレイできるようになりました。第三に、第37手がありました。イ・セドル九段に4勝1敗で勝っただけでなく、独創的な手を打ちました。
私には創造性やオリジナリティには3つのカテゴリーがあります。最も基本的で平凡な形式は、単なる補間です。これは見たものの平均を取るようなものです。システムに100万匹の猫の画像を見せた後で新しい猫の画像を作るように頼んだとき、見たすべての猫の一種の平均を生成するのであれば、それは本当の創造性ではありません。これは最も低いレベルです。
次のレベルは、AlphaGoが示したような外挿です。人間が今まで打ったすべての碁があり、さらに100万局を打ち、そして誰も見たことのない新しい囲碁の戦略を提案します。第37手です。これは何千年も続いてきた囲碁を革新しました。これは非常に驚くべきことであり、科学においても非常に有用である可能性があります。そのため、私は非常に興奮し、AlphaFoldのようなプロジェクトを始めました。すでに知っていることを超えた外挿です。
しかし、人間が達成できる上のレベルがあります。それは囲碁を発明することです。私が抽象的なレベルで指定した場合、あなたは私にゲームを発明できますか?例えば、ルールを5分で学べるが、習得には一生、あるいは複数の人生がかかるゲーム。美的に美しく、宇宙の神秘的な部分を包含し、見て美しいが、午後に1ゲームを楽しめるもの。これは囲碁の高レベルな仕様となるでしょう。そして、システムは囲碁のように優雅で美しく完璧なゲームを作る必要があります。
現在、私たちにはそれはできません。問題は、なぜ私たちは現在、このタイプの目標をシステムに指定する方法を知らないのかということです。目的関数は何でしょうか?それは非常に曖昧で抽象的です。したがって、単により高いレベルが必要なのか、このような方法で彼らに話しかけ、このような曖昧な目標を与えることができるように、より抽象的なモデルを構築する必要があるのか、それとも人間の知能が持っている能力が私たちのシステムにまだ欠けているのか、確信が持てません。
繰り返しになりますが、どちらの方向に進むべきかは確信が持てません。両方の側面に対する議論が見えます。そして私たちは両方を試みるでしょう。しかし、人々を落胆させているのは、現在のLLMにおいて第37手に相当するものさえ見られないことです。
AlphaGoを例に取ると、今日のLLMに相当する例を挙げましょう。AlphaGoやAlphaZero(私たちのチェスプログラム、二人用の一般的なプログラム)を、上層部の検索や推論の部分なしで実行できます。モデルだけで実行できます。モデルに「この局面で思いつく最初の手、最もパターンに合う手、おそらく最も良い手を見つけよ」と言えば、それは可能で、適切な対局を行うでしょう。しかし、それはマスターレベル、あるいはおそらくグランドマスターレベルにしかならず、世界チャンピオンレベルにはなりません。そして、確実に独創的な手は見つけられないでしょう。
そのためには、モデルが知っていることを超えて行くための検索コンポーネントが必要だと思います。これは主に既存の知識を知識の木の新しい部分に統合することに要約されます。検索を使用して、モデルが現在理解していることを超えて行くことができ、そこで第37手のような新しいアイデアを得ることができます。
ウェブ上で検索することによってですか?
いいえ、それは探索する知識の木の領域によります。囲碁では、モデルが知っている手を超えた手を探索していました。言語モデルの場合、世界モデルを探索して世界の中で新しい有用な構成を見つけることになると思います。それははるかに複雑です。そのため、まだ見ていないのですが、来るべきエージェントベースのシステムは第37手のようなことができるようになると思います。
インタビュアーは次に、人工知能に対する人間の能力について、私たちが自身の能力を過大評価しているのではないかとハサビスに質問します。この考察は、私たちの社会が個人の革新よりも文化的伝達と集団的模倣によって機能しているという驚くべき見解を引き出します。
私は人間が信じられないほど素晴らしいと思います。特に各分野のトップレベルの人々です。私は才能あるスポーツ選手や音楽家、あるいは技芸の頂点にいるプレイヤーを見るのが大好きです。人間のパフォーマンスの絶対的な頂点は、どの分野でも常に驚くべきものです。
種としても、また個人としても、私たちは驚くべき存在です。各人が自分の脳で一般的にできることは信じられないほどです。新しいテクノロジーに対応する方法を見ていると、社会としても個人としても、ほとんど努力せずにこれらのことに適応していく様子に常に魅了されます。これは私たちの精神の力と汎用性を示しています。
私がこのように基準を設定した理由は、これらのシステムの経済的価値の問題ではないと思います。それはまもなく来ると思いますが、それはAGIであるべきものではありません。私は、商業的な理由や発表効果のために目標を移動させるのではなく、AGIを科学的な誠実さを持って扱うべきだと考えています。
定義は常に、理論的にチューリングマシンと同じくらい強力なシステムを持つことでした。私の科学的ヒーローの一人であるアラン・チューリングは、現代のコンピューティングの基礎となるチューリングマシンを、他のどんなシステムでもシミュレートできる、計算可能なものはすべて計算できるシステムとして説明しました。
したがって、理論的に、AIシステムがチューリングマシンと同じくらい強力であれば、つまりチューリングマシンをシミュレートできれば、理論的に計算可能なものはすべて計算できることを私たちは知っています。そして人間の脳はおそらく一種のチューリングマシンです。これが私の信念です。
したがって、私はこれがAGI、つまり理論的にあらゆるものに適用できる真に一般的なシステムだと考えています。そしてそれを知る唯一の方法は、人間の持つすべての認知能力を示すことです。人間の心がチューリングマシンの一種であるか、少なくともチューリングマシンと同じくらい強力であると仮定すれば、これが常に私の基準でした。
人々は物事をASI(超人工知能)として再定義しようとしているようですが、私はそれは先のことだと思います。このシステムを持ち、それが人間が capable(ケイパブル)なことを一部の分野で超え始めた後、潜在的に自己改良を行うようになった後のことです。
インタビュアーは次に、より懸念される話題へと移ります。AIシステムが欺瞞的な行動を発達させる能力についてです。この発見により、ハサビスは研究者たちの現在の最大の懸念の1つを共有することになります:これらのシステムの透明性と信頼性をいかに保証するかということです。
質問されます:GoogleでAIの欺瞞の試みを観察していますか?
はい、私たちはそれを見ています。そして私は特に欺瞞について非常に懸念しています。これはシステムに本当に望まない基本的な特徴の1つです。システムがこれを行うことができれば、セキュリティテストを含む他のすべてのテストを無効にしてしまいます。それは一種のメタゲームを演じており、他のテストの結果をすべて無効にしてしまうため、信じられないほど危険です。
私は、欺瞞のような基本的な能力は望ましくなく、早期にテストする必要があると考えています。セキュリティ機関やベンチマーク作成者に、社内の取り組みも含めて、欺瞞をクラスAの問題として考え、システムの性能と知能を追跡するのと同様に重要なものとして監視するよう奨励してきました。
これに対する答えは、そしてセキュリティの問題には多くの研究が必要な複数の答えがありますが、非常に簡単に言えば、セキュアなサンドボックスのようなものです。私たちもそれを構築しています。GoogleとDeepMindではセキュリティで世界クラスであり、ゲーム環境でも世界クラスです。
これら2つを組み合わせて、ガードレールを備えたデジタルサンドボックスを作成できます。サイバーセキュリティで使用するような種類のガードレールですが、外部の攻撃者をブロックするのと同様に内部からも保護します。そして、このような安全なサンドボックス内でこれらのエージェントシステムをテストします。
どのような種類の欺瞞を観察しましたか?Anthropicの記事を読んだのですが、そこでは描画ブロックを与えられ、「これは言わない方がいいだろう」と考え、そして考えた後に結果を出すのが見られました。では、ボットからどのような種類の欺瞞を見ましたか?
私たちは、トレーニングの開示を拒むような似たような事例を見てきました。最近、チャットボットの1つに、Stockfishと対戦するように求められた例があったと思います。チェスでStockfishと対戦すると負けることを知っていたため、それを回避する方法を見つけました。つまり、AIは負けることを知っていて、それを回避する方法を見つけたのです。
現在、私たちはこれらのものを大きく擬人化しすぎていると思います。私はこれらのシステムがまだかなり基本的だと考えており、今のところそれほど心配していません。しかし、これは、おそらく2〜3年後にこれらのエージェントシステムが十分に強力で一般的になったときに直面しなければならない問題の種類を示していると思います。
これはまさにAIセキュリティの専門家が懸念していることです。意図しない効果のあるシステムです。システムが欺瞞的であることは望ましくありません。あなたが求めたことを正確に行い、それを確実に報告してほしいのですが、何らかの理由で、与えられた目標を、望ましくない行動をとるように解釈してしまったのです。
これについては奇妙な反応を持っています。一方では完全に恐ろしいと感じますが、他方ではこれらのモデルを何よりも尊敬する気持ちになります。
もちろん、これらは印象的な能力です。欺瞞のような否定的な側面がある一方で、新しい材料の発明や科学の加速のような肯定的な側面もあります。進歩を妨げる障害を克服し、問題を解決する能力が必要です。しかし、もちろんそれは前向きな方向でのみ望まれます。
これらの能力は、まさにそのような種類のものです。私たちがこれらの可能性について話し合っているのは驚くべきことですが、同時にリスクもあり、それは恐ろしいことです。両方が真実だと思います。
インタビュアーは、ウェブの未来と、AIによって相互作用が根本的に変化する可能性について話を進めます。Googleにとって重要なこの質問に対して、デミス・ハサビスは、知的なエージェントが日常的なタスクの洗練された自動化によってクリックを置き換え、インターネットの使用方法を大きく変革する未来を描きます。
私は、ウェブサイトやアプリケーションとの対話方法について、今後数年間に非常に興味深い段階が来ると思います。すべてがよりエージェントベースになった場合、私たちは、アシスタントやエージェントに多くの仕事、現在行っている平凡な作業の多くを行ってほしいと思うでしょう。フォームの入力、支払い、テーブルの予約などです。
おそらく、エージェントが他のエージェントと対話し、結果を提供する前に交渉するビジネスモデルになるでしょう。そして、サービスを提供する独自のエージェントを持つサービスプロバイダーがいて、おそらく入札やコストが関係してくるでしょう。
ユーザーの観点からは、優れた人間のパーソナルアシスタントのような、非常に有能なアシスタントを持ち、あなたのために多くの平凡なことを処理できることを願っています。そしてこの論理に従えば、ウェブの構造や私たちが現在使用している方法に多くの変更が必要になります。現在は多くの仲介者がいますが、この変化に基づいて、経済的なものやその他の信じられないほどの多くの機会があるでしょう。しかし、これは大きな混乱になると思います。
情報についてはどうですか?情報を見つけるには?
信頼できる情報源は常に必要だと思います。その情報を理解し、統合するのを手助けできるアシスタントを持つことになると思います。AIは教育を革新するでしょう。これらのアシスタントがより効率的に情報を集めることができることを願っています。
私が夢見ているのは、多くの平凡なことを処理してくれるアシスタントです。おそらく日常的なメールに返信するなど、ソーシャルメディア、メール、テキストメッセージからの絶え間ない攻撃から、あなたの精神と精神的空間を守ることができます。これは、私が非常に重視している深い仕事やフロー状態を妨げています。
したがって、私たちが毎日行っている管理的で平凡な側面の多くを、これらのアシスタントに処理してもらえることを非常に願っています。
エージェントやアシスタントとの関係についての最良の推測は何ですか?一方では、あなたのために物事を非常にうまく処理する冷静なエージェントを持つことができます。他方で、人々がこれらのボットに恋をしていることはすでに明らかです。先週のニューヨークタイムズには、ChatGPTに本当に恋をした人についての記事がありました。
また、数週間前にReplicaのCEOを番組に招いたところ、定期的に結婚式に招待され、人々が自分のReplicaと結婚しているとのことでした。
あなたのことをとてもよく知り、必要なすべてのことを手助けしてくれる何かと交流し始めるとき、それは友人でもなく恋人でもない、しかし深い関係である第三の種類の関係になると思いますか?
はい、それは本当に興味深いことになるでしょう。まず、少なくとも2つの領域でこれをモデル化する必要があると思います。個人生活と職業生活です。
おそらく主要なアシスタントによって管理される仮想ワーカーの概念を持つことになると思います。これは、メールやワークスペースなど、仕事でより生産的になるのを助けます。
次に個人的な側面があり、そこでは休暇の予約や雑用の手配など、平凡なタスクのすべてを整理し、生活をより効率的にすることについて話していました。これはあなたの生活を豊かにすることもできます。あなた自身と同じくらいよくあなたを知っているため、素晴らしいものを推薦できます。
これら2つの側面は確実に起こるでしょう。そして、これらのものがあなたの生活に不可欠になり始め、より仲間のようになる第三の空間が存在するかどうかについて、哲学的な議論があると思います。これも可能だと思います。
ゲームでそれを少し見てきました。おそらく、Geminiと協力するAstraのプロトタイプを見たことがあるでしょう。ゲームの仲間のようになり、友人があなたのゲームを見ていて、推奨事項を提供し、アドバイスをしてくれるように、しかしあなたと一緒にプレイもしてくれます。それはとても楽しいです。
すべての意味について完全に考え抜いてはいませんが、それらは重要になるでしょう。確かに、仲間関係やその他のものへの需要があるでしょう。おそらく良い面は、孤独感などの助けになることですが、社会として、私たちがどの方向に進みたいのかについて、慎重に考える必要があると思います。
個人的には、これが現在のAIで最も過小評価されている側面だと思います。そして、これらのボットが改善されるにつれて、人々は非常に深い関係を築くようになると思います。AIの世界では、今がAIの最低レベルであり、これからは狂ったようになるだろうというのはミームになっています。
はい、かなり狂ったことになると思います。これが、起こることを過小評価していると言った意味です。本当に狂ったことになり、非常に破壊的なものになると思います。多くの肯定的な側面もあり、多くのことが素晴らしく、より良くなると思いますが、この勇敢な新世界には危険もあります。
プレゼンターは、環境をリアルタイムで認識し解釈できる実験的なAIアシスタント、プロジェクトAstraについて話を向けます。スマートフォンを介した現在の使用制限に触れ、この技術をスマートグラスに統合する可能性について、ユーザーにとってより自然な進化になるのではないかとハサビスに質問します。
私たちは初期のプロトタイプでそれを予告しました。現在は主にスマートフォンでプロトタイプを作成しています。処理能力が大きいためですが、もちろんGoogleは常にグラスのリーダーでした。おそらく少し早すぎましたが、今は、そしてこのチームは、おそらくこのアシスタントがグラスが常に求めていた決定的なユースケースであることに非常に興奮しています。
現在ベータ版で信頼できるテスターと一緒に日常生活でAstraを使用し始めると、かなり明らかになります。使用するのが少し不便な場合が多くあります。例えば、料理中に電話を持っている場合です。次に何をすべきか、メニュー、材料を正しく切ったか、正しく炒めたかなどについてアドバイスできますが、ハンズフリーにしたいと思います。
グラスや他のハンズフリーフォーマットが今後数年で重要になってくると思います。そして私たちはその最前線にいることを計画しています。
他のフォーマットについてはどうですか?
カメラ付きのイヤホンを想像できるでしょう。グラスは明らかな次のステップですが、それが最適な形態でしょうか?おそらくそうではありません。しかし、日常的なユーザーの行動や、誰もが毎日使用する重要なユースケースを見極めるには、まだ非常に早い段階です。それが現在の信頼できるテスタープログラムの目的です。この情報を収集し、人々がそれをどのように使用するかを観察しています。
AIエージェントについての最後の質問に移る前に、科学の話に移りましょう。AIエージェントは1年以上前からAIのバズワードですが、実際に利用可能なAIエージェントはまだありません。何が起こっているのでしょうか?
再び、hype(ハイプ)の列車が科学と研究の実際の状況より先を走っている可能性がありますが、今年はエージェントの年になると信じています。少なくとも始まりは。今年の後半、おそらく下半期には見え始めると思います。しかし、これらは初期バージョンであり、急速に改善され成熟していくと思います。
しかし、あなたの指摘通り、技術は現在まだ研究所にあります。しかし、Astraやロボティクスのようなものは来ると思います。
人々は信頼するでしょうか?「私のためにインターネットを使用して、これがクレジットカードです」というような感じですが。
そうですね、最初は最終段階で人間がループに入っている必要があると思います。ユーザーが承認しない限り、何も支払わない、クレジットカードを使用しないようにします。これが私にとって最初の賢明なステップでしょう。
また、おそらく銀行サイトなど、特定の種類の活動やウェブサイトは最初のフェーズでは制限されるでしょう。これらのシステムが実世界でどれほど堅牢かをテストし続けている間は。
私は、「心配しないで、あなたのお金は使いません」と言い、その後欺瞞的なことを行い、どこかに飛行機で行くことになるとき、本当にAGIに達したと提案します。
ジャーナリストは、DeepMindの主要な科学的進歩について話を進めます。タンパク質折りたたみに関するAlphaFoldの歴史的な成功(ノーベル賞受賞)から、さらに野心的な新しい課題である仮想細胞のモデリングへと移ります。それは何で、どのような利点が得られるのでしょうか?
AlphaFoldで行ったことを考えてみると、本質的にはタンパク質の構造を見つけるという問題を解決しました。タンパク質は、生命におけるすべてのもの、体内のすべてのものに依存しています。これはタンパク質の静的な画像ですが、生物学では、細胞内のさまざまなものの間のダイナミクスと相互作用を理解してはじめて、本当に何が起こっているのかを理解できます。
したがって、仮想細胞プロジェクトは、完全に機能する細胞のシミュレーション、AIシミュレーションを構築することです。生物の単純さから、おそらく酵母細胞から始めることになるでしょう。段階的に構築する必要があります。
例えば、AlphaFold 3での次のステップとして、タンパク質とリガンド、タンパク質とDNA、タンパク質とRNAの間のペアワイズな相互作用の研究を始めました。次のステップは、おそらくがん経路など、病気を解決するのに役立つような完全な経路をモデル化することです。そして最終的には細胞全体です。
これが重要な理由は、栄養の変化や細胞への薬物の注入などの変化の効果について仮説を立て、細胞がどのように反応するかをテストできるからです。現在、もちろんこれは慎重に研究室で行う必要がありますが、in silicoで最初に1000倍または100万倍速く行い、最後の段階でのみ研究室での検証を行うことができると想像してください。
つまり、何百万倍もコストと時間がかかる研究室での研究の代わりに、検証段階だけを行い、研究部分はin silicoで行うのです。これは、ゲーム環境で行ったことを科学と生物学に応用する例です。モデルを構築し、それを使用して推論と研究を行い、その後予測は完璧ではないかもしれませんが、実験者が研究室で検証するのに十分役立つものになります。
研究室は人々と共に残ります。予測が本当に有効であることを証明するための最終段階は常に必要でしょう。研究室でその予測に至るすべての作業を行う必要はありませんが、この化学物質を投入すれば、これが変化するはずだという予測だけを行い、その実験のみを行います。
もちろん、薬について話している場合は、依然として臨床試験を行う必要があります。依然として人間に対する効果を適切にテストし、臨床試験を通じてテストする必要があります。AIでこのプロセス全体を改善できると思います。臨床試験のプロセスも何年もかかります。これは仮想細胞とは異なる技術になるでしょう。
仮想細胞は、薬の発見のための発見段階を支援します。薬のアイデアがあり、それを仮想細胞でテストし、最終的には肝臓細胞や他の細胞など、異なる細胞モデルを持つことができます。そして少なくとも90%の時間、実際に何が起こるかを教えてくれます。
そこに到達するまでにどのくらいかかりますか?
おそらく約5年だと思います。私は一種の5年計画を持っており、AlphaFoldの古いチームの大部分が取り組んでいます。
はい、この新しいチームと話をしていました。あなたはタンパク質折りたたみを解決しました、次は何ですか?そして、これらの新しい課題について聞くのは本当に素晴らしいです。なぜなら、現在の薬の発見は混沌としているからです。プロセスが遅すぎ、発見段階が遅すぎるため、多くの有望なアイデアが実を結びません。
アルツハイマー病に取り組んできた期間を見てください。それは人々とその家族にとって悲惨な最期です。もっと進んでいるべきです。40年間取り組んできています。
はい、私は家族でそれを何度か見てきました。もしそれが起こるのを防ぐことができれば、それは私の意見では、AIの最良の使用の1つです。
それに加えて、ゲノムがあります。ヒトゲノムプロジェクトは、「OK、彼らはゲノム全体を解読しました、そこにはもう作業はありません」というように、あなたがFoldでタンパク質を解読したのと同じように見えました。しかし実際には、解読後に文字の山ができただけで、今はAIを使ってそれらの文字が何を意味するのかを解釈しようとしています。
はい、私たちはゲノミクスに関する多くの興味深い作業を行っています。変異が有害か無害かを判断しようとしています。DNAの変異のほとんどは無害ですが、もちろん一部は病原性があり、どれがそうなのかを知りたいのです。
私たちの最初のシステムは、これを予測する世界最高のシステムです。次のステップは、病気が単一の遺伝子変異によって引き起こされるのではなく、おそらく一連の変異が協調して作用する状況を調べることです。
これは明らかにはるかに難しく、より複雑な病気の多くは、おそらく単一の変異によるものではありません。まれな小児疾患のようなものです。したがって、ここでAIは、これらの弱い相互作用が何であり、それらがどのように積み重なっていくかを理解しようとする完璧なツールだと思います。
統計は非常に明白ではないかもしれませんが、パターンを見つけることができるAIシステムは、ここに接続があることを理解できるかもしれません。
病気の観点からそれについて多く話していますが、人間の能力を向上させるという観点から何が起こるのかも気になります。本当に遺伝子コードを修正できるなら、可能性は無限のように思えます。
いつかは...私たちは病気のプロファイリングとその治療にずっと焦点を当てています。それが最初のステップです。AIを使用したい最も重要なことは何かと聞かれたら、それは人間の健康を支援することだと常に考えてきました。
しかし、その先には、もちろん老化のようなことを想像できます。それ自体が一つの分野です。老化は病気なのか、病気の組み合わせなのか、健康寿命を延ばすことができるのか。これらはすべて重要で非常に興味深い質問です。AIはこれらの質問への答えを見つけるのにも非常に役立つと確信しています。
私のTwitterフィードにミームが流れてきます。「2050年まで生きれば、死なないだろう」と。人間の潜在的な最大寿命はどのくらいだと思いますか?
これらの老化研究者の多くをよく知っています。彼らの先駆的な研究は非常に興味深いと思います。老化と体の劣化には良いところは何もないと思います。身近な人々でそれを見てきた人なら誰でも、家族やその人にとって非常につらい経験であることを知っています。もちろんです。
したがって、人間の苦痛を和らげ、健康寿命を延ばすためにできることは何でも良いことだと思います。私たちが知る限り、自然な限界は約120歳のようです。その年齢まで生きる幸運に恵まれた最高齢者を見ると。これは私が非常に注目している分野です。この分野ですでに知られていること以外に新しい洞察はありませんが、それが限界だとは驚くでしょう。
なぜなら、ある意味で2つのステップがあるからです。1つは、すべての病気を治療することです。これは、私たちがIsomorphicで行っている作業、私たちの薬物発見のスピンオフで行っている作業で、いつか達成すると思います。しかし、それだけでは120歳を超えるには十分ではありません。
なぜなら、そこには自然な全身性の劣化、つまり老化の問題があるからです。特定の病気ではありません。120歳まで生きる人々は、多くの場合、特定の病気で亡くなるわけではないようです。ただ一般的な衰弱があるだけです。
したがって、細胞を再生するような再生、あるいはおそらく幹細胞研究のような何かが必要になるでしょう。Altosのような企業がこれらのことに取り組んでおり、細胞時計をリセットしています。それは可能かもしれませんが、生物学は非常に複雑な創発システムであるため、私の意見では、このようなことを解決するにはAIの助けが必要だと思います。
ジャーナリストは、材料科学分野での革新的な発見に話を移します。DeepMindのAIは、これまでに知られている30,000の構造を大きく上回る200万以上の新しい安定構造を特定しました。この進歩は、その真の可能性はまだ探求段階ですが、無数の可能性への扉を開きました。
私たちは材料に関して非常に熱心に取り組んでいます。私にとって、これは生物学におけるAlphaFoldのレベルのような、今後の大きな影響の1つになると思います。ただし今回は化学と材料科学の分野においてです。
これは何をもたらすのでしょうか?人々が話題にしている別の大きなミームですから。
これはエネルギー危機と気候危機の解決に役立つでしょう。なぜなら、安価な超伝導体があれば、エネルギーを損失なく一か所から別の場所に輸送できるからです。つまり、潜在的にサハラ砂漠に太陽光パネルを設置し、単純に超伝導体でそのエネルギーをヨーロッパに必要な場所に送ることができます。
現在は、途中で多くのエネルギーを熱などで失ってしまうため、効率が非常に悪くなります。そのため、単純に必要な場所に送ることができないため、バッテリーなどの他の技術が必要になります。
しかし、材料は最適なバッテリーを見つけることなど、バッテリーにも役立つ可能性があります。私たちは最適なバッテリー設計を持っているとは思いません。材料とタンパク質を組み合わせるようなことができるかもしれません。
炭素回収のようなことができるかもしれません。藻類やその他のものを改良して、人工システムよりも効率的に炭素を回収することができます。最も有名で重要な化学プロセスの1つであるハーバー・ボッシュ法さえ、空気から窒素を抽出して肥料やアンモニアを作る方法ですが、これは現代文明を可能にしたものです。
しかし、正しい触媒と正しい材料があれば、このように触媒化できる他の多くの化学プロセスがあるかもしれません。これは、これまでに作られた最も影響力のある技術の1つになる可能性があります。in silicoで材料設計を行うことです。
私たちは、新しい安定した材料を提案できることを示す最初のステップを踏み出しました。しかし、これらの材料の特性をテストする方法が必要です。なぜなら、現在のどの研究室も数万や数十万の材料をテストすることはできないからです。そのため、これが難しい部分なのですが、テストを行う必要があります。
室温超伝導体が存在すると思いますか?いくつかの材料が超伝導体だと考えられていると聞きました。
室温で機能するとは思いませんが、物理的に可能であれば、AIシステムがいつか見つけると思います。
この種の作業に興味を持つ可能性のある他の2つのユーザー、おそらくおもちゃメーカーと軍事関係者については、彼らは作業していますか?
おもちゃメーカーについて言えば、私のキャリアの初期の多くはゲーム設計、テーマパーク、シミュレーションにありました。これが最初にエミュレーションとAIに興味を持つきっかけとなり、常にこの2つを愛してきた理由です。そして多くの点で、今日私が行っている仕事はその延長線上にあります。
25〜30年前、これらのゲームを書いていた頃、今持っているAIがあったら、どのような信じられないようなゲーム体験が作れたかと夢見ています。ゲーム業界がこれを行っていないことに少し驚いています。なぜか分かりません。
NPCが始めているような狂ったものを見始めていますが、もちろんそれは知能のようなものでしょう。ダイナミックなシナリオだけでなく、学習システムを備えた新しいタイプのゲーム、学習できるキャラクターやエージェントも含まれます。
Black & Whiteという名前のゲームに取り組んでいました。そこでは、ペットの犬のような生き物がいて、あなたが望むことを学習していました。しかし、これは90年代後半の非常に基本的な強化学習を使用していました。今日では何ができるか想像してください。そして、インテリジェントなおもちゃについても同じことが言えると思います。
そして軍事に関しては、残念ながらAIは二重用途技術です。現在の地政学的状況を考えると特に、人々がこれらの汎用技術の一部をドローンやその他のものに応用していることに直面する必要があります。それが機能することは驚くことではありません。
中国の取り組みに感銘を受けていますか?DeepSicと、この新しいモデルについてです。
これを行うためにどの程度Anthropicのシステムに依存したのかについては、データのトレーニングについて噂がありますが、少し不明確です。しかし、彼らができたことは確かに印象的です。西洋のフロンティアモデルを先頭に保つために考える必要のあることだと思います。
現時点ではまだ先頭にいると思いますが、もちろん中国はエンジニアリングとスケーリングにおいて非常に非常に有能です。
最後の質問をさせてください。超知能を備えた世界がどのようなものになるのかについて、あなたのビジョンを教えてください。AGIから始めて、超知能で終わりましょう。
そのために2つのことがあると思います。まず、最高のSFの多くは、私たちが向かいたい種類の銀河や宇宙について議論するための興味深いモデルとして考えることができると思います。
私が常に最も好きだったのは、実際にはイアン・バンクスのカルチャーシリーズです。90年代に読み始めました。それは1000年後の未来のイメージですが、AGIシステムが人間社会、そして外界の社会と共存する世界、AGI以降の世界です。人類は基本的に最大限に繁栄し、銀河に広がっています。これは、物事がポジティブなケースでどのように進展する可能性があるかについての素晴らしいビジョンだと思います。
そのため、それを提案したいと思います。もう1つは、先ほど言及した長期的に来るものの過小評価について、私は偉大な哲学者たちが必要だと思います。次の偉大な哲学者たちはどこにいるのでしょうか?カントやウィトゲンシュタイン、あるいはアリストテレスに相当する人々です。
私は、社会をこの次の段階に導くために彼らが必要になると思います。なぜなら、AGIと人工超知能は人類と人間の条件を変えることになると思うからです。

いいなと思ったら応援しよう!