見出し画像

ジェンセン・フアンvs マーク・ザッカーバーグ 2024年: 彼らが予測するAIの未来に備えよ!

8,737 文字

私たちは、全てのユーザーが独自のAIエージェントを作れるようにしたいと考えています。今日メガネをかけている人は、最終的にはスマートグラスに移行するでしょう。現在Instagramで見るコンテンツの大半は、これらのツールで作られることになるでしょう。
2024年の注目すべきインタビューシリーズの中で、特に際立つ対話があります。NVIDIAのジェンセン・ファンとMetaのマーク・ザッカーバーグによるこの対談は、人工知能と複合現実の融合を見事に示しています。スマートグラスの開発を通じた消費者向けテクノロジーの未来に関する彼らの意見交換は、魅力的なビジョンを提供しています。2025年を迎えようとする今、彼らの予測はすでに現実となり始めており、この対話は一層意義深いものとなっています。
では始めましょう。最初の質問です。現在のMetaにおける生成AIの進展をどのように捉えていますか?また、それをどのように活用して業務を改善したり、新しい機能を導入したりしていますか?
生成AIについて、私は、Instagramで今日見られるコンテンツの大半が、単に世界に存在するものの中からあなたの興味に合わせて推薦されるだけでなく、フォローしているかどうかに関係なく、将来的にはこれらのツールを使って作られることになると考えています。
一部はクリエイターがこれらのツールを使って新しいコンテンツを作り出すでしょう。また、一部はあなたのために即座に生成されたり、既存の様々な要素から合成されたりするようになると思います。
これは私たちが行っていることの本質がどのように進化していくかの一例に過ぎません。実際、20年前から進化し続けていますが、世界最大の計算機システムの一つが推薦システムだということを認識している人はほとんどいないでしょう。
これは全く異なる方向性です。今みんなが話題にしている種類の生成AIではありませんが、同じくらい重要です。これらは全てTransformerアーキテクチャです。データを非構造化からより一般的な埋め込みモデルに変換するという意味で似ています。
はい、品質を向上させる大きな進歩の一つは、以前は各コンテンツタイプに異なるモデルを持っていたことです。例えば最近まで、Reelsを分類・推薦するモデルと、より長い動画用の別のモデルがありました。システムがどんなオンラインコンテンツでも表示できるようにするには製品開発の努力が必要でしたが、あらゆるものを包含できる一般的な推薦モデルを作れば作るほど、それは改善されていきます。
その一部はコンテンツの経済性と流動性に関係しています。プールから引き出せるコンテンツが多ければ多いほど、モデルが大規模化・一般化するにつれて、奇妙な非効率性は少なくなっていきます。それは継続的に改善されています。
私の夢は、いつかFacebookやInstagram全体が、これら異なる種類のコンテンツやシステムを統合した単一のAIモデルとして機能することです。これらのシステムは異なる期間で異なる目的を持つことになります。あるものは今日の興味深いコンテンツを表示し、あるものは「知り合いかもしれない人」や「フォローすべきアカウント」の提案のように、長期的なネットワーク構築を支援します。
これらのマルチモーダルモデルは一般的に、トレンドや微弱なシグナルを認識するのが格段に優れています。生成AIは一方で、私たちが長年持っている全てのワークフローと製品に大きな改善をもたらし、他方で全く新しいものの創造を可能にします。
例えばMeta AIを考えてみてください。様々なタスクを支援できるAIアシスタントという考えは、私たちのクリエイション重視の世界に存在することになりますが、その可能性は非常に一般的なものです。それだけに限定する必要はありません。時間とともに、どんな質問にも答えられるようになるでしょう。
Llama 3からLlama 4以降のモデルに移行する際、それはチャットボットのような見た目は少なくなっていくと思います。現在は指示を出すと応答し、また指示を出すと応答する、というように続きます。しかし、これは急速に、意図を伝えると複数の時間スケールで作業できるシステムに進化すると思います。タスクは数週間から数ヶ月かかることもあり、世界で何かが起こった時に戻ってくるでしょう。これは本当に強力になると思います。
今日のAIは比較的基本的です。何か言うと応答しますが、明らかに私たちが使命や問題について考える時、複数の選択肢を検討し、おそらく決定木を作成し、各決定の異なる可能性のある結果をメンタルシミュレーションすることで、その木を探索します。これを計画と呼びます。将来のAIは同じことをするでしょう。
あなたがAIクリエイティブについてのビジョンを語った時、私を本当に興奮させた一つのことは、それが素晴らしいアイデアだと思ったからです。AIクリエイティブとそれを可能にするAIスタジオについて教えてください。
はい、実は私たちはすでにこれについて話していましたが、今日ではそれをより広く展開しています。私たちのビジョンは、単一のAIモデルだけではないということです。これは業界の他の企業が異なるやり方をしていることの一つです。彼らは中央集権的なエージェントを構築しています。
はい、Meta AIアシスタントを使用できますが、私たちのビジョンの大部分は、製品の全てのユーザーが独自のエージェントを作れるようにすることです。それはプラットフォーム上の何百万人のクリエイターや、何億もの小規模ビジネスのためです。
最終的には、あなたの全てのコンテンツを統合し、顧客と対話し、販売やカスタマーサポートを管理できるビジネスエージェントを迅速に設定できるようにしたいと考えています。
現在より広く展開し始めているものはAIスタジオと呼ばれています。これは基本的に、最終的には各クリエイターが自分のバージョンのAI、エージェントやアシスタントのようなものを構築できるようにするツールセットです。そしてそれは、彼らのコミュニティが対話できるものになります。
明確にしておきますが、これはクリエイター本人との対話ではありません。しかし、クリエイターがこれらのソーシャルシステムにコンテンツを投稿するのと同じように、エージェントがそれを行う新しい興味深い方法です。
人々は様々な用途のために独自のエージェントを作成すると思います。一部は特定のタスクを実行するためのカスタマイズされたツールになるでしょう。他のものはエンターテインメントのためになるでしょう。一部の作品は単に面白く、少し変わっていたり、特定の態度を持つことになるでしょう。
間違いなく、アシスタントとしてだけではありません。人々はこれらのエージェントを見て対話することに非常に興味を持っています。私たちが観察している興味深いユースケースの一つは、これらのエージェントをサポートに使用することです。
これは私を少し驚かせました。Meta AIの主な用途の一つは、すでに人々が難しい社会的状況をシミュレートするために使用していることです。それは、上司に昇進を依頼する方法のような職業的な状況であったり、友人との口論や恋人との微妙な状況のような個人的な状況であったりします。
これは判断から完全に解放された空間で、これらの会話をシミュレートし、それがどのように展開する可能性があるかを見て、フィードバックを得ることができます。多くの人々は、Meta AIやChatGPT、または誰もが使用している同じエージェントと単に対話したいわけではありません。彼らは独自のソリューションを作成したいのです。
これは大まかにAIスタジオで私たちが進んでいる方向ですが、それはより大きなビジョンの一部です。人々が対話する単一の大きなAIだけがあるべきではありません。私たちは、これらの異なるソリューションの多様性があった方が、世界はより良く、より興味深くなると考えています。
特定のスタイルを持つアーティストであれば、あなたのスタイル、全ての作品を取り込み、モデルの一つを微調整して、それが人々があなたの芸術的スタイルで創造するために使用できるAIモデルになるということは素晴らしいと思います。
将来的には、おそらく各レストラン、各ウェブサイトが独自のAIを持つことになるでしょう。私は、将来的には、各企業がメールアドレス、ウェブサイト、ソーシャルメディアアカウントを持っているのと同じように、各企業が顧客と対話するAIエージェントを持つことになると思います。
AIスタジオを使って私の画像コレクションで微調整できますか?
はい、それができるようになります。
そして、私が書いた全てのものを基礎知識として読み込むことができますか?
はい、その通りです。
そして、私が戻ってくる度に、前回の終わりがどこだったかを思い出すために、メモリをリロードしますか?
はい、まるで何も起こらなかったかのように会話を続けることができます。
オープンソースに関するあなたの哲学について教えてください。それはどこから来ているのでしょうか?あなたはPyTorchをオープンソースにし、それは今やAIのためのフレームワークとして使用されています。そして今、Llamaをオープンソースにし、その周りに全てのエコシステムが構築されています。私はそれが素晴らしいと思いますが、これら全ては何処から来ているのでしょうか?
そこには多くの歴史があります。私たちは長年にわたって多くのオープンソース作業を行ってきました。その一部は単に、分散コンピューティングインフラストラクチャとデータセンターの構築において、他のテクノロジー企業の後に始めたからだと思います。そのため、これらのものを構築した時点では、それはもはや競争上の優位性ではありませんでした。
そこで、オープンソースにして、作られるエコシステムの恩恵を受けようと考えました。私たちにはそのようなプロジェクトがいくつかありました。おそらく最も重要なのはOpen Computeで、サーバー、ネットワーク、最終的にはデータセンターの設計を共有し、それを業界標準にしました。
全てのサプライチェーンがそれを中心に組織化され、それを公開してオープンにすることで、誰もが節約できるという利点がありました。私たちは何十億ドルも節約しました。Open Computeはまた、データセンター用に設計したNVIDIA HGXが全てのデータセンターで機能することを可能にしました。
したがって、Llamaが登場した時点で、私たちはすでにそれを行うことに好意的だったと言えるでしょう。具体的にAIモデルについては、物事を見る方法がいくつかあります。
一つには、過去20年間会社でものを作ってきたことは本当に豊かな経験でした。最も難しいことの一つは、競合他社のモバイルプラットフォームを通じてアプリケーションを配布しなければならないという事実をナビゲートすることでした。
一方で、モバイルプラットフォームは業界にとって信じられないほどの恩恵でした。他方で、競合他社を通じて製品を提供しなければならないことは課題です。
これらの計算機世代を見ると、最近のバイアスがあります。誰もがモバイルだけを見て、エコシステムが閉じているのは、基本的にAppleが勝利してルールを設定したからだと考えています。技術的にはAndroidフォンの方が多いことは知っていますが、基本的にAppleが市場を支配しています。
私は一般的に、業界全体が構築するコンピューティングプラットフォームについては、特にソフトウェアがオープンであることに大きな価値があると考えています。これは、LlamaによるAIと、拡張現実・仮想現実における私たちの取り組みの両方について、この件に関する私の哲学を本当に形作ってきました。私たちは基本的に、複合現実のために構築しているオペレーティングシステムHorizonを、AndroidやWindowsの意味でオープンなオペレーティングシステムにしています。
様々なハードウェア企業が、あらゆる種類のデバイスを作れるようにしています。私たちは基本的に、エコシステムをそのレベルに戻し、オープンにしたいと考えています。次の世代では、オープンなソリューションが勝利すると私は非常に楽観的です。
私たち特有の事情として、確実にアクセスを持てるようにしたいだけです。これは少し利己的ですが、しばらくの間この会社を運営してきた後、今後10年から15年の私の優先事項の一つは、私たちがソーシャルエクスペリエンスを構築する上で基盤となる技術を確実に構築できるようにすることです。
私が構築しようとしてきたことの多くが、プラットフォームプロバイダーのために単にできないと言われてきました。ある意味で、私は次の世代については「もう二度と」と思っています。私たちは最低レベルまで構築し、その機会があることを確認します。
申し訳ありません、閉鎖的なプラットフォームについて話すと怒りが込み上げてきます。私たちが構築する理由には、物事が存在することを望み、閉鎖的なモデルによって制限されることを望まないという調整があると思います。
これは単なるソフトウェアを構築できるというものではありません。エコシステム全体が必要です。私たちがオープンソースにしなければ、それはうまく機能しないでしょう。私たちはそれを利他的だからやっているわけではありませんが、エコシステムにとって有益だと思います。私たちはそれが構築しているものをより良くすると考えているからやっています。
そう、PyTorchのエコシステムにどれだけ多くの人々が貢献してきたか見てください。私は重要なことを認識しています。Llamaは本当に重要だと思います。私たちはその周りにAI Factoryというコンセプトを構築しました。これは誰もが構築できるようにするためのAIファウンドリーです。
多くの人々がAIを構築したいと願っており、それを所有することは彼らにとって非常に重要です。一度データサイクルに統合されると、それは彼らの組織の知識が符号化され、AIに組み込まれる方法となります。彼らはそのデータと経験のサイクルを他の場所に置くことはできません。
オープンソースはそれを可能にしますが、彼らは本当にそれを全てAIに変換する方法を知りません。だからこそ私たちはこのAIファウンドリーを作りました。私たちはツール、専門知識、Llama技術を提供し、それを全てAIサービスに変換する能力を持っています。
そして完了したら、彼らはそれを受け取り、所有します。その結果が、私たちがニューラル推論マイクロサービス(NIM)と呼ぶものです。NVIDIAには、NIMを実行できるOEMから、私たちが訓練し、LlamaベースのNIMを作成するために協力しているAccentureのような企業まで、パートナーの全エコシステムがあります。そして今、私たちは世界中の企業がこれを行うのを支援しています。これは本当にエキサイティングです。全てがLlamaのオープンソース化によって引き起こされました。
あなたの仕事で私が本当に好きなことの一つはコンピュータービジョンです。私たちが内部で多用しているモデルの一つがSegment Anythingです。現在、ここSIGGRAPHでSegment Anything 2の次のバージョンを発表しています。今や動画でより速く動作し、多くの面白い効果がこれで作れるようになります。そしてオープンであるため、産業界でも多くの真面目な応用が可能になります。
科学者たちはこれを使ってサンゴ礁、自然の生息地、景観の変化を研究しています。ゼロショットで動画でこれを行い、追跡したいものを指示して対話できるというのは、本当にクールな研究です。それ以外に何をしていますか?スマートグラスについて教えてください。
次のコンピューティングプラットフォームについて考える時、私たちはそれを複合現実、ヘッドセット、そしてスマートグラスに分けて考えています。人々がこれを理解し、着用するのはより簡単だと思います。なぜなら、実質的に今日メガネをかけている全ての人が、最終的にはスマートグラスに移行するからです。
これは世界中で10億人以上の人々です。これは重要な何かになるでしょう。VR/MRヘッドセットについては、ゲーミングやその他の用途に興味を持つ人もいれば、まだそうでない人もいると思います。
私の見方では、これらは世界で共存することになります。スマートグラスは、携帯電話のように、次のコンピューティングプラットフォームの常時アクティブなバージョンになると思います。そしてVR/MRヘッドセットは、より多くの計算能力を必要とする、より没入感のあるセッションのために、ワークステーションやゲームコンソールのようになるでしょう。
グラスは非常にコンパクトなフォームファクターを持っています。携帯電話で同じレベルの計算ができないのと同じように、多くの制約があるでしょう。これはちょうど、全てのこれらの生成AIの進歩が起こった時期に来ました。
スマートグラスに関しては、私たちは2つの異なる角度からアプローチしています。一方では、理想的なホログラフィックARグラスに必要な技術だと考えるものを開発してきました。カスタムシリコン、カスタムディスプレイスタック、それを機能させるために必要な全てのものに取り組んでいます。
そしてこれはグラスです。VR/MRヘッドセットではありません。しかし、それはまだあなたが今かけているメガネからはかなり遠いものです。私の言いたいのは、あなたのはとても薄いですし、私たちが作っているRay-Banでさえ、完全なホログラフィックARに必要な全ての技術をまだ組み込むことはできません。近づいてはいますが。
もう一つのアプローチは、見た目の良いグラスから始めることでした。写真やビデオを撮影できるカメラセンサーがあります。Instagramでライブ配信したり、WhatsAppでビデオ通話をして相手に配信したりできます。マイクとスピーカーがあります。スピーカーは本当に良いです。
これはオープンイヤーシステムで、多くの人々がイヤホンよりも快適だと感じています。音楽を聴くことができ、それはかなりクールなプライベートな体験です。しかし、このセンサーパッケージは、AIと話すためにも必要なものであることが判明しました。
これは素晴らしいです。しかし将来的には、私が物理的にそこにいない仮想会議を持つことができ、それは単に私のホログラムですが、本当に物理的にそこにいるような感覚を与えることができるようになるまでそれほど遠くありません。私たちは一緒に何かを作業し、協力することができるでしょう。
私はこれが特にAIで重要になると思います。しかし、私はこのデバイスを常に着用しているわけではありません。グラスでは、より薄いフレームやより厚いフレーム、あらゆるスタイルがあり、私たちはそれが常時着用される段階に近づいています。
あなたの現在のメガネのフォームファクターで完全なホログラフィックグラスを実現するにはまだ遠い道のりですが、少し厚いフレームのスタイリッシュなメガネに入れることはそれほど遠くありません。これらのサングラスは最近流行っていますよね。
実は、それは非常に便利なスタイルです。実際、私はインフルエンサーになろうとしています。グラスが市場に出る前に人々に影響を与えられるように。
あなたのスタイルの影響力はどうですか?
まあ、これは始まりですが、会社の将来の大部分が人々が着用するスタイリッシュなグラスを作ることになるなら、私はおそらくそれにもっと注意を払い始めるべきだと思います。
あなたは今や本当のスタイルアイコンになりましたね。このように見てください。
これは始まりです。私は取り組んでいます。前回の夕食後の集まりで、マークと私はジャケットを交換して写真を撮りました。それがバイラルになりました。私は彼が私のジャケットを着ることに何の問題もないと思いました。分かりませんが、これは私のスタイルでしょうか?
私はあなたのために一つ作らせました。
本当ですか?見てみましょう。ここに箱があります。
黒いラムレザーです。私が作ったわけではありません。オンラインで注文しただけです。
ちょっと待ってください。ここは少し寒いので、試してみようと思います。
おお、なんということでしょう。私は皆に、今年のCGAを祝うために新しいジャケットをローレンスが買ってくれたと言っていました。CGAは私たちの会社にとって重要なイベントだと想像できると思います。RTXが発売され、ここで信じられないようなものが発売されました。
これは全く新しいジャケットです。文字通り2時間しか経っていません。私たちはまたジャケットを交換することになると思います。これは価値があります。これはすでに着用されているのでより価値があります。見てみましょう。
分かりませんが、マークはかなり筋肉質だと思います。彼は本当に体格が良いです。
あんたもだよ、兄弟。
よし、皆さん、ジェンセン、マーク・ザッカーバーグ、素晴らしい時間を。

いいなと思ったら応援しよう!