見出し画像

NvidiaのCEOが明かすAIの次のステップ...そして人類の未来

8,814 文字

NvidiaのCEOであるジェンスン・ファンがラスベガスのCES 2025で基調講演を行い、それは素晴らしいものでした。彼は多くの発表を行い、エージェント、世界モデル、自動運転、ロボット、そしてNVIDIAが今年推進するあらゆる未来的なものについて詳しく語りました。今日は皆さんとNvidiaの主要な発表内容を分析したいと思います。
まず最初にお話ししたいのは、この非常に興味深いグラフについてです。約13年前の2012年に、AIの主要な開発者の一人であるアレックス・クリジェフスキーによってAlexNetが作られました。これは基本的に画像を分類するアルゴリズムでした。そこから急速に進化し、ご覧のように知覚AI、生成AIを経て、現在は注目がエージェントAI、つまりAgent AIに移っています。
これが私たちが2025年の現在いる地点であり、すでに次のステップであるPhysical AI(物理AI)に向かっています。個人的に、2025年はAgent AIの年になると考えています。ここに示されているように、コーディングアシスタント、カスタマーサービス、患者ケアが挙げられていますが、それ以上のものです。大規模言語モデルの純粋な知性と、デジタル世界であれ物理的な実世界であれ、実際に物事を行うために必要なすべてのものを組み合わせたものなのです。これが本当にエージェントの年となる理由で、その理由がすぐにお分かりいただけると思います。
次のセクションでは、私たちが知る従来のコンピューティングから、このAIベースの新しいコンピューティングへの移行について語ります。実際、彼の予測はかなり控えめだと思います。多くの開発者との刺激的な議論では、未来はAIと従来のプログラミングのバランスの取れた混合になると考えています。しかし、私の専門知識に基づいて、より大胆なビジョンをお話ししましょう。
AIの分野で大きなデモとなったDoom AIデモなどの革新的な取り組みを通じて観察していることは、はるかに根本的なものです。あなたが操作するすべてのピクセル、すべてのインターフェース要素がリアルタイムでAIによって生成される世界を想像してください。AIが単なるツールの1つではなく、デジタルインタラクションの中核となる世界に向かっていると確信しています。
従来のプログラミング層の上にAIを載せるのではなく、生のデータから直接私たちの意図を解釈する直感的なインテリジェントインターフェースを持つことになります。これは私が2025年のトレンド分析で深く掘り下げたトピックで、興味がある方はぜひご覧ください。このビジョンは大胆に思えるかもしれませんが、この分野での私の経験から、これが私たちが向かう方向だと確信しています。
では、ジェンスン・ファンがCESのNvidia会議で発表したデモをお見せしましょう。これまで私たちが知っていたコンピューティングをAIが本当に引き継ぐという話をしましたが、シーンの大部分はAIを使用してレンダリングされています。完全なレイトレーシングを行っていますが、従来の方法ではピクセルを計算していません。簡単にデモをご覧ください。
[音楽]
リアルタイムグラフィックスの分野で静かな革命が起きています。本当に注目すべきは、現在レンダリングの90%がリアルタイムAIによって生成され、従来のレイトレーシングはわずか10%しか使用されていないということです。基本的に、AIが3Dジェネレーションの方法の90%を制御するようになったのです。
NvidiaのリサーチサイエンティストであるJin Fan博士が、この重要なイノベーションについて解説しています。あの有名なRTX 5090の期待される仕様を超えて、グラフィックスカードのアーキテクチャ自体にAIとニューラルネットワークが深く統合されているのです。
このプロセスは非常に興味深いものです。従来のレイトレーシングは初期のスケッチ、いわばキャンバスのようなものを提供するだけで、そこから洗練された生成モデルであるAIがリアルタイムですべての詳細を作り上げていきます。彼が elegantly に要約しているように、「AIは新しいグラフィックス」なのです。
この進歩は、リアルタイム3Dレンダリングへのアプローチを根本的に変えています。3次元シーンが従来の意味でレンダリングされるのではなく、AIによって動的に予測され生成される時代に入っています。システムはシーンの構造的な近似だけを必要とし、それから詳細で洗練された最終結果を予測します。
これは、私たちが知っているコンピューターグラフィックスの基礎そのものを再定義するパラダイムシフトです。個人的に、特に現在停滞している VR の分野で、応用の可能性は膨大だと考えています。
さて、これらはすべて会議の導入部分の発表でしたが、ここからは主要な発表に移りましょう。この講演で発表された最初の主要な内容は、先ほど見たRTX Blackwellとシリーズ50のGPUですが、この発表で最も驚くべき部分は価格だと思います。はい、それが最も重要な点です。シリーズ40のハイエンドGPUに相当する性能で549ドル、現在入手可能な最高のコンシューマー向けグラフィックスカードである4090と同等の性能を約束しているのです。
次のセクションでは、ジェンスン・ファンがスケーリング法則とプリトレーニングから事前学習について語ります。このプレゼンテーションのこの部分全体が魅力的でした。では、全体を見てみましょう。
人工知能について話しましょう。産業界は人工知能の開発に向けて猛烈なレースを繰り広げています。スケーリング法則は強力なモデルであり、経験則です。この法則は研究者と産業界によって何世代にもわたって観察され、実証されてきました。
スケーリング法則は、より多くのトレーニングデータと大きなモデルを持ち、より多くの計算能力を適用すれば、モデルはより優れた性能と能力を持つようになると確立しています。このスケーリング法則は引き続き有効です。
本当に魅力的なのは、私たちが新しい時代に向かっているということです。インターネットは毎年、前年の2倍のデータを生成しています。今後数年で、人類はその始まりから作り出してきた以上のデータを生成することになります。
私たちは、ビデオ、画像、音声など、膨大な量のマルチモーダルデータを生成しています。これらのデータはすべて、AIの基礎的な知識を形成するために使用できます。
実際、他に2つのスケーリング法則が出現しています。これはかなり直感的です。2番目のスケーリング法則は事後トレーニングに関するもので、強化学習や人間からのフィードバックなどの技術を使用します。具体的には、人工知能は人間の要求に基づいて応答を生成し、その後フィードバックを提供します。
これは実際にはもっと複雑ですが、品質の高いプロンプトを使用した強化学習システムにより、人工知能はその能力を洗練させ、特定の領域に適応させることができます。例えば、数学的問題解決のための能力を向上させることができます。
では、これが何を意味するのか手短に説明させてください。これは基本的に、これまで私たちが見てきたすべてのことです。AIにより多くのデータを与えれば与えるほど、それは良くなります。すべての主要なAI企業が、インターネット上の公開データ、さらには有料のデータなども含めて、できるだけ多くのデータを収集しようとする競争が行われてきました。
しかし、私たちは利用可能なデータ量についてほぼ飽和状態に達しています。スケーリング法則は続いていますが、今日私たちは興味深いサイクルを目にしています。当初は人間のデータで訓練されたAIモデルが、今では自身で新しいデータを生成し、それがウェブ上に現れているのです。これは少しプロセスが逆転したようなものです。
これらの派生データは、次世代のモデルを訓練するために使用されます。つまり、今日のAIモデルは、AI自身が生成したデータで訓練されているのです。このフィードバックループは、AI研究分野における長期的なトレーニングデータの品質に関する重要な問題を提起しています。
データの多様化も同様に注目に値します。ビデオ、画像、音声を組み合わせたマルチモーダルデータがますます出現し、AIの基礎的な知識ベースを大幅に豊かにしています。
しかし、特に興味深いのは、この分野で2つの新しいスケーリング法則が出現していることです。1つ目は事後学習に関するもので、特にRLHF(Reinforcement Learning from Human Feedback、申し訳ありませんが私の英語は)を通じて行われます。これは、AIが慎重に選択された人間のプロンプトに対して応答を生成し、フィードバックを受け取り、人間からのフィードバックに基づいて結果を洗練させる高度なプロセスです。
例えば数学を取り上げてみましょう。モデルはこのRLHFプロセスを通じて、問題解決能力を大幅に向上させることができます。私は、この訓練方法やファインチューニングが、従来のモデルを改善するレバレッジとしての影響力を多くの人が過小評価していたと思います。
しかし、率直に言って結果は自明です。これは例えば、初期トレーニングを受けた後に個人メンターを持つようなものです。クライアントなどからの的を絞ったフィードバックのおかげで、継続的に進歩を遂げることができます。
これが1つ目のスケーリング法則でしたが、AIのフィードバックに基づく強化学習と合成データの生成も出現しています。これは基本的にRLHFですが、今度はAIによって行われるのです。
ここで状況は少し狂気じみてきます。今やAIが他のAIを訓練するのです。これらのアプローチは、自己主導型の集中練習に似ています。完璧を目指して絶え間なく動きを繰り返すプレイヤーのようなもの、つまり、休みなく自分自身とチェスを指し続けるようなものです。
実際、AlphaGoの例は、このコンセプトを説明するのに特に雄弁です。自分自身と何百万回もゲームをプレイすることで、超人的な熟練度を達成しただけでなく、私たちが知らなかった革新的な戦略も発見しました。AlphaGoと李世ドルの有名な一手に示されているように、これはAIの歴史に刻まれる瞬間となりました。
さて、少し話がそれてきましたので、会議の続きを見てみましょう。注目に値する革新的な内容が紹介されていますが、その前に手短に、現在進行中の新しいプロジェクトについてお話ししたいと思います。
ご存知の通り、このチャンネルではAIに関するすべての発表と新機能を分析しています。私の主な目的は、この素晴らしい技術をできるだけ多くの人々に知ってもらい、何よりもAIに対する意識を高めることです。
私の周りの人々と話すとき、人々はAIが何であるかを本当に理解していないように感じます。彼らは、AIが社会に与える影響の大きさに気付いていません。それは途方もない影響力を持つものになります。
すでに申し上げた通り、このチャンネルでは商品プレイスメントは行っていません。できるだけ真摯な姿勢を保ちたいと考えています。そのため、トレーニングコースを作成しました。
人生のあらゆる面でAIを使用する方法を学びたい方向けです。この動画をご覧の方は、おそらくすでにAI、特にChatGPTなどを使用されていることでしょう。AIツールの使い方をさらに深く理解し、生活のあらゆる面にどのように適用するかを正確に知りたい方は、動画のピン留めコメントにリンクを残しておきますので、ぜひご覧ください。興味のある方は遠慮なくアクセスしてください。
また、Vision AIコミュニティにもアクセスできることを付け加えておきたいと思います。つい最近プロジェクトを立ち上げたばかりですが、すでに100人以上の方がトレーニングを受講されており、これは本当に素晴らしいことです。
様々な分野から参加していただいており、学んだツールを各自の専門分野にどのように適用するかについて、定期的に皆さんと議論できることを楽しんでいます。これは本当に興味深いことです。
さて、申し訳ありませんが、この小休止はここまでにして、時間を無駄にせずに続けましょう。すべてのリンクは説明欄にあることを改めてお伝えします。
Grace BlackwellというGPUアーキテクチャは、印象的な技術的および工学的な成果を表しています。実際、これは主要なクラウドコンピューティングプロバイダーが自社のデータセンター、つまり大規模な倉庫や データセンターに導入しているまさにそのタイプのインフラストラクチャです。
今日、企業は集中的な計算のニーズのためにこれらのサーバーをレンタルすることができます。これは、データを保存するため、または計算を実行するためのサーバーをレンタルすることが、現在最も収益性の高い市場の一つとなっています。これらのマシンは単純に言って巨大です。
ちなみに、この進化は現在私が読んでいる「Chip Wars」という本を思い出させます。技術の歴史に興味がある方には心からお勧めできる本です。シリコンバレーの始まり、特に最初のトランジスタの作成について追跡しています。
特に印象的なのは、50年、60年、あるいは70年前の当時のパイオニアたちが、すでに予言的なビジョンを持っていたことです。彼らは、トランジスタが私たちの生活のあらゆる側面に組み込まれ、世界を革新すると確信していました。
当時、これらの先見の明のある人々は、たった一つの小さなチップに数十個、数百個、そして数千個のトランジスタを統合するために奮闘していました。そして今日、NVIDIAが発表したGrace Blackwellは1,300億個のトランジスタを搭載しています。これは想像を超える進歩であり、この本でも説明されているムーアの法則を完璧に例証しています。
特に私を熱狂させるのは、プレゼンテーションの次の部分で、ジェンセンがAIエージェントについて語っている部分です。この分野における彼の楽観的な見方に完全に同意しており、彼がこの基調講演でこのトピックにこれほど重要な位置付けを与えたことを嬉しく思います。
では、この件について彼が何を語っているか聞いてみましょう。
ビジネス界で最も重要な発展の一つは、エージェントAIです。エージェントAIはリアルタイムスケーリングの完璧な例です。AIは顧客やユーザーを理解し、対話するモデルシステムです。
いくつかのモデルは、意味的AIシステムRAGのようにストレージから情報を取得し、他のモデルはインターネットを閲覧したり、PDFファイルを分析したりできます。システムは計算機やグラフィックを生成する生成AIなど、様々なツールを使用します。
問題をステップバイステップで分解し、異なるモデルを使用して解決します。将来的には、AIの顧客への応答は異なるものになるでしょう。単純な質疑応答ではなく、多くのモデルがバックグラウンドで作業を行います。リアルタイムスケーリングと必要な計算能力は爆発的に増加し、これによってより適切な応答が得られるようになります。
産業界がエージェントAIを開発するのを支援するため、私たちは企業を直接のターゲットとはしていません。代わりにコンピューティングエコシステムの開発者と協力しています。CUDAと同様に、新しい可能性を生み出すために私たちの技術を統合することが目的です。
従来のコンピューティングモデルは、グラフィックス、線形代数、流体力学のためのAPIを使用してきました。将来的には、CUDAアクセラレーションライブラリの上にAIライブラリが構築されることになります。エコシステムがエージェントAIを構築するのを支援するため、私たちは3つの要素を作成しました。
ジェンセンのこのスピーチの背後には、NVIDIAの商業戦略が明確に見て取れます。彼らのGPUの大規模な採用は、この技術革命の中心にあります。しかし、この商業的な側面を超えて、いくつかの重要なポイントに注目する必要があります。
まず第一に、私たちはAIエージェントの大規模な到来による労働市場の大きな変革の瀬戸際にいます。これは私の動画でもよく繰り返し言っていることですが、2025年がこの分野の決定的な転換点となると確信しています。
これらのエージェントは孤立して機能するのではなく、複雑な編成で、いわば全てが連携して動作します。しかし、会議で最も革新的な発表は、彼らの世界モデルに関するものでした。
NVIDIAの主任研究者であるJim Fan博士の研究を追ってきた人々にとって、特にPhysicalおよびデジタル環境のシミュレーションを探求するComm Grootのようなプロジェクトを通じて、この進化は予測可能なものでした。
しかし、ここではプロジェクトの具体化が行われています。Nvidia Cosmosは物理的世界のシミュレーションにおける大きな進歩を表しています。これは現在、ごく少数のモデルしか優れた性能を発揮できていない分野です。正直に言って、Soraは例外かもしれませんが、最近多くの欠陥が見つかっています。
課題は極めて重要です。私たちの将来のロボット、物理的AIシステムは、膨大な量のトレーニングデータを必要とします。ビデオの前半をお聞きになった方はお分かりと思いますが、これらのデータを取得することは非常に困難で費用がかかります。
例えばテスラを例に取ると、カメラを搭載した何百万台もの車両が継続的にデータを収集しており、彼らは独自の立場にいます。しかし、メルセデスやFigure Roboticsのような他の企業は、そのような大量の実データにアクセスできません。
ここで合成データ生成が重要になってきます。これは「卵が先か鶏が先か」という悪循環を打ち破ります。大量のデータを収集するためにロボットを配備する必要はなく、最初の世代のロボットをトレーニングするためにデータを生成できるようになりました。
この技術の特に魅力的な側面は、マルチバースを生成する能力です。可能なシナリオはすべてシミュレーションできます。これはもちろんNVIDIAのGPUによって推進され、これまでSFの領域と思われていた可能性への道を開きます。
しかし、時が進むにつれて、SF がますます現実味を帯びてきています。この進化は、私たち自身の現実がシミュレーションである可能性を示唆するシミュレーション理論に新たな信憑性を与えています。私たちが今、シミュレーションである現実を作り出そうとしているように。これは注目に値する魅力的な発展です。
発表された最も有望なアプリケーションの1つは自動運転に関するものでした。NVIDIAは、自動車産業と自動運転車のほぼすべての主要プレーヤーを含む印象的なパートナーのエコシステムを構築することに成功しました。
Omniverseの能力はこのセクターだけに限定されるものではありません。その可能性は当然、ロボット工学の分野にも広がっています。そうです、お分かりのように、ロボット工学は、会話AIにおけるChatGPTのような革命に匹敵する革命の瀬戸際にあります。
私はほとんど、ロボット革命が人類が今まで経験した中で最大の革命になるだろうと言いたいところです。特に、ヒューマノイドロボットの開発において、私たちは急速に大きな転換点に近づいています。
この主張は推測的なものではありません。このチャンネルで毎日目にしている具体的な進歩に基づいています。非常に多くの企業が現在ヒューマノイドロボットに取り組んでおり、人工知能分野における最近の驚くべき進歩の波により、その能力は10倍に増大しています。
プレゼンテーションでは、テスラのOptimusを含む、現在開発中の実在するロボットの印象的なパノラマが示されました。はい、彼らはそこにいます。そしてFigureのロボットも含まれています。これはSFではありません。これらは現在、実際に開発中のアクティブなプロジェクトなのです。
繰り返し言いますが、私たちが言及した技術の収束は、非常に近い将来、一般的なロボット工学において劇的な進歩が見込まれることを示唆しています。
一般的なロボット工学、特にヒューマノイドロボットの重要性は、その独自の適応性にあります。なぜなら、従来のクローラーやホイール式ロボットが特別に設計された環境を必要とするのとは異なり、一部のロボットアーキテクチャは今や私たちの既存の生活空間や作業空間に自然に統合できるからです。
世界は人間のために作られているということを忘れないでください。したがって当然、ヒューマノイドロボットを作ることは、自動化のタスクを大幅に簡素化することになります。
動画がかなり長くなってきましたので、ここで終わりにしたいと思います。お楽しみいただけたでしょうか。従来のスタイルとは少し異なり、皆さんともう少し対話的に、未来が本当に私たちに何をもたらすのかについて、より具体的なポイントを議論したいと思いました。
まだの方は、動画を気に入っていただけたら、チャンネルの登録をお願いします。技術に興味がある方向けに毎日動画を投稿しています。また、トレーニングコースに登録するためのリンクは全て動画の説明欄にありますので、ご確認ください。ありがとうございました。また明日の動画でお会いしましょう。

いいなと思ったら応援しよう!