エヌビディアCEO：「我々はより大きなGPUが必要だサム・アルトマン＋レックスパート2

2024年3月21日 10:23

この記事をお勧めする人々

✅ AIとロボティクスに興味のある研究者やエンジニア
✅ テクノロジートレンドに敏感なビジネスリーダー
✅ AIの倫理や社会的影響に関心がある学者や哲学者
✅ 新しいAIツールやプラットフォームの開発者
✅ 教育者や学生、テクノロジーの未来を学びたい人

要約

Nvidiaが最新のBlackwellプラットフォームを発表し、Google DeepMindはVLOGGERでコミュニケーションの未来を切り拓く。サム・アルトマンはAGIの進化とその社会への影響を語り、技術革新の中でAIがいかに重要な役割を果たしているかを示しています。この記事は、AIとテクノロジーの最前線を追い求めるすべての人にとって必読です。

サイード・エザティ
2024年3月18日翻訳記事

fb tw メール

スポンサー

今日のメール
グーグルがVLOGGERを発表。

Stability AIがStable Video 3Dを発表。

📈 ひとつの簡単なプロンプトでクロード3とミストラルのパフォーマンスが向上

10の新しいAIツールとリソース。ツールの全リストはオンライン版をご確認ください。

サインアップ｜広告掲載｜ChatGPT｜オンラインで読む

トップニュース

GTCにおけるNvidiaの基調講演にはサプライズがあった

Nvidiaのジェンセン・フアン社長は、サンノゼのSAPセンターで開催された同社のGTCイベントにおいて、コンサートではなく、科学、アルゴリズム、コンピューターアーキテクチャー、数学に焦点を当てたNvidiaの発表を行い、多くの聴衆を魅了した。同氏は、1993年の創業からのNvidiaの歩みを強調し、加速コンピューティングと、ゲーマーや幅広いコンピューティング業界にとって重要なグラフィック・プロセッシング・ユニット（GPU）の進歩に焦点を当てた。

イベント中、フアンはNvidiaの新しいBlackwellプラットフォームを紹介しました。このプラットフォームは、従来のHopper GPUを大幅に進化させたもので、驚くべき速度の向上と消費電力の効率化を誇っています。Blackwellプラットフォームは、計算能力と効率の向上を目指し、チップ設計の限界を押し広げるというNvidiaのコミットメントを例証するものです。

さらにエヌビディアは、自動運転車開発者向けの新ツールを発表し、さまざまな業界におけるAIモデルの展開を合理化するために設計されたNvidia NIMソフトウェア・プラットフォームを発表した。NIMは、主要なプラットフォームと統合し、主要なAI研究機関のモデルをサポートすることで、AIの導入を促進・加速するNvidiaの戦略と、さまざまなデジタル領域への潜在的な影響を示し、ジェネレーティブAIの新時代を予告する。

NVIDIAはまた、プロジェクトGR00Tも発表します。ヒューマノイド・ロボットの基盤モデルとアイザック・ロボティクス・プラットフォームのメジャー・アップデート

AIを駆使したクリエイティビティ
AIを活用した、瞬時に洗練されたプレゼンテーション。Gammaを使えば、聴衆に簡単に印象を与えることができます。あらゆるデバイスでユーザーを魅了。エンゲージメントの測定、迅速なリアクション、シームレスなコラボレーション。

無料でお試しください。

Google DeepMindの研究者がVLOGGERを開発しました。

VLOGGERは、Enric Corona、Andrei Zanfir、Eduard Gabriel Bazavan、Nikos Kolotouros、Thiemo Alldieck、Cristian Sminchisescuによって開発された革新的な手法である。この手法は、確率的な人間から3Dモーションへの拡散モデルと、テキストから画像へのモデルと時間的・空間的制御を組み合わせた新しい拡散アーキテクチャを含む2つのプロセスを採用している。従来の技術とは異なり、VLOGGERは各人に個別のトレーニングを必要とせず、顔検出やトリミングの必要性を排除し、被写体全体の画像を生成することで、様々な人間のシナリオに対応する。

VLOGGERのフレームワークは、頭の動きやジェスチャーを取り入れながら、話している個人の写実的で可変長のビデオを生成する。この2段階パイプラインの第1段階は、音声波形を中間的な身体運動制御に変換し、視線、表情、ポーズに影響を与える。その後、時間的画像間変換ネットワークが、これらの制御と参照画像を使用してビデオフレームを作成し、ビデオ全体を通して被験者のアイデンティティが一貫したままであることを保証する。

この手法では、背景の一貫性を保ちながら、動きにかなりのバリエーションを持たせることで、被写体の多様でリアルな動画を作成できることが、際立った特徴の1つである。この多様性は、生成された80の動画の分析で実証され、特に被写体の動きにおいて、ピクセルのカラーバリエーションがかなりあることを示しており、VLOGGERがダイナミックでリアルな人間の動画表現を作成する可能性を示している。

サム・アルトマン：オープンAI、GPT-5、ソラ、ボード・サーガ、イーロン・マスク、イリヤ、パワー＆AGI

以下はその要点の要約である：

コンピュート（計算能力）は、世界で最も貴重な商品となる可能性がある。

AGI（人工知能）に向けて、この10年の終わりまでに極めて高性能なシステムが開発されることが期待されている。

AGIへの道のりは、AGIの最初の開発者に大きな権力が与えられるなど、大きな権力闘争を伴うことが予想される。

サム・アルトマンは、オープンエイの役員会での経験について、苦痛に満ちた、混沌とした、学習に満ちたエピソードであったと述べている。

OpenAIの回復力と、取締役会を適切に構成し、インセンティブを与えることの重要性が強調されています。

ポッドキャストでは、OpenAIとイーロン・マスクの対立と決別について触れ、マスクはOpenAIの成功を疑っていた。

DALL-E 1から3、GPT-3からGPT-4へのOpenAIの進歩が議論され、AI能力の進歩が紹介されます。

AI開発と潜在的なリスクや社会への影響を理解することのバランスの重要性が強調される。

対談では、データ利用、プライバシー、ハイテク産業における競争、検索エンジンにおけるAI統合の可能性など、AIの課題を探る。

アルトマンは、AGIの未来、その潜在的な時間軸、AIに関連する実存的リスクに対処することの重要性について推測している。

議論は、自然、進化、人間の経験についての哲学的考察で締めくくられる。

この記事が気に入ったらサポートをしてみませんか？