ロボットを動かす3体問題🚀🤖🦾これを解決するためにNvidiaは3つのコンピューターを作り上げました。🦿
フィジカルAIの時代が到来しました。
フィジカルAIとは、物理世界を理解し、相互作用できるモデルのことです。
これは本当に驚くべき内容です。
フィジカルAIで必要になるのは、3つのコンピューターです。💻
1つはAIを生成するためのコンピューター、🤖
もう1つはAIをシミュレーションするためのコンピューターで、
どちらも合成データ生成に使用されます。
AIロボット(人型ロボットや操作ロボット)がAIを改善する学習を提供するコンピュータが必要です。🦿
そしてもちろん、3つ目のコンピューターは実際にAIを実行するものです。
つまり、これは「三つのコンピューター問題」であり、「三体問題」とも言えます。
非常に複雑な問題であり、これを解決するために3つのコンピューターを作り上げました。
そして、この内容を理解するためのビデオも作成しましたので、ぜひ楽しんでご覧ください。
ここで行ったことは、これらのコンピューターのそれぞれで、ソフトウェアスタック、アルゴリズム、コンピューティングインフラストラクチャ、ロボット用プロセッサ、機能安全オペレーティングシステム、またはその上で動作するAIやコンピュータービジョンモデル、さらにはコンピューター自体のどの部分でも、ロボティクス開発者向けにオープンにした点です。スタックのどのレイヤーでも利用可能です。
短いビデオをご覧ください。素晴らしいですね。
フィジカルAIの時代が到来しました。フィジカルAIとは、物理世界を理解し、相互作用できるモデルのことで、多くはロボット、特に人型ロボットに組み込まれます。これらの高度なロボットを開発するには、膨大なデータと、多様なコンピューティングインフラを用いたワークロードオーケストレーションが必要です。NVIDIAは、開発者の作業を簡素化し、加速させるために、3つのコンピューティングプラットフォームを提供しています。
それは、NVIDIA AI、Omniverse、そしてJetson Thorで、さらに生成AI対応の開発ツールも揃えています。🧰🔬⚒️
Project GRootは、汎用人型ロボットの基盤モデルを目指したプロジェクトであり、NVIDIAの研究者たちは、人間の動作をキャプチャし、ロボットの手が物理世界に重ねて動く様子を視覚的に捉えています。その後、NVIDIAのIsaac Labに統合された生成シミュレーションフレームワーク「RoboCasa」を使用し、膨大な数の環境とレイアウトを生成します。さらに、MimicGenMimを使って、少数の実際のキャプチャデータを基に大規模な合成モーションデータセットを生成し、データサイズを増やします。この実データと合成データを組み合わせたデータセットを、NVIDIA DGX Cloudでモデルのトレーニングに使用します。🏋🏽♂️🏋🏼
次に、クラウド上のIsaac Simでソフトウェア・イン・ザ・ループテストを実行し、Jetson Thorでハードウェア・イン・ザ・ループの検証を行った後、改善されたモデルを実際のロボットに展開します。NVIDIAのOsmo Robotics Cloud Compute Orchestration Serviceは、このワークフロー全体で分散リソースのジョブ割り当てやスケーリングを管理します。
これらのコンピューティングプラットフォームが一体となることで、世界中の開発者がフィジカルAI搭載の人型ロボットの時代を切り開く力を手に入れています。
#フィジカルAI #物理世界 #AI生成 #AIシミュレーション #合成データ生成 #AIロボット #三つのコンピューター問題 #三体問題 #ロボット用プロセッサ #コンピュータービジョンモデル #NVIDIA #Omniverse #JetsonThor #ProjectGRoot #IsaacLab #RoboCasa #MimicGenMim #DGXCloud #IsaacSim #OsmoRoboticsCloudComputeOrchestrationService #PhysicalAI #JetsonThor