
ロボットに世界モデルが搭載された日
近年AIがさらなる盛り上がりを見せています。
2026年には、AIの世界投資額が40兆円を超えると言われており、世界中の投資マネーが集まっている技術です。
ここ数年のAI動向を見ていると、ディープニューラルネットワークによる画像処理の、Transformerによる自然言語処理の飛躍的な成長から、Diffusion modelやLarge language Modelsといったモデルも登場し、一般人から見てもAIが人間を超えつつある事がわかるようになってきました。
(もともとタスクを限定すればとっくに人間を超えてましたが)
そこで数年前から学会等で話題に上がるのが世界モデルです。
世界モデルを人間的表現に置き換えれば「知能」にあたります。
人間は生まれてから成長するにつれて自然界における様々な事象を「直感的に」理解します。
例えば我々は、高いところにある物から支えを取ると地面に向かって落下するものだと理解しています。
それは親や学校の先生から「ものは上から下に落ちる」といったことや「万有引力」といった小洒落た法則を教わらなくとも理解しているものです。
そのうえで成長した我々人類は「ものは地面に向かって落下するもの」と理解し、その上で「なぜ地面に向かって落下するのだろう」と思考します。
世界モデル搭載AI
これまで世の中に登場してきたAIは、世界モデルを持っていません。
もちろん世界モデルは今現在も生まれてないという言説が主流ですが、OpenAIが発表したSoraによって小規模ながらも世界モデルが誕生したのではないかと言われるようになりました。
Sora serves as a foundation for models that can understand and simulate the real world, a capability we believe will be an important milestone for achieving AGI.
訳:Soraは、現実世界を理解し、シミュレートできるモデルの基盤として機能し、AGIを達成するための重要なマイルストーンになると考えています。
発表当時はこの「世界シミュレータ」というワードが話題に上がりました。
まあ多くのメディアは「動画を生成できてすごい」程度の記事でしたが。
さらに言えば「世界シミュレータ」を世界をシミュレーションできる、いわゆるゲームエンジン的な意味合いで捉える人もいました。
応用の範囲としてはゲームエンジンとなり得るかと思います。
将来的には「こんなゲームがしたい」と言えばそれなりのRPGゲームを作ってくれるかも
世界モデルに話を戻すと、このモデルが搭載されたAI(厳密言えば搭載という言葉は不適切ですが適切な表現が思いつかなかったのでこのまま)は、非搭載のAIとは根本的に異なってきます。
非搭載のAIで動画を生成すると、あくまでも確率的にこの画像(動画は画像の連続体)の次はこの画像という形で推論されるだけです。
一方で世界モデル搭載AIは、自然界における法則をも前提に動画を生成するため、鏡の前に女性が立つと反射して見えるであったり、太陽が真上に来る正午では影の面積は最も小さくなるであったりと推論するわけです。
次にAIは身体を得る
知能を得たAIが次に得るのは身体と言われています。
いわゆるマルチモーダルAIの研究も並行して発展しており、文字、画像、音声などを始め、いわゆる人間の五感で得る情報を学習させたAIです。
このAIに学習させるデータはそれぞれデータソースがバラバラで、一貫性がない場合がほとんどです。
ですが人間の五感をセンサーで表現したロボットにAIを搭載すると、ある程度自律的に行動しながら各種センサーで取得した一貫性のあるデータによって学習します。
その際にもう一段階のパラダイムシフトが発生すると多くの研究者は予測しています。
AIが身体を得た場合、彼らは並列での接続が可能なため1億台のロボットが見て聞いて感じたことは全て並列化されひとつの世界モデルを超高速にアップデートしていきます。
これは人類が今まで何世紀にもわたり行ってきた知識の継承を数時間で完了するほどの可能性があります。
ではその先はどうなるのでしょう。楽しみです。
世界モデルは人類史における集合知であると同時に、未来の可能性でもあるわけです。
ここまでいくとターミネーターの世界になるのてはと危惧する声もありますが、その時はその時で滅ばされるならそれでいいんじゃないッスかね。
機械には今のところ感情がありませんが、個性を獲得することはどこかであるかもしれません。
現代の機械でも個性がありますよね、ソニータイマーとか言われるやつみたいに
そんな感じで個性が生まれてそれが一種の感情的な捉え方を人類がしたりするのかなーと思ったり思わなかったり。