Metaに振り回された10カ月間を振り返り、メタバース、Virtual Realityの現状を整理する。
メタバースの現在
ザッカーバーグの声明
7月28日に開かれたMeta社の従業員集会で、ザッカーバーグは事業計画に関して「あまりに楽観的すぎた」と語った。FacebookがMeta社へと社名変更をしてから10ヶ月ほどがすぎた現在、Meta社の上場後初の売上高減少、また今回のザッカーバーグの発言も相まって、いささかメタバースへの風当たりは強いと言える。
また7月30日のbloomberg.comのanalyticsでは、2021年の8月から2022年の6月に至るまでの「メタバースを含む新しい求人情報の推移」が掲載されている。求人情報の規模は2021年の12月から2022年の4月に至るまで14pointから696pointへ増加し約50倍もの上昇が確認されているものの、2022年6月には132pointへ減少、その規模はたった2ヶ月間で5分の1にまで縮小した。
この10ヶ月間、世界はGAFAの影響力の高さを再確認させられ、彼らが右だと言うと皆が右へ向き、各種メディアは「これからはメタバースだ」と取り上げた。さらにこの機運はNFTプロジェクトがジェネレーティブの静止画をローンチするだけで数十億規模の収益を上げ始めたことにも背中を押され、メタバースとNFTは新規領域「web3.0」として、新たな社会認識を生んだ。
しかし蓋を開けてみると、メタバースはユーザー獲得に課題を抱えていた。主要メタバースプロジェクト「sand box」と「Decentraland」において、4月11日時点での過去30日間における平均ユーザー数は「sandbox」は29%減少して1180人、「Decentraland」は15%減少して978人となった。またNFTプロジェクトのロードマップは極めて非現実的に見えるスケーリング戦略を語るものの、ジェネレーティブのローンチ以降はティザームービーしか公開できないプロジェクトが相次いだ。Web3.0に足を突っ込んだ誰もが浮かれていたと言えるその機運は、おそらくこの夏、ザッカーバーグの「楽観的だった」の一言を持って、少しずつ収束へ向かっていくと言える。
HMDの現在
Oculus questなどのHMD(Head Mounted Display、VRゴーグルなどを指す)を使ったサービスを考えていた時、その難しさに直面した時期があった。ゴーグルをかけるという習慣を人の生活に取り入れさせる1番の難点は、現実世界における視界が奪われることにある。
サービスとしては「ながら作業的何か」がほぼ何もできない体験となるため、自ずとHMDを使ったサービスの設計は「現実との共存ではなく、仮想空間でできることを増やす」「なるべく現実に帰らなくて良い」という戦い方へとなっていく。しかしそのような体験を作る戦略は「仮想空間と現実、どちらが優位かの競争的世界線」に立つことを意味し、仕事をするときに、現実でやるか、仮想空間でやるか。遊ぶ時、現実で遊ぶか、仮想空間で遊ぶかのように、現実に戦いを挑むしかなくなるのが難しいところである。
仮想空間について考える
メタバースとHMDを使ったサービス設計の現状を踏まえ、切り離せない要素「仮想空間」の発展シナリオについて考えてみる。その発展・活用の方向性はおそらく2つあり、一つはその空間において「現実と同等の解像度を目指しましょうというアプローチ」、もう一つはその空間において「より自然な人と人とのコミュニケーションを作りましょうというアプローチ」があると言える。
大事なのはこの2つのアプローチをごちゃごちゃにせず、まずは分けて捉えてみることだと思う。
現実と同等の解像度を目指す仮想空間
仮想空間の環境構築における解像度を高めていくというアプローチをまず考えてみよう。それは何を目指していて、そのアプローチで発展を望むと何が可能になるのだろうか。
第一に現状として、音に関してはある程度達成を迎えていると言え、映像に関しては、リアルタイムレンダリングエンジンを使った映像制作の発展をもって、もうすぐ達成するタイミングと言える。
このアプローチが目指す方向性を「社会=物理モデル」と呼んだりする。人間が実在する社会を「原像」とし、それにいかに近いか「本物らしさ」を志向する考え方であり、音の聞こえ方、目に見せる世界、触れたときの感覚など、実在する世界の物理的現象を人工的に作り出した情報環境において近づけていくという、古来からの「ミメーシス(模倣)」の原理に忠実な態度である。このモデルが生み出した代表的なサービスが「セカンドライフ」であり、世界観の設計や仮想空間でできること(通貨での取引や自己表現など)は、現実でできることを再現するように設計されていた。
もともとのVirtual Realityの思想はこのモデルの上に成り立っており、人工的に現実感を作り出すという態度から「『Virtual Reality』を『人工現実感』と和訳した方が良いのではないか」という議論が生まれたりした。
このアプローチでVirtual Reality、およびメタバースを発展させたとき、簡単に言えばそれは、私たちが知覚しているこの世界を仮想空間上にコピーしたようなアウトプットが生まれてくることになる。現状、このスタンスの仮想空間は、主に3通りの活用がされている。
解像度の高い仮想空間は一体何に使えるのか
あらゆる点で解像度の高い仮想空間の強みとはなんだろうか。1番の強みは、現実で行うにはコストが高いことを試せるという「コストの低さ」である。
simulation
現実で行うにはコストが高いが、仮想空間で行えると助かることの例として、第一に「simulation」を挙げられるだろう。建物のスケーリングや位置関係、ランドスケープがデフォルメされることなく設計されたVirtual江ノ島を作り、マグニチュード8.0の津波が来たとき、どのようなルートで津波が押し寄せるか、どの建物に避難するのが最適か「simulation」を繰り返し、避難経路の最適解を導き出すことなどができる。実際に津波が起きたときには、手持ちのデバイスでARで避難経路を表示できるアプリやgoogle map上で瞬時に最適な避難ルートが表示されるアップデートを加えることなどで、被害を最小限に抑えることが可能になるかもしれない。またそのsimulationを「映像として昇華することの意義」もあるだろう。現実と同等の解像度で自分が住む街に津波が押し寄せる映像は、それだけでインパクトがある。
AIが成長していく仮想空間
マイクロソフトは2022年7月、ドローンのAIをトレーニングするためのシミュレーション環境「Project AirSim」を発表した。現実での自律飛行を目指すドローンAIを、予め仮想空間で飛行テストを繰り返しておくことで、AIに学習を行わせるというものである。飛行中に鳥が飛んできたときの回避方法、その風圧から体制を立て直す訓練など、そのときに起こるあらゆる情報をデータ化して仮想空間上で飛ぶAIに直面させることで、学習を繰り返すことができる。
特に画像認識をベースとするAIにおいて、視覚環境をはじめとする解像度の高さをもった仮想空間は、AIの学習環境としてソリューションになり得る。
(Virtual production)
Virtual Productionをメタバースや仮想空間とは呼ばないが、リアルタイムレンダリングエンジンの発展によって可能になった活用法としてVirtual Productionが挙げられる。
Virtual productionとは、クロマキー合成(グリーンバックを背景に撮影し、その後、グリーンの部分をCG背景に合成する映像制作技術)に置き換わる比較的新しい映像制作技術である。リアルタイムレンダリングエンジンを利用することで、演者の背景にリアルタイムにCG映像を描画したり、リアルタイムで背景を更新しながら映画やドラマの撮影を行う技術のことを指す。
CGで作る空間の映像クオリティが「写実的」なレベルに追いついたこと、そしてそれをリアルタイムに更新できるからこそ、映画やドラマの撮影現場でCG映像を使えるようになった。
後からグリーン背景にCG合成をするのでは、撮影時には最終的なルックがわからない。それがリアルタイムにその場でわかるとなると、トライ&エラーを繰り返すことができるようになる。
また従来のグリーンバックを使った映像制作の問題点として、スタジオで背景の緑色がライティングに影響するという課題があったが、 参考画像のようなLEDディスプレイを利用するVirtual productionにおいては、背景に描画する映像のライティングが演者に影響するため、まるで実際にロケ地へと出向いたようなライティングをスタジオで再現できるという変化があった。
実際にVirtual productionが使われた事例としては、ルーカスフィルムが製作するスターウォーズのスピンオフドラマシリーズ「The Mandalorian」や、第72回カンヌ国際映画祭<最高賞>パルムドール受賞を受賞した「パラサイト」などがある。
より自然なコミュニケーション環境としての仮想空間
リアリティとは「目に見える世界」のことを指すのではなく、人と人とが織りなすコミュニケーションが自然であることに宿るとする立場である。
スタンフォード大学 ジェミリー・ベンレンソン著 倉田幸信訳「VRは脳をどう変えるか?」では、人間のコミュニケーションの複雑さに対して、無意識な”ダンス”と表現している。言語、非言語行動を通した人間のコミュニケーションはとても複雑であり、わずかな姿勢の変化や視線の動きといった身体動作は、会話をしている相手のリズムに同調するだけでなく、その空間にいる他の聞き手の身体動作にも影響を受けることが研究されている。1960年代にピッツバーグのウェスタン精神医療研究所病院に所属していた心理学者「ウィリアム・コンドン」は、その人間のコミュニケーション原理を”相互同期性”と名付けた。
そのような現実での「コミュニケーション」を「原像」として、それらになるべく近づけていこうとする開発態度を「社会=コミュニケーションモデル」と呼ぶ。このモデルでは、現実の地球環境の物理的な様相を情報環境で作り替えようとするのではなく「人と人とのコミュニケーションはどうすれば自然に行われるか」という点にとにかくフォーカスをする。この開発態度は「VR chat」を生み出した。人と人がコミュニケーションを生むことを考えると、アバターも仮想空間も現実に習う必要はないと考えるこの設計思想は、唯一今もスケールを続けるVRコンテンツの設計を可能にしたと言える。「VR chat」は、同接約42,000人を記録するサービスへと成長した。
「コミュニケーションとしてのリアリティ」を追求していく場合だと、現状の発展の方向性は主に2通りあり、新たなハードウェアの開発を軸により自然なコミュニケーションを作るか、人が集まる理由を作っていくかという、主に2つのアプローチが存在していると考える。
”相互同期性”を「原像」に、より自然なコミュニケーションへ
VR Chatにハマると、金がかかるというのは有名な話だ。最初はPC画面でアバターを動かしているものの、だんだんとVRヘッドセットが欲しくなり、そのうち全身トラッキングをするためにVIVEのトラッカーを買ってしまったりする人が続出する。さらにモデリングを勉強し、自作のアバターをアップロードしたり、ワールドを自作して、そこにVR chatで出会った友達を招待したりする、そこまでいくと人はもう、仮想空間から帰ってこなくなる。
これはコミュニケーションを自然にするために、仮想空間における情報量を増やしていくというアプローチであり、体に装着するデバイスが増えていくことで、より現実と同じような身体動作を仮想空間で行えるようにすることを意味する。
VRヘッドセットやモーションスーツや、トラッカーなど、そのようなVRデバイスが必要となるため、それらを前提としたサービス設計を行ってしまうと、ユーザーとしては参入障壁が高くなってしまう。そこがVR chatのスケーリングの限界になっていたりする。
ただこのアプローチで、より楽に、より自然にコミュニケーションが行えるVRデバイスが増えてくれば、VR chatの成長曲線になぞらえて、ユーザーが増えていくことが予想される。
「人が自然と集まる理由」を生む設計思想
自然と人が集まってくるから、そこにコミュニケーションが生まれる、それが何よりも「自然なコミュニケーション」なのかもしれない。Epic Gamesに買収されたSNS「Houseparty」のシマ・スィスターニ氏は「人々は、従来のメディアからソーシャルメディアに移行しました。そして、今度はソーシャルメディアからゲームに移行しています」と語る。
これは単に、「SNSの時のような2次元的なサービスの次の展開として、メタバースにして3次元化しましょう。」という意味合いではなく、何よりもまずそこに「面白いゲーム」があり、それが人を集めるから、そこに集まった人がつながる仕組みを組み込むと、そのサービスはgameとしての役割を超えていくという順序であることを意味する。
2021年の4月、Apex legendsのユーザー数は1億人を突破した。1億人というと、ちょうどフィリピンの人口と変わらない規模感である。
ベネディクト・アンダーソンの「想像の共同体」では、国民国家成立の要件として、「クローズされた世界観の形成」が重要だったことを述べている。言語の違いがあったとしても、空間と時間または歴史などを共有したことで「私たちは共同体である」という想像が起き、それがネイションの発生を促した。Apexをプレイするユーザーは同じルーツ、時間、空間を共有し、体験を共にし、つながり合っている。それが国家を破壊するとまでは言えないが、gameが余暇を楽しむための体験から、よりソーシャルなものへと広がっていく体験設計は着々と進んでいると言えるのではないか。
Zoomのコミュニケーションは、新しい”相互同期性”を生んだ気がする
上述した”相互同期性”について、それはおそらくコミュニケーションが行われる環境によって、異なる様相を見せるのではないか。Zoomなどのオンライン会議では、オンライン会議特有の”相互同期性”が芽生え始めているように感じる。
ApexやFortniteのような、3次元空間上のアバターを通したコミュニケーションも、そのうち人間は、心地よい”相互同期性”を身につける可能性があると思う。
まとめ
メタバースや、Virtual Realityを基本思想とする各々の技術は、それぞれがそれぞれに活用方法があり、少しずつ別々に発展してきている現状がある。
徹底的に映像美に拘った仮想空間を作れる技術があれば、ハリウッド級の映画制作にその映像を使える。デジタルツインとしての仮想空間を作れば、小さな自治体レベルでカスタマイズされた様々なシミュレーションができる。また現実で起こりうる気象環境、地理環境に忠実な仮想空間は、AIの学習環境としてのバリューを発揮し始めた。
そしてVRデバイスを使った「より自然なコミュニケーション」が行える仮想空間は、現実へと戻ってこない人間を生み出し、主要FPS・TPSゲームは若者が集まる環境へと変化し、1億人規模が同じルーツを共有する仮想空間へと変化した。
なるべく構成論的にものを見ていたい
2022年7月現在「midjourney」という、文章から静止画を生成するAIがtwitterで流行っている中で、AIに関する5年前くらいの未来予測を思い返してみると、その多くは「人間の創造的仕事への移行」を語ることが多かったことを思い出す。しかし5年後の実態としては、現在AIによって最も脅かされている職業が「コンセプトアーティスト」という、まるで「最も創造的にみえる仕事」であることを考えると、やはり改めて未来予測は難しいなと感じる。
その上で「構成論的な研究(AIを作ることでAIについて理解するみたいに、何かを作ることでそれを究明していくアプローチ)」ってやっぱり時代にあってるなあと感じる。おそらくAIを作っていた技術者たちは「文章から静止画を生成するという行為」について、AIがバリューを発揮しやすいことに何年も前から気付き、それに取り組んできたんだろう。
AIについては、AIを作ってる人間が一番わかっていた。2021年に改めて着目されたVirtual Reality、メタバース、仮想空間についても、作り続ける中で理解に励む姿勢が重要だと思う。
参考図書
デジタルネイチャー 生態系を為す汎神化した計算機による侘と寂
VRは脳をどう変えるか 仮想現実の心理学
想像の共同体―ナショナリズムの起源と流行 (社会科学の冒険 2-4)
ヴァーチャル社会の〈哲学〉―ビットコイン・VR・ポストトゥルース