![見出し画像](https://assets.st-note.com/production/uploads/images/131474793/rectangle_large_type_2_a9c861b1a3c00c001905b08e272b2999.png?width=1200)
AI・VR・ブロックチェーン技術の接合点としてのデジタルヒューマン
はじめに
こんにちは。まつさこです。
昨今、デジタルヒューマン技術が急速に進歩しています。
国策としてエンタメ創出の基盤づくりに力を入れている韓国でも、「MAVE:」という一見本物のヒトと見紛うクオリティのバーチャルアイドルが登場していたりします。
このMAVE:のメンバーは全員、見た目もプロフィールも肉体を持つ人間としては実在しない存在です。しかし一方で、その存在自体が完全に人の手を離れているというわけではありません。たとえば、声やモーションは人間由来のように見えますし、活動するときの発言やしぐさも、誰かしらスタッフが決めて動かしているように思います。
この記事で指す「デジタルヒューマン」は、
肉体・精神共にヒトの手を完全に離れて動作する、意識や記憶のようなものを持った自律した存在
と定義します。
そしてそのデジタルヒューマンを実現するために必要な技術として、AI、バーチャルリアリティ、ブロックチェーンを取り上げ、発達したそれらが融合することで初めてデジタルヒューマンが成立するという考えをつらつらと書いていきます。
生成AIがすごすぎる
そもそもなぜこのようなことを考え始めたかというと、ことの発端は2023年の生成AIの進化と普及です。
僕自身、以前からバーチャルリアリティ技術には触れてきたため、バーチャルな存在やアバター技術はなじみ深いものでした。VRChatというVRSNS内で「お砂糖」と呼ばれる恋人の様な友達の様なパートナー関係が存在したり、デジタルな身体がヒトの心に不思議な作用を起こす様を観測してきました。
そして、2022年11月にChatGPTが公開されました。ヒトの手を離れ、完全にコンピュータのみとの対話が成立した衝撃は、全人類の記憶に新しいと思います。
衝撃から約半年後、2023年6月に開催されたAI x Cryptoハッカソンというイベントに参加しました。これまで自分の身近にあったバーチャルな身体やアバターは、とはいえ中身は生身の人間であったこと、そして話題のChatGPTがコンピュータ人格と言えるものを実現していることを合わせて考えると、「完全にコンピュータで再現された人格と、その姿を見て対話したい」と思うことは必然でした。
そこでそのハッカソンでは、ChatGPTなどの大規模言語モデルと、StableDiffusionなどの画像生成技術を組み合わせた、AI恋愛シミュレーションゲームを開発しました。
AIハッカソンでとんでもない恋愛シミュレーションゲームが完成した...
— まつさこ (@wappaboy) June 20, 2023
1️⃣ヒロインと自由会話
2️⃣会話の履歴から待ち合わせ場所や着ていく服の情報を抽出
3️⃣抽出情報をStableDiffusion用のプロンプトに変換して画像生成… pic.twitter.com/OLr8YSx9Pf
自分たちでいざ作ってみて、控えめに言ってもその体験は衝撃的でした。
体験自体は、ヒロインの女の子と自由に会話をして、その会話の内容から行きたい場所や服装の情報が抽出され、デートの日の画像が自動生成されるという一見シンプルなものです。
しかし、会話内容やデートの行き先になんの縛りもない遊びの自由度、ヒロインの返答のクオリティ、出てくる画像の美麗さ等、どれをとってもこれまでにない体験でした。
実装としては提供されているAPIを繋ぎこんでいるだけで、特段複雑なことはしていません。AIに関する専門知識がなくても、これほどのクオリティの体験が作れてしまったという事実もまた、驚くべきことの一つでした。
様々なSF映画で登場するような、ヒトと対話するのと遜色ないコンピュータ人格の実現は、さほど遠くない未来に来そうだと実感しました。
![](https://assets.st-note.com/img/1708399864654-mBpiePYBzz.png?width=1200)
![](https://assets.st-note.com/img/1708399886585-wqGMxKOHO4.png?width=1200)
![](https://assets.st-note.com/img/1708399901559-dx4JDlzJL6.png?width=1200)
三つの技術の接合点
では、上で述べたような、ヒトの手を離れた自律したコンピュータ人格を完全に実現するためにはどうしたらいいのでしょう。
僕は、「AI」「VR」「ブロックチェーン」技術を組み合わせることがキーになってくると考えています。
(上記の例の画像でロボット型のが登場していますが、いったん今回は物理的な肉体を必要としない、メタバースなどのデジタル空間で活動する自律人格を想定しています)
■ 意識と記憶、そして臓器としての「AI」
AIの活用については、ほとんど先述した通りです。
特に生成AI周りの進歩により、ヒトと同等かそれ以上の解釈とアウトプットが可能になり、意識や記憶といったものが疑似的に再現されることは想像に難くありません。
また、臓器としてのAIという見方もできると考えています。意識や記憶といったものは言わずもがな「脳」にあたりますが、たとえば音声合成AIは「声帯」という臓器を担っていると考えることが出来ます。キャラクターの人格や見た目に即した声をAIで作り出すことで、よりスムーズにヒトとコミュニケーションをとることが出来ます。
2024年2月現在、Style-Bert-VITS2 といった感情表現が出来る音声合成ツールや、Synthesizer V といった人間と見紛うクオリティの歌声を作れるツールが出てきています。
さらに、Speech to Text 技術は「耳」に相当しますし、GPT-4Vに代表される画像から状況を推測する技術は「眼」に相当すると言えます。
このように、デジタルヒューマンをよりヒトらしく振る舞わせるためのコアの部分を担うのが、AI技術だと考えています。
■ ヒトとの接点を作る「VR」
ヒトがデジタルヒューマンと接するために必要になってくるのが、バーチャルリアリティ技術です。僕たちヒトは、物理世界にもつ肉体に縛られており、その肉体をデジタル世界にそのまま持っていくことはできません。
なんらかの方法で分身としての「仮の肉体」をデジタル世界に用意し、そこに自身の意識を重ねあわせることではじめて、デジタル世界に住む存在と意思疎通ができます。
この行い自体は、ヒトは古くからやってきました。身近な例だと、ゲーム機のコントローラを通してゲーム内の主人公を操作し、ゲーム内のNPCと会話をすることです。「デジタル世界の分身に意識を重ね合わせる」ことの最たる例だと言えます。
最近はヘッドマウントディスプレイ技術が比較的一般的になり、Meta Questなどの安価(?)な機材で簡単にバーチャル空間に入れるようになりました。指先だけで操作するゲームコントローラーとは異なり、HMDによって視覚・聴覚・全身でバーチャル空間に没入することで、よりデジタルヒューマンとの交流に実在感が伴います。
Ready Player Oneという映画でも、主人公がバーチャル空間で案内役の執事と対話をするシーンがあります。この劇中のメタバースサービス「OASIS」のほとんどのプレイヤーは生身のヒトですが、この執事は「中の人」がいないコンピュータ人格です。
![](https://assets.st-note.com/img/1708400147015-KOM2pOLqcv.png?width=1200)
このように、物理現実に肉体を持つ僕たちヒトと、デジタル空間に根差して生きるデジタルヒューマンとの「界面」の役割を担うのが、VR技術だと考えます。
■ 存在の唯一無二性を担保する「ブロックチェーン」
ビットコインなどの暗号通貨に代表されるブロックチェーン技術は、一見デジタルヒューマンとは関係ないように思えます。
しかし、ブロックチェーン技術の性質の一つである、データの代替不可能性の担保が、デジタルヒューマンの実現に不可欠です。
僕たちヒトは、まぎれもなく身体は一つしか持っておらず、コピーして同時並行的に別の場所に存在することはできません。(そうできたらいいのにと人々は思い続けていますが…)
一方でデジタルヒューマンは、実体としてはデータなので理論上はその存在は複製可能です。複製可能で、同時並行的に別の場所に存在できることは、ある意味でデジタルヒューマンがヒトより勝っているメリットの一つかもしれません。たとえば、アイドルがファンと握手会などで交流する際、ヒトのアイドルは身体が一つだけなので対応できるファンの数には限りがありますが、デジタルヒューマンのアイドルであれば、存在そのものを複製できるので対応できるファンの数に制限はなさそうです。それぞれの分身がファンと交流した記憶が統合され、すべてのファンとの思い出を憶えていることもできるでしょう。
しかし、複製されたデジタルヒューマンが「本当にその人であるか」ということは見分けられるでしょうか?
僕たちヒトでさえ、デジタル上でなりすましが容易に行われ、騙されてしまう人が後を絶たないのに、いわんや「存在そのものをコピーできてしまうデジタルヒューマン」をや、という感じです。本物と偽物を見分けることは、不可能です。データが不当に複製され、詐欺などが横行してしまう世界観が容易に想像できます。
そこで重要になってくるのがブロックチェーン技術です。技術的な詳細説明は省略しますが、ブロックチェーン技術をつかえば不当なデータの改ざんや複製が非常に困難になります。
オリジナルのデジタルヒューマンが、信頼性のあるデータソースとして機能するので、その真価を思う存分発揮することが出来ます。
このように、僕たちヒトの身体がただ一つであるように、デジタルヒューマンを唯一無二の存在として担保するために必要なのが、ブロックチェーン技術だと考えます。
あるいは、ヒトとデジタルヒューマンの間に形成される「思い出」のようなもの、関係性の唯一無二性の担保にも、活用できそうです。
まとめ
一見別々の技術に思える、AI、VR、ブロックチェーンは、これまで人類が様々な物語で夢見てきた「バーチャルな友人」を実現するためにようやく集合する、そんなイメージを抱いています。
ちなみに、量子コンピュータ技術も気になってます…
自律したデジタルヒューマンやメタバース空間をどのような技術要素で実現するのかについて言及する記事や論文がありましたら、是非コメントで教えてください。
読んでくださりありがとうございました。