世界は僕の夢に近づいてきた
so-vits-svcというとんでもない技術が出た。平たく言えば、声データの学習を行い、その声を自由に操れる超高性能ボイスチェンジャーAIである。
これのヤバイのがその学習元の声データが、30分ぐらいの長さのボイスでも、人間かどうか区別がつかないぐらいの綺麗な声が出る。学習元と比較しても差が分からん。ちょっとイカれている。
リアルタイムも可能なので、バ美肉おじさんたちのガチ美少女声化が可能になる。3Dモデルが美少女で、声も美少女なら、それはもう完全なる美少女では?あとネカマもやり放題である。やったね。
口で説明するよりこの動画を見てもらった方が早い。
↑ブルーアーカイブの人気キャラクター、シロコのボイスをso-vitsで学習して歌わせた動画。正直本人が歌ってるようにしか思えない。
プロンプトで個人の画家の名前を指定して、出力したら多分違法だよ~って弁護士さんが言ってたのを参考にすると、多分いずれ著作権違反になると思われる、まだ前例がないから何とも言えないけど。
仮に法規制されたとして、どうせ削除と再投稿のいたちごっこなのでグレーゾーン化する感じもする。
今回こんなイキリタイトルを付けたのは、Makersの影響でも、詐欺師になったわけでもなく、さっきこの技術の悪用方法(生体認証の解除、無許可ASMRの販売)を考えていたら、コレ俺の望む世界への近道では?と思ったので忘れないように分かりやすいタイトルを付けたのである。
それにしても10年後ぐらいにこのnote見返して悶絶してそうですけども。
僕の夢は超楽しくてエグい仮想現実空間を作って、現実が嫌になった人間が逃げ込める、麻薬的コンテンツを作ること。技術がそれを可能にするのなら、人間は弱いのでどちらにせよ開発してしまう。ゲノム編集やヒトクローンの問題を見ても分かるだろう。1回タブーを破った人間は歯止めが効かなくなる。
だったら早いうちから麻薬的仮想現実を受け入れ、タブーを取り払うことで、より迅速な法整備や社会システムの構築に向かう方が健康的なのではないかと考えている。
そんな思想なのだが、なぜ今回のボイチェンでエグ楽しい仮想世界できるの?といいますと、
今回の件で、あとはそれぞれの技術の性能が上がれば、画像(画像生成AI)、動画(動画生成AI)、声(今回のやつ)というネットに晒されるほぼ全ての情報の捏造が可能になるので、ゴシップが存在しなくなる。もしくは存在しても相手にされない。
スキャンダルが無くなって、行き過ぎた正義感が行う「叩き」が衰退するうので、より島宇宙化が進み、オタク文化が信仰に近い形になる。ファンやオタクは出されたコンテンツをそのまま摂取し、提供者は”イメージ”をそのまま提供する、最強のアイドルが誕生だ。最高だね!(嫌味ではなく、本気でそう思っている)
字面が最悪だが、他人に邪魔されず、社会からの重圧もなく、(この調子だとマジでAIにお仕事取られそうなので、俺もバカにしてたけども)憧れの存在を推せるのである。仕事が奪われ、やることのないオタクたちにとって最高の幸せではないだろうか。
最強まで没入感を高くした仮想現実はもう魔法の世界である。なぜなら人類が頑張って発見した物理現象が全く効かない、意味不明な世界で人間の義務だと思われていたことをガン無視して遊べるのだから。しかもVR酔い以外の副作用が無い。麻薬とは比べ物にならない人類最強のドラッグだ。
ただ勿論この技術、死ぬほど悪用が出来る。先ほど挙げた生体認証の突破、許可を得ない学習されたAI音声の販売、アイドルの音声を学習、リアルタイムボイチェンを使ってなりすまし、詐欺などの悪用方法一般層に浸透していない初期は混乱を引き起こすだろう。「戦争となんとかが科学技術の発展を牽引する」とはよく言ったもので、人間は素晴らしい最新技術が開発されても、ろくなことに使わないのである。僕は涼風青葉ちゃんに自分の名前呼ばせたいです。
魔法で思い出したのだが、クラークの「十分に発達した科学技術は、魔法と見分けがつかない。」を自著の中で紹介されていた、落合先生とMakersというイベントのおかげで7分ほどだけですがお話する機会に恵まれまして、ずっとこういう麻薬がどうとかみたいな話をしてきたのですが、結構反応が良くて嬉しかったです。
割と僕と似た感じの考え方の人で、厭世観というか人間に対する諦めみたいなのも感じた。ただその中で楽しもうという気概を感じて、めっちゃカッコよかった。声小さかったけど。
本当にあのイベント出てよかった。TKDありがとう。
バナナのナス、バナナス。