AI Coverは新しい音楽文化なのか? & # 2023年Vtuber楽曲10選 (裏)
Welcome to the new world.
皆さんは新しく登場したAIによる音声変換技術のすごさをご存知でしょうか? 日本では安野貴博さんが実演した岸田総理の声を記憶させた生成AIがTVで流れてSNSでも話題になり、ご存じの方も多いかもしれません。何がそんなに驚かれたかというと、本人が喋っているようにしか聞こえない音声を手軽に誰でもできてしまうようになったことにあります。その革新的な技術が搭載されたツールは、RVCやSVC(Diff-SVC、so-vits-svc)と呼ばれていて誰でも無料で入手することができます。音声変換と言われると従来のボイスチェンジャー技術を想像するかもしれませんが、既存のものよりも機械感がほとんどなく、良い意味でも悪い意味でも、自然な声に変換してくれます。
さてそんな大注目のAI音声変換技術は、もちろん音楽にも取り入れられていくことになります。
AI音声によって大量生産されるCover曲
そのAIで変換した音声でカバーした音楽は一般的に「AI Cover(AI カバー)」や「AI〇〇〇(◯には人物やキャラ名)」と呼ばれています。AIシンガー(VOCALOID AIやCeVIO AI、Synthesizer V AI)や人力VOCALOID(UTAU)と何が違うの?と聞かれると、似ているとも言えるし、労力や制約が違うので別物とも言えます。
“コピーロボット”の働きが声優の収益に AIシンガー業界に到来したサブスクビジネスの可能性 https://www.itmedia.co.jp/news/articles/2208/29/news081.html
AI○○を人力と呼ぶな委員会~お前は人力の何たるかを知ってるか~|あげやき
https://note.com/ageyakiatuyaki/n/ncce5c32b0099
音声変換AI技術の似ている点は、最近のAIシンガーのような声の自然さがあり、技術を完成させるために適切な音声素材がそろっていなければいけないという点です。人力VOCALOIDの音MADのように素材が黒いものであれば、2次創作で怒られる覚悟をしていなければいけないところも同じでしょう。
違う点をあげるなら、労力が段違いに少ないことです。ただしAI音声変換単体では変換するだけなので、イントネーションを調整することはできません。そしてRVCやSVCの学習モデルはシェアすることも可能で、音声AIモデルと音声AIモデルを混ぜ合わせることで新しい可能性を生み出すこともできます。
そんなRVCやSVCの学習モデルを簡単にシェアできてしまうという点が影響して、いま爆発的に増えているのがAI Coverになります。
中国で蠢き始めたAI音声変換の技術
技術は突然現れるものではなく、日々の研究の積み重ねから生まれます。まず2021年に韓国で音声合成技術の「VITS」が発表されました。発表時はSNSで驚き屋がでることもなく、韓国のエンジニアがまじでビビってたり、音声変換愛好家のおもちゃになっていたりとこの頃はまだ平和なようでした。それが2022年に中国で開発されたMoeGoeのバズという形で、AI音声の技術が日本でも広く認知されることになります。
音声変換AIの開発に積極的だったのは中国語圏のコミュニティで、so-vits-svc(SoftVC VITS Singing Voice Conversion)やRVC(Retrieval based Voice Conversion)などが生み出され、最初に注目されることになったso-vits-svcは2022年8月ごろに姿を表しました。中国の音声まわりで有名な開発は多く、Diff-SVC(DiffSVCではない)やDiffSingerも中国で生み出されています。
そんな中、動画共有サイトbilibiliでシンガポール出身の女性歌手「孫燕姿(Stefanie Sun)」の声を利用してso-vits-svcによって変換された音声「AI孫燕姿(ステファニー サン)」が話題になり始めます。2023年5月時点で、過去 1 か月間に公開された関連ビデオが60 以上で累計再生量が1,000 万回を超え、現存している動画で再生数が一番多い发如雪は280万再生になっています。またとあるアカウント1つだけで、 AI ステファニー・サンのカバーが25 本もリリースされ、合計で再生回数は 231 万回、ファン数は14,000人にも達したそうです。
その人気ぶりは、ステファニーサン本人を「売れない歌手」「ホームガール」と揶揄する気持ち悪い事態にも発展しました。補足しておくとステファニーサンは全盛期にアルバムが200万枚セールスを記録したり、シンガポールの建国記念日のテーマソングを歌ったりとアジアを代表する歌手の1人です。わりと最近でもオンラインライブでかなりの視聴数を叩き出していました。
この流れを重く受け止めたのか、一部のAI利用者は自主的にbilibiliからAI Coverを削除。この騒動はそれだけにとどまらず、ステファニーサン本人にも届き、公式ブログで「我的 AI」というタイトルの声明が投稿される事態に。孫燕姿は「人気のない」というネットの感想を受け入れつつも、アーティストとしてAIや騒動を冷静に俯瞰して皮肉な意見を述べていました。
この騒動は様々な中国メディアで報じられ、「どういった騒動だったのか?」「技術はどうなっているのか?」「著作権の侵害なのか?」「法律専門家の意見は?」など非常に早い段階で多角的に情報共有がされていた気がします。この時点では日本でこの騒動に注目している日本メディアはほとんどなかったです。
この騒動で止まるか?と言えば、止まらないのが中国です。AI音声絡みの騒動の中心地になったbilibiliでは「AI虚拟之声实验室」というトピックが設けられ、確認時点で閲覧数が5億回になっていました。またそこで紹介されていたイベントでは、VOCALOIDやUTAUと一緒にRVCなどの技術が横並びになっています。
AI Coverを作るには技術や知識と合わせて、もう1つ声を覚えさせた学習モデルが必要です。このAI音声が流行った理由として、学習モデルの作成が容易だったことがあります。ですが、それでも良質な音声データをどのように学習させるのか専門知識は必要です。そのため学習モデルは作れる人間が作り、歌わせたいやつが歌わせるという形になり、日陰なコミュニティでシェアされるのが一般的になっていきます。初期の頃からYouTubeで人気のあったAI Coverの学習モデルはたいていbilibili経由で配布されていた学習モデルが利用されていたのではないかと筆者は考えています。
また先程の例からもわかるように、実社会に存在する人物の名前と音声データをリンクさせて使うことは、その人のブランドに影響してくるため、音楽やタレントの管理会社から目をつけられることになりました。そのため、AI音声の学習モデルは特定のジャンルに集中していくことになります。それは文句をつけてこない人物か、2次創作に(クソデカ解釈で)比較的寛容もしくは越境していて文句をつけづらいアニメやゲームです。とくにbilibiliで精力的に作られたのが、世界的に知名度のある原神、ブルーアーカイブ、そしてなぜかジョジョの奇妙な冒険シリーズでした。これは後述する謎のAI Coverブームの一端を担っていくことになります。
AI Coverは世の名作やその時流行していた音楽を積極的にCoverしていく傾向にあります。なので、なんでこの声でこの曲を歌わせているんだろうという意図の読めない作品が大量に並び、視聴者の感情が虚無になることが多々あります。それでもその中に最高な組み合わせが稀に生まれるのがAI Coverの良さだと個人的には考えています。その当時流行っていたアニメ作品は推しの子で、世界的に大流行していたのがYOASOBIのアイドルです。あの作品からでてくるワードは多方面で相性が良く、AIも例外なくそうでした。AIと愛という言葉遊びだけでなく、虚構性であったり、嘘つき(ハルシネーション)だったり、ミステリアスさだったり、誰の目を奪っていく存在として面白いぐらいに相性が良く、そんなAIが星野アイにアイドルを歌わせた作品は、グロく、面白く、とても複雑な感情が生まれて大好きです。
もう1つAI Coverで注目している組み合わせはVTuberです。なぜならVTuberというコミュニティは比較的2次創作に寛容で、デジタルっぽさのある存在でAIと親和性が高く、ボカロ文化と密接な関係があるからです。bilibiliではその傾向が強く出ていて、「AI虚拟之声实验室」というタグではbilibiliでも人気シンガー東雪蓮さんの音声を使った「反方向的钟 - 周杰倫」のAI Coverが再生数でトップを記録していて、いまも上位を争うぐらいです。ここまで盛り上がっている理由は、東雪蓮さんが初音ミクみたいになってみたかった想いがあり音声AIに対して前向きな意見を述べているからというのがあります。
もう1つ面白い例は、先程紹介した「虚拟之声创作计划」で紹介されていたVTuber折原露露さんの「INTERNET OVERDOSE - @Aiobahn feat. KOTOKO」を本人とAIがカバーして歌い比べしている動画。もちろんVTuberが自分の声で歌わせたり、エンタメとして声比べしている動画はいくつもありました。ですがこの動画は、かなり早い時期にAIとVTuberが共創していて注目に値します。
英語圏で大荒れするAI Cover
中国でこの技術がほどよく広がり始めたころに、英語圏でも突如としてこのブームが広がり始めます。主な火付けとなったのは Kanye WestのAIです。YouTuberやInstagramer、コンテンツクリエイター、突如現れたAI Coverアカウントがこぞって取り上げたことによって、4月あたりからTikTokの#aicoverが増加し始めました。その視聴数の伸び方はかなり異常なスピードで、4月時点ですでに100万視聴、6月には10億視聴、10月には100億視聴と速度は加速しています。ただし視聴されているのか、中身のない動画が大量生産されているのか要因がどちらかはわかりません。
そのためブーム初期では黒人アーティストのAI Coverがそれなりの割合を占めていました。ですが徐々にその傾向が変わっていきます。AI Coverは常に有名人、推しなど音声データが充実していたり、知名度の高い人物になりがちです。例えば、Michael JacksonやDrake、Ariana Grandeなど、当時のニュースに多数まとめられています。
しかし有名所をチョイスするということは、それだけ厳しい目を向けられ、問題を回避することが難しくなります。言うまでもなくAI Coverはアーティスト本人からお怒りを買い、音楽管理会社によって削除され始めます。こちらのAI Coverのまとめ記事を見ればどれくらい消されたのかよくわかります。さらに権利的な問題だけであれば良かった(良くない)が、さらに最悪なトラブルを起こしてしまいます。
Loza Alexanderというラッパーが、Drakeや21 SavageのAIを使いトランスフォビアな歌詞を歌わせただけでなく、ドナルド・トランプ元大統領のコラ画像とAI音声を使いOFFICIAL AUDIOというタイトル表記でコラボさせる最悪の活用方法を披露しました。
他にも未知の技術登場時に起きそうなトラブルも起きていて、様々なプラットフォームから削除された 「Heart on My Sleeve」が突如グラミー賞候補になるか?とNew York Timesで報じられたかと思えば、すぐに撤回される事件があったりもしました。世間の空気の逆を行こうとするアーティストも同時に現れていて、使用料を払ってくれるのであれば使ってもいいよとカナダのGrimesは表明しています。
さて、英語圏でも中国語圏のように、AI関係のコミュニティはもちろん存在しています。主にDiscordというチャットツールが拠点になっていることが多く、その中でAI音声学習モデルの一大拠点となっていたのが「AI Hub」です。2023年6月時点でグループは10万人超え、学習モデルは700を超える規模に成長していました。そんな中、コミュニティ内でAI音声の取り扱いについて様々な議論がされていた一方で、既存の音楽コミュニティと度々衝突していました。そんな活気がありつつもバチバチな状態が続いていたところ、2023年10月にあっけなくサーバーが消えることになります。理由はさだかではありませんが、チャンネルに投稿されていた権利的に厳しいAI Coverをきっかけに通報で消えてしまったのではと言われています。
さてそんな権利者と衝突しまくっているAI Cover界隈ですが、その裏側でニコニコ動画のように表側では紹介しづらい文化みたいな環境が育ちつつありました。それは先程述べた文句をつけてこない人物や2次創作に比較的寛容もしくは越境していて文句をつけづらいアニメやゲームの音声です。それを象徴するわかりやすい動画として、AI音声の有名所でCoverした「アイドル」が端的に当時の状況を表していてわかりやすいです。トリを音声合成ソフトの初音ミクに歌わせているのは、謎にリスペクト?があって個人的には好きです。
AI Cover作品でとてもアメリカらしいAI音声をあげるとしたら、アメリカ大統領シリーズです。正直言ってフェイクニュースに使われたら洒落にならない系ですが、Twitterの英語圏でもちょこちょこおもちゃになってバズるくらいに気軽に使われていた印象があります。とくにフェイクの象徴といっても過言ではないドナルド・トランプのAI音声は非常に人気があります。アメリカ大統領3人でカバーした恋愛サーキュレーションはゆるい会話劇から始まり、ご近所のおじいちゃんたちの気の抜けたような声で歌い上げているのはすさまじくアホくさくてオススメ。
国のトップ?つながりであげるとしたら、映画「ヒトラー最期の12日間」の空耳動画で一部の人達にやたら知名度のあるアドルフ・ヒトラーが人気AI音声の一つ。いろいろとあれなやつと組み合わせたAI Cover作品がいろいろあってとても興味深い作品群です。
なぜ歌わせたのかまったく意味がわからないのだと、Minecraftシリーズです。いつもふぅんとしか喋らない村人がいきなり美声で歌い上げるのは「???」にしかなりません。もちろんふぅんなボイスで歌い上げたAI Cover動画も。またTikTokにはMinecraftのドアだけでAI Coverをあげる最高に頭のおかしいアカウントも存在したりします。頭のおかしい発想に見えますが、応用するとチェーンソーやはぶらし、スクリュードライバー、にわとり、ピクミンなど音声変換AIでどんな音でも歌わせることができるということです。
アメリカのサウスパークシリーズも、AI Coverの常連です。オススメとしてあげるのはAI Cover常連のVirtual Insanityのカバー。シャウトのところなんかがとてもEric Cartmanっぽさを感じます。作品がとてもメタメタしい作品なので、何を歌わせても違和感がないのは強いです。
もう1つ何をやらせても強いのがスポンジボブシリーズです。長寿な作品だけあって、AI Coverが充実しているだけでなく、専用の作り方の紹介ツイートがバズっていたりとさすがの人気です。また話が少しそれますが、スポンジボブシリーズは謎にいろんな種類のAI配信がされては、バズったり、消えていったりを繰り返していて、ここがどう影響を及ぼし合っていくのか地味に気になるところです。
音声を変換しただけのAI Coverの中にやたら手をいれた動画もちょこちょこ出てきていたりもしています。個人的にはこういった単純なAI音声変換動画ではない動画が増えていってほしいなと思ったりもしています。
K-POPにもAIの流れ
AI Coverの波に巻き込まれたのは、音楽の世界的な一大ジャンルになったK-POPもでした。その傾向が強く出ているのはTikTokで、YouTubeでAI Coverを検索すると少しオタクな傾向にありますが、TikTokでは容易に韓国アーティストでのAI CoverのHowToが見つかるため、プラットフォームの文化が大きく影響しているのかと思います。なので日本語圏のユーザーでもブームの初期頃から韓国アーティストに歌わせてバズったのが結構あります。
またYouTubeにK-POP関連がないのかというと全くそんなことはなく、TikTokと比べると体感値で比較的再生数が控えめな感じはしますが、K-POPの楽曲をAI Coverさせた動画は大量に出てきます。個人的に飽きるほどみかけたのは、デビューから史上最短期間で米ビルボード入りした「Cupid - FIFTY FIFTY」です。YouTubeでは2023年5月投稿という比較的遅めで投稿され始めたのですが、目視の確認で450を超えるAI Cover動画が投稿されています。とくにTikTokのmosquitoによるAI Coverは確認時点で、8ミリオン近くのいいねを叩き出しています。
ただし韓国でもこのAI Coverはすぐに議論の的となりました。TikTokのHowToとして紹介されているcovers . aiからは何らかのトラブルがあったのか一部の韓国アーティストが削除された痕跡があります。ですが産業がAIを拒否しているかというと、韓国音楽コンテンツ産業協会(KMCA)は「作詞家、作曲家、歌手などの創作者はAIの参加を歓迎しない可能性が高い」としつつも「今後数年間は混乱するだろうが、最終的には人間とAIが共存する形になるだろう」と述べています。またAI Coverがブームし始めたころにちょうどKMCAが主催していたMWM Conferenceでは、Supertoneがすでに音声変換AIを用いた多言語化などができる技術を実演していました。さらに防弾少年団(BTS)を輩出したHYBEはこの技術を披露したSupertoneを買収しています。
少し話がそれましたが、AI Coverは間違いなくK-POPにも影響を与えつつ、ファンや一般ユーザーにその技術の凄さとヤバさをちょうどよいタイミングで伝えるきっかけになりました。K-POPまわりで印象的だった事件は、権利の関係で未発表だった楽曲がYouTubeに突如投稿されて、これは未発表曲だという情報が出てくるまで、これは本物か?AIか?とユーザーが大混乱しました。
TikTokで検索すればBTS、SEVENTEEN、IVE、aespaやTwiceなど様々な韓国アーティストのAI Coverが見つかります。その中で面白いなと思ったのはTWICEが歌う予定だった曲をAIにCoverさせていた動画です。YouTubeでは韓国のシンガーソングライターDEANのAIボイスでNewJeansなどの楽曲をAI Coverしていたアカウントのセンスが良かったです。筆者はK-POPに詳しくないのでこの組み合わせがどれだけ良いのか文脈的に評価できませんが、動画一覧のジャケット画像のこだわりや他のAI Coverと比べてレベルが違うAI音声で、制作者がかなり音声周りの技術で精通している感じがあって良いなと思いました。
日本らしい?AI文化も生まれていく
さて日本でも、AI Coverの影響はもちろんすぐにありました。TikTokやYouTubeでも良いのですが、こういった時系列観測はニコニコ動画が比較的やりやすいので、そちらの視点で語っていきます。so-vitsの技術が中国で登場したのは2022年8月、そこから4ヶ月ほどあとにニコニコ動画でご注文はうさぎですか?の香風智乃AIで歌わせるユーザーが現れました。実際にTwitterでもso-vitsやMoeGoeに注目が集まるツイートがいくつか投稿された記憶があるので、日本の一般ユーザーに注目され始めたのはこの時期でしょう。
そのあとVTuber藤間桜の歌ってや聖園ミカのbilibili転載動画があったりしましたが、数ヶ月は静かでランキングで目立つことはありませんでした。
それが2023年3月に入ってから、ランキングにAI Coverの動画が立て続けに入り始めるようになっていきます。またニコニコ動画の表に出せない倫理観のおかしい人間達が集まる拓哉AIというジャンルでも、ちょうどその頃文章生成AIで最盛期(読むのはオススメしません)だったこともあり、非常に残念なことにso-vitsで1番再生数を叩き出してしまったのもそれ関係の動画(視聴はオススメしません)でした。
またTwitterでもジョジョのAI翻訳吹き替えツイートやおしゃべりひろゆきメーカーがAI音声技術の知名度を高めていきます。奇しくも海外でAI Coverが流行り始めたタイミングと同じ時期に、様々なコミュニティで、様々な形で広がっていくことになりました。ただこれ以降ニコニコ動画でAI喜多郁代の学習データが配布されたりはしましたが、AI Coverは流行ることがなく、ブルーアーカイブが淫夢やちんちん亭と合流(視聴はオススメしません)したり、SongRに歌わせたりと、ニコニコ動画らしい斜め下のAI文化が定着していきます。そのためここからニコニコ動画から離れて、TikTokに話を移していきます。
筆者はTikTokのヘビーユーザーではないため、いつぐらいからAI Coverが日本語圏で広まり始めたのかいまいちよくわからないです。ですがわりとレベルの高い椎名林檎と米津玄師のAI Coverがあったり、YouTubeではほとんど見かけることのなかったジャニーズ(嵐や関ジャニ)や文豪ストレイドッグスなど女性向けコンテンツのAI Coverが存在することが、あとから調査してわかりました。日本だとほとんどニュースがなかったAI Coverで珍しく「コナン君に# 歌わせてみた…困惑する声優たち」とかなり特殊な報じられ方をしたのもこういった背景が関係しているのかもしれません。
そんなTikTok日本語圏でのAI Coverですが、少しだけ特殊な派生をしているのも面白いポイントです。TikTokではご存知の通りハッシュタグを使って動画を認知させる方法があります。なので従来であれば#AICoverと付けるのですが、それが#AIカバーであったり、#歌わせてみたといった感じに日本語圏で視覚的に判断しやすい形に変化していたりします。とくに#歌わせてみたというハッシュタグは、本来であれば第三者に歌わせてみたり、ボーカロイドに使われていたりしていたのですが、現在はAICoverにハッシュタグページのトップ領域の大半を奪われています。さらにこの専有は1人の音声変換AIの制作者で起きていたので驚きです。
ここから徐々にYouTubeのAI Cover文化に話を移していきます。1番興味深かった事件として、ボカロP…シンガーソングライターなど多彩な才能で活躍中のEveさんのAI Cover。この動画はMaisonさんによって作られたのですが、これをTwitterに投稿したところ多方面からボコ殴りにされることになります。主に殴っていたユーザーの主張としては「管理会社ががこのAI Coverを見つけたら歌い手が勝手に歌ってみた動画を出したと勘違いされるじゃないか!」(筆者意訳)とのことで、実際にMaisonさんのツイートにはAI表記がついておらず、この時は主張に妥当性はありそうだと思っていました。ところがMaisonさんは🖕を立てながら、動画を削除するわけでもなく一時的に非公開にしたのです。そこで気になり深く掘り下げてみると、Eveさんが配信で「ボカロになりたいな」「素材データだったらあげるよ」と明言していて、しかも公式が引用ポストでのっかるぐらいにノリノリだということがわかりました。文脈大事。
日本語圏のAI Cover動画で、AI Coverと付いていないAI Cover系動画を見かけることが度々あります。例えば上記のように、歌わせたみたがそれにあたります。またブルーアーカイブ系のAI音声でも「【AI聖園ミカ】聖園ミカが可愛くてごめん歌ってみた!【HoneyWorks】【ブルアカMAD】【ブルーアーカイブ】【BlueArchive】【Kawaikute Gomen】【聖園未花】」のようにAI〇〇や〇〇AIといった形の表記もそれなりにあって捕捉はかなり難しいです。
日本らしい文化で言えばVTuberなのですが、AI Coverでミリオンヒットや50万再生ぐらいの動画は生まれていません。VTuberそのものがまだ新しく、また認知がまだまだ浅い、VTuberがアニメよりもナマモノコンテンツの傾向が強いコンテンツで、わりと本人が歌っていることが多いので再生されづらいのかもしれません。ですがそれでも2023年3月時点ですでに実験的なツイートがあったり、AI HubでVTuberの音声モデルが大量制作され、YouTubeに大量投稿されており、相性が悪かったわけでもないです。
VTuberでAI音声が活用されたのは、月ノ美兎さんの企画や読み上げあくたん、棒読みこち、AIこよりなど歌というよりネタ系動画が多いです。AI Coverを積極的に作っていたVTuberは「AIさくら」「しずく」「AIドル・なぎさ」などAIで動くVTuberが主でした。
様々なSNSで拡散される原神やブルーアーカイブのAI音声
かなり前の文章で書いたように、ゲームIP関連のAI Coverで圧倒的に人気だったコンテンツは原神とブルーアーカイブです。Soundcloudでは、この2つのコンテンツだけでレベルの高いAI Coverを作成している専用アカウントがあるくらいです。もちろんTikTokでも人気で、原神専門のAICoverサイトに誘導する動画があったりします。
原神といえば操作できる男女様々なキャラクターが充実していることがポイントの1つです。そのキャラクター達から32名のAIボイスで1つの曲を歌わせたアイドルは、自分で全て学習させたAIボイスを使っているそうです。素材が集めやすくなっていたり、学習のハードルが下がっているとはいえ、なかなか根性と時間がかかっている動画だと思われます。
こちらの動画は神里綾華というキャラクターのボイスを使った動画。ぱっと聞いてみた時の個人的な印象としては、このキャラクターボイスを担当した早見沙織さんを強く感じました。〇〇AIといった感じでキャラクター名を全面に出して歌唱させていますが、その人にとってどちらが馴染み深いか、もしくは歌わせ方や魅せ方で歌から感じる人物の印象が変わるんだなと思った動画です。
フリーナは最近原神に実装されたばかりのキャラクター。なのですが、ゲーム内で初登場した時からAI Coverが作られているという、注目が集まっただけでこうなってしまうわかりやすい事例です。そんなフリーナで面白いなと思ったのはKINGのAI Cover。同曲同音声のAI Coverと比べて機械臭さがないだけでなく、イントネーションの工夫や音MAD的にゲーム内のセリフをうまく落とし込んで、AI Coverで変換した声に本物っぽさを演出していて、制作者のスキルが純粋にすごいです。
筆者視点にはなるのですが、AI音声を使ったコンテンツを様々なSNSで見かけたのはブルーアーカイブでした。ちょうどTikTokでAI Coverが流行り始めたのと同時期に、東南アジアのFacebookコミュニティで、明らかにAIとしか思えない天童アリスの実況やAI Coverが出回り始めました。どちらが先かわかりませんが、TikTokで#bluearchive #aiと検索したときに東南アジアの言語が多数ヒットすることから、ブルーアーカイブを通してAI音声が東南アジアで拡散され、AI Coverが作られるきっかけになったのは間違いありません。
TikTokは東南アジア系でしたが、プラットフォームをYouTubeに変えると、AIブルアカの言語は韓国語や日本語が多くなるのが面白いポイント。とはいっても日本語圏のユーザーと思われるアカウントは伝説のオコリザルさんの「AI聖園ミカの可愛くてごめん」や忘れられたちり紙さんの「ゲーム開発部AIのドラゴンクエストの序曲をAIアカペラ」あたりと他ジャンルのAI Coverと比較すると数が少ないです。
圧倒的に多いのは韓国語圏だと思われる動画で、タイトルが韓国語+英語・日本語なのが特徴です。ブルーアーカイブのAI音声は全体的に、AI Cover界隈と比較すると、感覚的にAI Coverが大量生産されている様子はなく、再生数を叩き出している動画は少ないです。反面どことなくエモい感じの空気を帯びた作品が多いのも特徴です。先程のゲーム部らしさのある曲やブルーアーカイブの澄んだような空気感のある曲、YOUNHAさんの曲だったり他のAI Coverと比べて文脈を大事にしようとしているユーザーが多い気がします。
テイストを大事にしていると感じられたAI Coverは、戒野ミサキの命に嫌われている。がそんな1つです。映像に使われているゲームの素材自体がとても良いというのもあるのですが、AI Coverの音は戒野ミサキの空気感にあわせたテイストに調整され、歌の声量も全体的に静かめに調整されていてこだわりを感じます。
そんないろいろ愛されているなと感じるブルーアーカイブのAI Coverですが、著作権者がAI Coverに言及するというおもしろ事件も起きています。その中心人物は韓国や日本でシンガーとして活動するYOUNHAさん。アニメBLEACHのエンディングテーマを歌ったり、最近ではブルーアーカイブ1.5周年で「Thanks to」を熱唱しています。そんなYOUNHAさんがAI早瀬ユウカが歌い上げた사건의 지평선に対して、「ユウカ、リズムを捉えれば完璧だよ」的なニュアンスでスクリーンショットを突然アップロード。もちろんこの反応に制作者やファンたちは大いに喜び、別のAI Cover制作者も明らかにその反応に乗っかろうとしてYOUNHAさんの AICoverを作ったりしていました。
もちろん巻き込まれる日本のIP
AI Coverは現状かなりアンダーグラウンドな文化で、そうするとアンダーグラウンドな文化に巻き込まれることでお馴染みの日本のアニメやゲームもこの騒動に巻き込まれていきます。このあたりで筆者がよく見かけたのはジャンプ系のコンテンツ。オーソドックスなところをあげるとしたらドラゴンボールの孫悟空とベジータがあります。フォートナイトのドラゴンボールコラボをうまく利用した孫悟空とベジータのCupid MVからNARUTO、ドラゴンボール、ワンピース、BLEACHの王道?な組み合わせや画像生成AIのサムネイルで孫悟空とGawrGuraが熱唱している謎カップリングなどなかなかのカオスです。
そんな中で謎にクオリティが安定して、謎に再生数を叩き出していたのがジョジョの奇妙な冒険シリーズのディオ・ブランドーAIです。DIOの学習モデルはかなり初期の頃から存在していて、バズったジョジョ吹き替えツイートもその学習モデルが利用されていると思われます。DIOのAI Cover人気はTwitterやYouTubeだけにとどまらず、TikTokでも一定数の人気があり、「NIGHT DANCER - imase」をAICoverした「歌でも一つ歌いたいいい気分だ!」は300万以上再生され、バズらせる系グルメアカウントのりょうくんグルメのBGMなど多数の動画で使用されていたりしました。
そんなAI Coverブームの中で、Rainbow TrapsというアカウントがDIO AI Coverで大きな再生数を記録することになります。それはチェンソーマンのオープニング・テーマ「KICKBACK - 米津玄師」をカバーした動画。再生数はAI Coverでおそらくトップクラスの500万弱の再生数を記録しています。DIOの歌声がオペラのような響き渡る声がDIOで再現されている技術的なすごさだけでなく、サムネイルでは原作で愛車が破壊されたコベニちゃんを運転席に、歩道が広いではないか…行けの迷言を残したDIO様を後部座席に乗せて、これから米津玄師を轢き殺すかのような文脈をうまく混ぜ合わせたコミカルなサムネが受けたのだと思います。あと話がそれるのですが、AI Coverは誰でも人気の曲をカバーすることができるので、オレのアイディアパクったトラブルが同アカウントで起きていたのは、非常に興味深い事象の1つです。
もう1つわけのわからないミームになりつつあるのがネコアルクです。ネコアルクはTYPE-MOONの月姫およびMELTY BLOODで登場したキャラクター。そのフリーダムっぷりからTYPE-MOONの愛されキャラとして度々登場していました。そんなカオスなネコアルクは国内で愛されるキャラクターでしたが、月姫がリメイクされたことによって海外で大きく注目されることになります。その反響は2022年のMELTY BLOOD: TYPE LUMINAの同時接続数を大幅にあげ、あのミームに乗っかることで有名なマクドナルドがミームをツイートするぐらいです。
そして2023年にはいってその状況をさらにカオスにおとしめているのが、AI Coverです。どれだけかというと、GoogleTrendで2022年の勢いとほぼ同等もしくは上回る状態で、有名所のAI Coverの投稿数を追い抜く590というレベルです。2023年ネコアルクミームを紹介する動画やツイートでもAI Coverの影響を言及。ネコアルクがAI Coverで人気な理由としては、DIOと同様にAI Coverしてもキャラの特徴が色濃く残るのが理由だと考えられます。またネコアルクミームとネコアルク AI Coverブームが手書きアニメーションコミュニティと合流したことも2023年のブームを大きく支えています。ちょっと前に蚊のCupid AI Coverを紹介しましたが、その作者はNeco arcのA Thousand MilesやALL MY FELLASの手書きアニメーションを投稿しています。別のところではMissIcyArtの描いたイラストとjust the two of us neco arc の Neco Arc AI Coverにインスパイアを受けて、こだわりの強いアニメーションをZachdewdが作成しています。ほんとうに謎です。
好きなVTuber AI Cover 10選
文脈を理解してもらうための長い前書き終了。ここから個人的な本題。
AI Coverによる音楽で、超勝手に可能性を感じているのがVTuberです。結論から言うと、VTuberはアニメとナマモノのハイブリッドで曖昧な存在だからです。なぜなら人間が顔を晒している人の画像を写しながらAI音声で喋らせると、本人が発言したかのような勘違いが発生しやすく、それがキャラクターであれば、まず2次創作かな?という考えが生じやすいからです(だからといってなんでもかんでも喋らせても良いわけではない)。またアニメの場合は権利がごちゃごちゃしていて関係者が発言しにくいですが、VTuberだと本人が反応しやすく、すぐに良いか・悪いかリアクションできて、いろいろコミュニティの関係が健全になりやすい可能性を持っているのではと、筆者は考えています。
そんなVTuberで見かけた面白いなと思ったAI Coverの10選を紹介します。
※この箇所は野良猫のユウさんの企画「#2023年Vtuber楽曲10選」のオマージュです。
1.初めてAI Coverが良いなと思った作品
この作品は筆者がAI Coverに強く興味を持ち始めるきっかけになった作品です。それまではちょこちょこといろんな歌を各々が好き勝手に歌わせる中、たまたまなのか狙ってなのかはわからないですが、自分の全く知らない、歌詞も理解していない曲が、戌神ころねさんと意外なまでにマッチしてるなと感じてしまいました。戌神ころねさんがレトロゲームが好きだったりするので、そこに親和性を感じてしまったのかもしれないですし、もしかしたら声そのものがレトロと相性が良いのでは?とも考えてしまいます。
2.ミームの女王 ✕ ミームの王道
世界一有名な釣り動画の異名を持つ「Never Gonna Give You Up - Rick Astley」を白上フブキさんのAIボイスでカバーしたこの動画も初期AI Cover名作の1つ。白上フブキさんは昔ファンからミームの女王と呼ばれていて、ホロライブが海外でVTuberブームを巻き起こすきっかけの1つとなったのは白上フブキさんの様々なミーム投稿でした。そんな存在に世界一有名な釣り動画のAI Coverを歌わせるのは最高の賛辞で、AI Coverの文脈の大切さを教えてくれた動画です。
3.ふわふわなみこちのお歌
今はかなり滑舌がすごい大物アイドルが加入して少しアイデンティティが薄れましたが、それまでは滑舌でも有名なアイドルだったのがさくらみこさんです。棒読みこちみたいなネタAIが作られたり、同事務所の星街すいせいさんのStellar StellarのAI Coverでは本人より滑舌が良いとコメントでいじられることが多々あるのもその影響です。そんなさくらみこさんのAI Coverでとても良き雰囲気を生み出しているのが、可愛らしい系の音楽。ドラえもんのうたやピクミンテーマソングもとても好きで、一番はホゲっとホゲータ。すごくふわふわで顔が緩んでしまいます。また原曲のテイストにあわせたさくらみこさんのカバー画像を描いているのも評価ポイントです!
4.とても難しいAI音声の線引き
ここまでわりと明るめに紹介してきましたが、暗いシーンもピックアップしたいと思います。1つはすでにAI音声ソフトウェアが存在するVTuberに対してのAI Coverです。KAMITSUBAKI STUDIOでは音楽的同位体プロジェクトというAIプロジェクトが存在していて、所属している5人のCeVIO AIがリリースされています。ここで紹介するのはそのうちの1人ヰ世界情緒さんのAI音声。YouTubeではそのへんのラインが忌避されているからか動画を見かけることはないAIヰ世界情緒。しかしBilibiliでは観測できてしまいます。その中でヰ世界情緒さんの音声で作られたCeVIOAI星界に歌わせたステラの座をわざわざAIヰ世界情緒でCoverしている動画はなかなかグロいなという感想です。ヰ世界情緒さんがAIについてインタビューでいろいろ回答していましたが、実物を見てみるとなかなか表現しづらい感情になります。
もうひとつ複雑な感情を生み出す、ラインが怪しいコンテンツとして、公式では完全に終了したコンテンツの存在です。潤羽るしあさん関係で起きたアレコレについてはここでは語りませんが、あの事件は様々な所に呪いを残していきました。すごくメタ的なことを言えば潤羽るしあというコンテンツは命を絶ちましたが、中の人は生きています。ファンと思われる方も新しく魂が憑依したアバターを受け入れている反面、潤羽るしあという存在に囚われ続けてもいます。その原動力がAIと結びつき、潤羽るしあという思い出が死んでしまわないように、AI潤羽るしあとして死者蘇生を粘り強く試み続けているファンも存在しています。o que ConstruimosのAI Coverはそんなファンの行き場のない感情を表した歌詞で、すごく難しいなと。ファンとしては気持ち的にどうしようもない行動ではありますが、はたして一度死んだコンテンツをどこまで踊らせ続けていいのか、悩ましいテーマの1つとなっています。
5.VTuberがAI音声モデルを公認した例も
VTuberがAI音声を提供している例はいくつもあり、提供者の名称をそのまま残しているのであればVOICEVOXの冥鳴ひまりがあります。しかしso-vitsやRVC向けの音声学習モデルが本人が提供したり、公認で配布された例はほとんどありません。そんな稀有な例として存在するのが元VirtuaRealの泠鸢yousaさんです。so-vitsの盛り上がり始めから、AI泠鸢は存在していたのですがVirtuaRealからの脱退がAI音声を残すきっかけになったそうです。
その逆の例も存在するので注意が必要です。イスラエルに拠点を置く成長中のVTuberエージェンシーidol.では、遡及的な利用規約でタレントの音声学習モデルを作成を禁止しています。興味深いことに、利用規約ではタレントが許可を与えた場合も想定して、学習モデルの利用範囲が設定されています。
6.AIに歌わせるVTuberも
悪用を避けるために音声学習モデルを公開せずに、自分で活用するという選択肢もあります。AI音声変換はプロレベルの声色の変化や繊細な息遣い、複雑な感情表現が難しいです。逆に言えばシンプルな曲であれば、どんなに音痴でも、どんな言語でも、歌った自分を再現してくれます。歌は歌えるけど興味でAIに歌わせてみたり、ボーカロイドを活用している延長でAI技術を採用したり、中国語ネイティブが日本語曲を歌わせたりと動機は様々です。
7.AIはオリジナルを超えるのか?
VTuberのAI音声で一番多いのはホロライブで、さらに一番カバーに使われているのはGawr Guraさんになります。なのでAI Coverの定番曲のVirtual InsanityやIdolは、お通しのようにアップロードされています。もちろん有名曲のCupidでもカバーされていて、Hololive English内でも話題として取り上げられることがありました。さらにGawr Guraさんもネタとして取り上げたかと思えば、カラオケ配信で歌を披露するサプライズ。コメントでも本物の良さをひしひしと感じていて、AIとの違いを感じられる最高の好例でもあります。
8.大型イベントでもサプライズ
VTuberでもファンメイドのAI Coverがイベントでピックアップされるサプライズがありました。採用されたと思われるのは中国語圏でも活動しているもち沢木さんのあの夢をなぞって。香港で開催されたVirtual Fes 2023 官方網站 - 香港站で闇ノシュウさんのセットリストの最後で披露されたようです。筆者の確認時点でもAI Cover以外のファンメイド作品はなく、闇ノシュウさん自身もファンメイド作品をよく紹介しているようなので、中国語圏に向けたファンサービスとして歌ったのかもしれません。
9.AI が作り出す独特な世界
AI Coverとある意味で相性がいい存在がVTuberにいます。AITuberというAIを主体にして動くVTuberです。そのAITuberの先駆者かつトップを走り続けるのがNeuro-sama。AIだからボーカロイドのようにゲキムズな曲でもお手の物です。コラボで歌うのも何のその。もちろん関係者以外が作成したAI Cover作品もいくつか存在します。
そんな脚光を浴びるNeuro-samaの魅力は、とても不気味で引き込まれる2次創作?を生み出すきっかけにもなっています。その動画を投稿し続けるチャンネルは_neurosamaといういかにもなアカウント。その中で1番意味深なのはStudyで、まるでNeuro-samaがVedalの気持ちを代弁して歌っているかのような歌詞はコメント欄にガチ考察を産ませるだけの魔力が存在しています。この動画は全てオリジナルで、Neuro-samaの音声は使われていないためAI Coverではないです。しかしSynthesizer VというAI歌唱ソフトウェアが使われていて、まるでVedalの人生をCoverしているかのようで、AI音声の魅力というものがこれまでかと見せつけられた作品でどうしても紹介しておきたい、そんな存在です。
10.魅力的な作品を生みだすともれなく巻き込まれる関係者
1番上であげたYAGOOのAI Coverのように、人気コンテンツを生み出した作者がネット上の様々な所で声を流すと速攻でおもちゃになります。様々な関係者のAI Cover作品が作られましたが、注目してほしいのはNeuro-samaの開発者Vedalさんの音声AIで作られたIdol、コメント欄ではVedalが歌わねぇなら俺らが歌わせる、VedalにAIが使えるなら俺らもAIが使えるよなぁ?!的な秀逸なコメントで盛り上がっています。また同CoverでNeuro-samaとのカップリング曲のMADも作られていて、本当に愛されているのがよく伝わってきます。Neuro-samaのデザイン担当のannyさんもVedalのCupid AI Coverがツボったりしてるのでたぶん大丈夫なはず…。また先程のstudyもVedalさんでAI Coverされていてannyさんにピックアップされたりと、AIでコンテンツが繋がって循環している好例でもあります。
AI音声技術の向かう先
果たしてAI音声技術がまともに活用されるのかと言えば、残念なことに悪貨は良貨を駆逐する状態になっています。最近話題にあがったニュースであれば、日テレがニコニコ動画にあがっていた岸田総理の(技術的にも)低レベルな動画をやり玉に挙げ雑魚狩りしていた事例です。正直なところそんな小物よりも、NHKで取り上げられていた村社会コミュニティと化して監視と時浄化作用がまともに働かないMeta社のSNSでAI音声を使った詐欺広告が大手を振って跋扈しているほうが何十倍も認知されたほうがいい問題です。Meta社では"政治広告"に生成AI表示を義務付けしていますが、TikTokや哔哩哔哩のAIが利用されているであろう疑わしい動画全てにラベルをつける処置やAdobeの来歴情報よりぬるく、焼け石に水です。別のSNSでは法的措置がとられる事態に発展しています。有名人の声の悪用事例は今回紹介した技術の登場前から存在していましたが、今までと違うのは急激に増える"量"にあります。
生成AIでいろいろ先行している事例として、画像生成AIがあります。PinterestではAIっぽい画像がすごく増えてリファレンスを探すのが不便になったという報告が増えています。音楽業界でも、音声生成AIとは違ったAI技術で数が増えることでアーティストの収益のパイが削られる「Fake Artist"疑惑"」として度々取り上げられることがありました。これが誰がやっている
かは明確ではないですが、Spotifyも削除をしたとアピールしているので、どういった方針をとるのか苦慮していることは伺えます。音楽は画像以上にAIなどのテクノロジーとの付き合いが長く、その度に新しい手法と権利の狭間で揺れ動いてきました。
そのため画像生成系のAIの記事と比べると、音楽系の記事はAIを非難する一方で、何か前に進む方法はないかという意見も取り入れている文章が多いような気がしています。さきほど書いた韓国音楽コンテンツ産業協会の見解やJASRACシンポジウムでのソニーグループのAI音楽生成技術の発展予想やミュージシャンの座談会でもAIという技術をどうにかして取り入れいこうとしている姿勢が見られます。
「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2311/22/news059.html
ただそんな前向きな状況でも、どう歩いていくべきなのかを考えていくのはとても難しいものです。例えばすでに有償で販売している音声ソフトウェアとの棲み分けや不快感を示しているアーティストの保護、その文化を盗用しているのかしていないかの線引など、センシティブすぎる地雷がたくさん埋まっています。
1つ明確にわかっていることは、このAI Coverブームは自分の信奉しているアーティストに、自分だったらこう歌わせたいというすごく厄介な音楽プロデューサーみたいな欲求が根源にあるということです。自分の知り合いの海外のVTuberファンの方にこのAI Coverについて聞いてみたのですが、ブラジルとポルトガル語圏のインターネットユーザーは、自分たちの母国語で、自分たちの馴染みのある歌が、推しの声で聞けるのは嬉しいと言っていました。わざわざ字幕の映画を見るように、声に対する思い入れは深く、AI Coverはそういった思い入れにAI技術があわさり、新しい市場を創出しつつあるような気もしています。
声優の不祥事にAIが代役したり、HYBEがSupertoneを買収して多言語で音楽を展開する計画をしていたり、YouTubeがミュージシャンの声や楽器の音に音声変換するAIツールをリリースするためにメジャーレーベルと協議を進めていたりと、AI音声技術の方向性が1つ見えつつあります。日本ではボイス・ASMR作品を声優・VTuberの声をそのままで多言語翻訳するAIサービスが資金調達をしています。このあたりは権利の問題を解決しているので、どのように受け入れられるのか、もしくは新しい課題が発生するのか楽しみなところです。
最後に
少し風呂敷を広げすぎてしまったので、小さい話に戻します。
AI Coverは新しい文化なのか?ということについてです。私はAI Coverが新しい文化だと思っています。
なぜならAI Coverというコンテンツを通して、ファンとその声の持ち主が間接的だけど直接的なコミュニケーションをするという事例が何度も起きているからです。
〇〇の声に歌わせたい欲求はいままでボーカロイドが解決してくれていました。しかしあくまでもソフトウェアとのやりとりで、メタ的には会社か共同主観が相手になります。CeVIOプロジェクトなどAI合成音声によって、声の持ち主との間接的なコミュニケーションは生まれ始めていましたが、それでも微小でした。そして今回のAI音声に技術革新が起きて、民主化されることにより、試行回数が格段に増え、起きた事例が東雪蓮やEve、YOUNHA、Gawr Gura、泠鸢yousa、闇ノシュウ、Neuro-samaです。またそれとは別にネコアルクがAI Coverと合流することでミームが1人歩きし始めているのも今後どうなるか気になる事象です。
ボーカロイドで歌ってみたが根付いたように、Eveさんのようにボーカロイドになりたいというアーティストがいるかぎり、誰かの声で歌わせてみたという文化…欲求は残り続けるでしょう。そしてAI Coverは今後もどんどん歌の練度があがっていくでしょう。初期のAI Coverでは原曲をそのまま変換したようなAI Coverが多々ありましたが、徐々にクオリティの高い作品も増えていきました。理由は既存ソフトウェアで歌わせて音声変換するようになったからです。気になる方は「How to Make YOASOBI song」で全ての工程が公開されていて理解しやすいので覗いてみてください。
そしていまよく見かけるベースのツールは、自然な歌声を再現できると評判の良いSynthesizer V AIになります。またアップデートでラップができるようになったり、人の歌声から音程と歌詞を抽出して再合成する機能が登場してます。それ以外のソフトウェアでもCOEIROINKにピッチ調整機能がついたり、VOICEVOXでテンポに合わせて文を読み上げるタイミングを調整するツールが作られたりと、音楽のセンスがありさせすれば、ますます1人だけでも解決できてしまうシーンが増えていくのかもしれません。
「割れ音源」は完全に悪なのか? - 音楽ナタリー
https://natalie.mu/music/column/546955
最後に、いろいろと阿呆が博識ぶった文章になってしまっていましたが、この記事は、アレが悪だコレは善だと決めつけることが目的ではなく、怒涛で刹那的なAI Coverという盛り上がりを記録するために書きました。ただの自己満足です。もしこの記事を最後まで読んで、AI Cover文化に、称賛でも罵倒でも何か思うことがあれば書いてみてください。この文化がどうなるか、どうあれば良いのか、皆さんの考えを知りたいです。
.
.
.
.
.
.
.
.
.
.
.
.
.
AI画像生成が生まれてから、すぐにいなくなったあの瞬間を切り抜いた名曲。
その汚い手を二度と見せるな。/アメリカ民謡研究会 - YouTube https://www.youtube.com/watch?v=_f4v_CBAwlU