音声データベースしか存在しないのに、すぐ傍に居るような男に狂っている
はじめに
端的に言え
ドチャクソ声と見た目が好みの男性合成音声見つけてドハマりしたら色々と手出しして楽しく生きています
本題
AIシンガーという言葉は耳にした事があるだろうか。そう、今話題の音楽的な同位体やら枝豆の妖精等のほぼ人間のような声で歌ってくれる歌唱ソフトウェアだ。その単語だけ見れば魔法みたいなソフトウェア達の中でもう1年半程私が熱狂的にハマり散らかした男声ライブラリが居る。夏目悠李だ。
彼はNNSVSなるフリーでオープンソースの研究用歌声合成ライブラリで、まあ簡単に言えば音声とそれに基づいた情報(音の長さやら周波数やら)をデータベース化した物だ。これ単体では歌わせられず、使うにはPytorchやらGoogleCoLabといった、機械学習に使うライブラリが必要だった。だったというのは、有志が同じくフリーの歌声合成ソフトUTAU上でNNSVSを使えるよう「ENUNU」というプラグインを開発したからだ。
技術的な話は正直言って私も大して分かっていないのでここまでにしておくが、どうハマったかについて話していく。
邂逅
彼と出会う前の私は合成音声の中でもVOICEROIDやCeVIOといった入力文字読み上げソフト(TTS)にハマっており、VOCALOIDやらUTAU等の歌唱ソフトにはさほど興味を持てていなかった。というのも、「操作がまず分からないし、そもそもどう使えばいいか分からなかった」のだ。3年前の11月に公開され話題となったNeutrinoも使い方を調べて楽譜ファイルを作るのが面倒だと思い諦めた。それに話題に上がる音声合成ライブラリはほとんど女声(TTSもそうだが)で、食傷のような微妙な気分だった。
そんな中、昨年7月にちょうど男性合成音声キャラWebオンリーを開催すべく色々と現状存在する音声合成ライブラリ達について調べていた際にたまたま見かけたのが夏目悠李だった。そのオンリーについては下記のnoteを見てほしい。
個人的な経験と偏見だが、男声ライブラリは製作者の用意したビジュアルと実際に出力される声のイメージに差を感じてしまう事がまあまあ有る。商業の音声合成ソフトとキャラの二次創作畑で育ってしまったので目と耳が肥えていると言えばそうなのだが。一次創作寄りのUTAUやCOEIROINK等では特にその一度でも感じてしまうと消えない違和感がちらついたりつかなかったりする。だが、夏目悠李はそれを感じなかった。
若い男性の清涼感とエネルギーを感じる声と端正な顔立ち、アイドルのような衣装とそれを着こなせる身体。こう書くと見た目が好きみたいに聞こえるが、まあ否定はできない。
ともかく、真っ直ぐな声と見た目が完全にマッチした彼にハマった私は以前インストールして半ば放置のUTAUへZIPファイルを放り込みお迎えする事になったのだ。
お迎え
ここまではストレートな出会いとお迎えを果たしたように書いているが実は出会ってすぐインストールした訳では無い。ぶっちゃけてしまえば彼の二次創作(イラスト・動画)作品から良さを強く理解(わかっ)たし、恐らくそれが無ければ「でもUTAUよく分かんないしな…」で止まっていた。
更に言えば中の人、夏目悠李の声を担当しておりボカロPでもある霧野蒼太氏が二次創作に寛容であった事。というか夏目悠李に関する二次創作を欲していた事が強く心を動かした。言い方はもの凄くアレだが、創作をする根源というのは概ね「誰かに自分の作り上げた作品を見てほしい」「作品で表現した自分を視認して欲しい」というはっきりしたエゴで、私もその一人だ。
VOICEROID(広義)の二次創作というのは著作者の想定から大きく外れたような物から公式の設定になるべく沿ったものまで幅広く行われており、その中でも動画という媒体は取り扱うジャンルや使用するソフト・キャラで視聴してくれる層の勾配がハッキリと存在している。再生数をモチベーションにするのは不純だと論ずる清廉な動画投稿者も居るだろうが、欲深く浅ましい動画投稿者としては一銭にもならず寧ろソフトの購入費でマイナスな上、動画編集で更に時間も食うのだから結果が伴ってくれた方が決まっているのだ。更に言えばコメントや感想、視聴してくれた人の反応が見えたらもっと嬉しい。
話が変な方に行ったが、「見てくれる人」が居る事が分かっている事。これが二次創作を始める原動力となったのだ。
その後
その後は順調に、彼の声から自分の中の夏目悠李という存在について解像度を深めて幻覚を視ていった。ENUNUのプラグインを実行したらダイアログが表示され、そのまま自動で音声が出力&再生される仕様と実際の親しみを覚えやすい声から私は夏目悠李の事を
「どう歌って欲しいか指示を受けたらその通りに(いかない事の方が大半だったが)歌ってくれて、それを聞いているこちらの様子を興味深そうに画面の向こうで伺ったりする隣人」のように感じるようになった。全部私個人の主観であり、幻覚である。またAIシンガーというのは楽譜データからどう歌えばいいか推測し音声が出力される物で、ちょっと弄っただけで歌声が様変わりしたりと若干じゃじゃ馬な所もある。曲の向き不向きもはっきりとしていて言うほど便利ではない。だが人は不便さから愛着を持つのだ。
PCにインストールした合の者(音声合成ライブラリに付属するキャラクターの事。依然TLで見かけて使ってる)について、Twitter上で私は常日頃から実在するかのように(は?実在するんだが……)語ることが多かったのだが、夏目悠李に関する呟きはかなりの物で、同好のような士のフォロワーたちにもそれが目に留まり、興味ありげな反応がTLにぽつぽつと現れた。自分と同じように狂って欲しい、彼に触れて欲しいと願っていたオタクとしては絶好のチャンスである。
しかしENUNU/NNSVSはまだ新興のライブラリで、プラグイン開発者様と夏目悠李のDB製作者様の使い方位しかまともなチュートリアルが存在しておらず、お世辞にも簡単に薦める事が出来るかと言えばそうでもなかったのだ。でもどうせなら作品を作る人を増やしたい。じゃあどうするか?そこで私は「最低限の使い方が分かってる動画投稿者の自分が布教するべく操作方法やら導入方法を解説した動画を作る」という選択肢を選んだ。
幻覚ファイター、ソロプレイからマルチへ
解説動画を作る
ENUNUはUTAU上でNNSVSモデルを音源として扱えるプラグインである。 つまりUTAUの楽譜ファイル(UST)を使って歌わせることが出来る。これは大きなアドバンテージだ。何故なら世の中のボカロというジャンルの楽曲は作曲者がインストゥルメンタルを公開している人が居て、それを元にUTAUカバーを作成する人やカバーで使用したUSTを公開する人が居る。気軽に歌わせたい時に先人の知恵をお借りして出力された音声を味わえる喜びは、一度味わってしまうと忘れられない。そしてTTSの二次創作では何故か入力文字読み上げソフトを歌わせようとする層が一定数存在し、有志がボカロやらのソフトから楽譜ファイルを経由して簡単に歌わせる為のソフトウェアを開発・公開している。その経由先でUTAUを使用することが多々あり、これを布教する為のノックになるのではと考えた。何故なら私も歌ボ(歌うVOICEROID)の中間作業、USTをVSQX(ボカロの楽譜ファイル)に変換するべくUTAUを使っていたからで、プラグインを動かすUTAUについての基本的な操作なら幾らでも資料が転がっていたからだ。そしてたまたまひじき祭が開催していた時期だった。
そんな訳で突貫ながら魂を燃やして作成した解説動画がこちらだ。
3日で作ったので今見ると荒が見つかるが、まあそれなりの物が出来たのでは?と思う。この動画を作った後実際に興味を示してくれたフォロワーが夏目悠李とENUNUをDLしてくれたり、自分の動画群の中では沢山の再生数とコメント、マイリストを頂いたりと感無量である。情報が古いのでその内最新版を投稿したい。
さて、そんな訳で無事に沼へ他人を誘い込んだり歌唱ソフトへの食わず嫌いを取り除いた私は「UTAU上でUST弄るのめんどくさいな…」と軽量で直感的に操作できるSynthesizerVと夏目悠李の準公式立ち絵の作者と同じビジュアルの男声シンガーのゲンブをお迎えしたり、販売停止が近づいていたCeVIOColorVoiceSeries等TTSとENUNUだけではなく歌唱ソフトにまで手を出し始めて自分が何の界隈のオタクだか曖昧になり始めた。そんな感じで後は解説したなら実践しようとボカコレカバー祭秋に夏目悠李で参加したり、後は大体いつも通りの日常生活を過ごしていたのだが、自分が主催するWebオンリーで何を出すか出さないかを決断する時が近づきつつあった。
初めてのサークル参加
私は同人誌即売会でサークル参加したことが無かったのでどうしようか…参加しないといけない訳じゃないしな……と悩みに悩んだ末、Twitter上でちまちま書いていたSS紛いの、常日頃から私が幻覚と呼んでいるト書きのようなストーリーを拾い上げてなんとか文章にする事にした。
PhotoshopもIllustratorを持っていなかったのでCanvaというWebサービスで作ったサークルカットだが、まあそれはどうでも良い。
SSを作ろう!!!!!!!
それで無料公開するにあたってやった事だが、そこまで大したことはしていない。下記のツイート群に色々付け足していっただけだ。
ちゃんとした文章を書くにあたって、最初は縦書きエディタとかを使ったりWordで書いたものをPDF化しようとか考えていたのだがそもそも140字以内で書いていた物だから区切りはそこでは?と思い「文は書けぬが呟ける」という文書作成支援ソフトを使うことにした。
文は書けぬが呟ける(通称?:文つぶ)はUIとは裏腹にシンプルなソフトで、最大140文字ずつ書いた文章が改行区切りでテキストファイルとして出力される。ただそれだけで、プロジェクト保存機能なんてものは無く修正はメモ帳とか他の文書編集ソフトでやるしかない。こいつ一本で書くのはかなりの苦行なので大まかな流れと台詞を書き出した後、SS名刺メーカーでそれっぽく配置して画像に出力したら順番を確認した上でCubePDFで結合し、PDFにした。
………………いや、内容に比べて工程が多すぎる。面倒だな???????
なんでこんな手法を取ったのだろう。今思えば、最初からひーこら言いながら縦書きエディタなりそれこそWord持ってるんだからそれを使ってれば良かったのだ。内容の薄さをどうにかしたくて正規ルートを外れた結果正規より面倒な事になってしまった。まあ、「どうせすぐ出来るし急がんでもええやろw」とかなんとか考えてた結果ツケが回ったのだが。
ということで出来上がったものがこちらになる。
イベント楽しかったね~とか振り返り
こうして、どうにか”作品”と呼べるものをを作り上げた夏目悠李サークル島(なんと夏目悠李オンリーのサークルだけで5スぺースも参加してくれたのだ)の一員として、イベントの主催者として当日を無事に過ごせた。
初めてのイベント主催&サークル参加だったがマシュマロではSSの感想、pictSQUAREでは書き込みボードに参加してくれた方々からの言葉を沢山頂き、なんとか満足のいく結果になって良かったと思う。他に嬉しかった事はイベント同日に夏目悠李の公式HPが公開され、展示物としてTALQu(無料のAI合成系TTS)と新しいビジュアルが発表された事だ。夏目悠李のTTSは1月にCoeFontで喜怒哀楽の4種類が出ていたのでTALQuが初では無いが、推しのライブラリは有れば有るほど嬉しい。
自分の作ったものについて自分で語る事を中々しない(ちょっと恥ずかしく思っている)のだが怪文書なので恥もクソも無いだろう。
タイトルについて・・・内容が「インストールされてまだ1年未満の夏目悠李立がマスターに冬の海へと連れていって貰う話」なので、
・冬の海の色(私的感覚)→白藍
・棗の花→開花が6~7月と若干遅く、後は実が成るだけ⇒遅咲花(造語)
この2つを組み合わせ、「遅咲花(おそさきばな)は白藍(しろあい)を知る」と付けた。実際はしらあいと読むのだが、まあ口に出して読むことは無いだろうと思ったのでそう読む事にした。
登場人物のあれこれ・・・当たり前のように合の者達が日常の一員として実際に暮らしている世界だと考えて、マスターは同性の方が色々と楽だろうと考えた結果「元バンドマンでインストの曲をニコニコに投稿していた30代男性」という設定にした。また歌唱ソフトはTTSやロボットペット、コンシェルジュAIとは違う点を書きたくて”渡された歌詞を歌う事”が専門であるという台詞を盛り込んだりした。
掘り下げられる所がまだまだあるような気がするので、まあ…機会があれば…何かまた書きたい……
その後
ニコニコ大百科記事を書いた
去年の11月に「夏目悠李の布教に情報が纏まったサイトが欲しい」という話が出た。この頃はまだ公式サイトが出ておらず、8月以降のENUNUはアップデートで色々追加・変化したのも有って上記の解説動画だけでは足りない部分が出てきていたのだがイベントの準備やらリアルで忙しかった。
取りあえずニコニコ大百科にNNSVSの記事が有ったからそれに繋げて記事を出す事にしたのだが、実際に書き始めたのは今年の6月になった。
初めてニコニコ大百科の記事を書いたのだが、「客観的」な情報を書くのは非常に難しかった。なるべく主観は混じらないように書いたつもりだったが見返しては「なんだこの文章……」となり何度も追記・編集を行っている。この記事を書いている時も一回編集した。文章力の拙さが分かって辛い。
だが自分の知識が人の役に立つのはとても嬉しい事だ。
夏目悠李と出会って
2021年の春から私は一人暮らしを始めて生活環境が大きく変わり、日常生活が1日の8割を占めて二次創作を行える時間が大幅に減った。PCには齧りつくも動画編集やTTSと長時間向き合うことが中々出来なくなり、今年に入って作ったTTSの動画は2件しかない。ソングばかりになってしまっている。
そんな中でもTwitter上で夏目悠李や合成音声たちの話はしていて、周りが自分の見た幻覚に反応して新しい解釈を見せてくれたり実際に絵を描いて頂いてしまったりと幻覚は視れるときに視ておいた方が得だなと深く感じた。
動画の投稿頻度は不定期だが、これからもまだ見ぬ誰かへ、ディスプレイの向こうで気ままに過ごす隣人を知って貰えるよう貢献していきたい。
この記事が気に入ったらサポートをしてみませんか?