声縛祭にCeVIOボイパロイドで参加した話
こんにちは!いぬいぬです!
この記事は「CeVIO Advent Calendar 2022」の参加記事です!
「声縛祭」
声縛祭という「マイナーな合成音声」にフォーカスした投稿イベントがやっていたので、参加してみました。
CeVIO AIトークのロサちゃんでボイパロイドさせる…
ボカロでもないし、ソングでもない!
うーん、アバンギャルド!
いや最初は販売終了したCeVIO CSのColor Voice Seriesで出そうと思ってたんですけど、ちょうどロサちゃんの1周年でもあったので。。。
カラボカバーはまたね…。
ボイパロイドって難しい…
ノウハウがあるわけでも、情報があるわけでもないからいや~大変でした。歌わせるのとはぜんぜん違う…。
パートが少ないほうがいい
実は、あの動画夕方まで作ってた別の曲をボツにして作り直してます…。納得行かなくて…。
パートがいっぱいあると修正がめちゃくちゃ大変なので…。
古いゲームのBGMがボイパロイドに選ばれがちなのは、
パートが少なくて、同時発音数が少ない、っていう特徴があるからですね。めちゃくちゃ向いてます。
歌詞選びが大変
いわゆるスキャット、ですけど、
ストリングス系は[b]の音が入るように(「ボン」とか)、
スネアドラム系は「チッ」にしたりとか、
金管系は「パー」は実はあんまり合わないとか、
聞いてみないとうまく行かないこともあってなかなか大変です。
CCSをもとにするので歌詞の自由度が高いのはいいんですが、それっぽく聞こえる歌詞選びは大変です。
なるべく同じ音になる方がどちらかというといい感じ。
音域
CeVIOトークのボイパロイドには音域の概念があります。
具体的に言うと高すぎ・低すぎな音域はちゃんと発音できません(歌うときと同じでかなり辛い感じの発音になります)。そのまま楽譜どおりだと、叫び声みたいな音やノイズみたいな音になるのでかなり悪目立ちします。
なので各パート数オクターブずらして音域を合わせる作業がいります。
スネアパートなんかはめちゃくちゃ低いのでそのままだと発音できないこともあります。3オクターブぐらいずらした場合もありますね。。。
トークボイスはソングボイスに比べて、音程の急な変化自体には強いんですが、全体的な音程がそもそも狭いので、楽曲のように上から下まで音域をつかうのはかなり辛いです。
まあしゃべることをかんがえれば、当たり前なんですけど。”外行きの声”でも2オクターブ高いわけじゃないですからね!
感情パラメータは使える
ソングボイスと違ってトークボイスは感情パラメータが複数あります。普通は4~5ぐらい。
声色の違いだけじゃなくて、平均の音域もちょっと変わるので(たとえば「怒り」だと音程が低くなる)、パートの違いとしてつかうのは有りかなと。
今回は時間切れであんまりこだわれなかったですけどね…。
CeVIO AIがめっちゃ重くなる
自作ツールでボイパロイドやってるんですが、CCSファイルを自動生成するもので、このCCSファイルを読み込むと、CeVIO AIがめっちゃ重くなります。
ファイル読み込みに数分かかるんですよね~
1ノート=1台詞でやってるのも原因かな~。
とはいえ1ノート1台詞でやってるので同時発音ができる、ってメリットもあるので。。。
視聴とかも大変です。たくさんある台詞を合成しないといけないので…。
CeVIO AIはトークトラックを一括でWAV出力する方法がないのでそれもちょっと大変です。他のパートをミュートにしてミックスダウンするしかないです。
名前とか自動で付かないので、わりと手間です。
まあ、普通のトークソフトにはタイムラインなんて無いんだけどね!
まとめ
CeVIOトークのボイパロイドは情報なくて大変
パート分け・歌詞・音域あたりが大変
豊富な感情パラメータは使えそう
CeVIO AIめっちゃ重くなる
明日は「VoiSona 機流音・AiSuuレビュー」です。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?