見出し画像

Asterian【SynthesizerV】を使った "人間的"な(?)デスボイスの作り方

ボーカロイドなど合成音声を使ったデスボイス作成ノウハウは、それこそ初音ミク全盛期のころより追求されてきました。

ただ、作ることができるのは、叫びに近く歌詞の聞き取りがほぼ不可能な、言わば"非人間的"なデスボイスでした。

※例えばリンク先のポストなど(空き缶(失せドカンP)様)
https://x.com/i/status/1791801005874786778

※こちらを参考に自分でも作ってみました(使用音源は初音ミクV4Xです)

この手のデスボイスも、デプレッシブメタルのような怖い感じの音など、いろいろな音楽に使うことができます。

一方でハードコアなどに使われるような、歌詞が(まだ比較的)聞き取れ、シャウトや唸り声に近いデスボイスが作れないか、とも考えていました。

ここで、SynthesizerVにて低音系のボイスバンク「Asterian」を使うことで、言わば"人間的"なデスボイスを作ることができるのではないかと思い、試してみました。

※Asterianによるデスボイス、伴奏つき

※Asterianによるデスボイス、ボーカルのみ


☆作り方

・ノートの入力

ピアノロールとノート入力画面 入力歌詞は「i don't know 'who 'he 'is」
歌の切れ目の頭にクオーテーションを入れると、肌感だがうまく歌ってくれる気がする

まずは、Asterainにて、今回はC3付近にノートを入力します。試してみた感じ、C1~C2くらいの音域でもある程度ちゃんと歌ってくれます。ちなみに他のボイスバンクだと、C1くらいの音域になると人間の歌声じゃなくなります。普通に低音音源としても優秀ですね。

ピッチ感は無くなりますので、キーに合わせた音にする必要はなく、なんとなくの音の上下を意識すればOK。
ピッチモードはラップ(ピンク色)で入力していますが、ロングノート(ここではBPM=277の2小節くらい)の場合、ラップでは音声が破綻しやすいのでその場合は歌唱(緑色)で入力すると良いです。(下図)

図はBPM=277の2~5小節。「nas nas 'wo」でwoが歌唱ノート
冒頭nasの発音開始がなぜか遅くなったので、2小節よりも早くノートを開始している。


・ピッチベンドとラウドネス

下のカーブがピッチベンド、上のカーブがラウドネス
両方とも発音からの時間経過にとともに下がっていく感じ。ピッチベンドは発音の頭をギザギザに


従来のデスボイス作成法では、ピッチを大きく動かすためセンシビティを10くらいに設定していたのですが、今回はそこまでピッチを変動させませんでした(全音も動かないくらい)。またピッチベンドカーブは、発音頭に集中させる感じで、ノートの頭部分だけをギザギザにする感じで描きます。

ちなみにカーブを描く際は、分解能(グリッド)を64分以上に細かく設定した方が良いと思います。

更にピッチベンド・ラウドネスカーブ両方に共通ですが、発音してから次第に下がっていくような感じで描くと、喋り声に近い発声になります。これはデスボイスに限らず、喋りやラップを作るときに有用なアプローチです。

おそらくですがSynthesizerVのラップノートは、裏でこのような喋り声に近づける処理をやっているのではないかと推測しています。

・ボーカルスタイルとパラメータ

ボーカルスタイルは、RoughとTheatricalを上げて強めで荒々しい声に調整。
パラメータでは、息混じりで不安定、大人っぽく(すでに大人っぽいのに)暗めの声を目指した。


ボーカルスタイルを調整することで、いろいろと声質を変化させることができます。AsterianなどEclipsed Sounds社製のものは比較的多くのボーカルスタイルが収録されています(他のボイスバンクでは2~4つ程度)

今回は、Rough(荒々しさ)とtheatrical(オペラっぽさ)を上げてみました。
ちなみにAsterianは、素の状態だとデスボイスとは無縁な、優しくおおらかな男声ボイスで歌います。theatricalを上げることでオペラ歌手のような強い発声になります。

パラメータは、ボイスバンクで共通な要素です。
ここでは感情的(不安定)、息混じり、更に大人っぽく、暗めの性質に設定しました。


以上で、初めに紹介したデスボイスが出来上がります。

こちらの方法で作成した音声を、【なすなす央投稿祭2024】投稿曲に使用しました。以下YouTubeチャンネルに公開した動画のリンク貼っておきます。


この記事が気に入ったらサポートをしてみませんか?