動画出力設定を見直そう! YMM4(v4.33.0.0)以降でエンコード後の音声がこもったように聞こえたので検証した
とある日のゆっくりムービーメーカー4(YMM4)のエンコード設定に変更が掛かり、今までのやり方と違う点が出てきました。
こちらのv4.33.0.0のアップデート以降、エンコード設定に以下のメニューが加わりました。
音量調整
音割れ対策(コンプレッサー)
ってことで、
「音割れ対策」と「音量の最大化」はどこいったの!?
音割れ対策 (コンプレッサー) ってなに!?
ってことで戸惑った人のメモ書きです。
経緯
v4.33.1.0以降、今まで使用していた「音量の最大化」オプションが消え、そしてエンコード後の動画で合成音声の音声がこもったように聞こえるようになっていました。
その後、アップデート内容を思い出して「コンプレッサーの設定が悪さをしているのでは?」という仮説を立ててみたところ、どうにもそれが正解のようでした。
この音割れ対策のコンプレッサーはv4.33.1.0の現在では初期設定が自動で効くようになっており、普段とエンコード設定を変えていないのに音がこもるように聞こえるのはこれが原因のようでした。
エンコード設定の見直しと検証
ひとまずコンプレッサーは「圧縮しない」に設定し直し、エンコードをし直すことで事なきを得たのですが、こう見ると正しい設定がなんなのか一度見直してみないといけません。
音量調整
まずv4.33.1.0以降のアップデート内容で追加された音量調整機能について。
以前までは「その他」から「音量の最大化」だけ選んでおけばたいてい良い結果が得られたんですが、この「音割れ対策」と「音量の最大化」もメニューから消えました。
このふたつの代替機能としては以下が用意されています。
まとめると、
最大音量を0dB以下にする:以前の「音割れ対策」に相当
最大音量を0dBにする:以前の「音量の最大化」に相当
目標音量にする/下げる -15.0LKFS:ニコニコの規定ラウドネス値目指し(YouTubeは-14.0LKFS)
念のためそれぞれの音声波形も調べてみましょう。それぞれ同じ実況動画の場面を5つの設定で音声だけ出力してみました。コンプレッサーは「圧縮しない」で設定しています。
ということで、この場面だけの話にはなりますが「音量が目標音量(-15.0LKFS)を下回っているため、音量調整は③、⑤のオプションの適用が望ましい」となります。でもって、ニコニコ向けの投稿がメインなので「目標音量(-15.0LKFS)にする」の設定をしておけば音量調整は間違いないとは思います。
音量は場面で左右されてしまうため、あくまで私の環境(基本は合成音声のボイスが一番大きく聞こえる環境+ゲームの動画)の話ですけども。
音割れ対策 (コンプレッサー)
そして今回のメインです。
そもそもDTM知識皆無なので「コンプレッサーをどこで使うんだ?」という程度に認識です。
調べてるとちょうど分かりやすく解説してくださっている記事があったのでこちらに則りましょう。
つまり、指定した音量(-15.0LKFS)や音割れになる0dbを超える音量になった際に、音を圧縮して規定の音量を超えないようにする、というのがコンプレッサーの役割のようです。
実際に音がこもって聞こえるようになった音声の波形を見てみますと、音が大きくなる部分で音のギザギザがなくなり、丸くなっているのが分かるでしょうか?
一部分を重ねてみると、音量は均質化されていますが、けっこう丸みが出てますね。
とにかく以前のように戻したいというなら、コンプレッサーは「圧縮しない」に設定し直すのが吉です。少なくとも私みたいにコンプレッサーの役割がよく分からないようなら……。
コンプレッサーはなしのほうがいいの?
せっかくなのでもう少し踏み込んでみようと思います。
そもそもコンプレッサーの役割は『場面ごとの音の大小の差を減らして、動画全体の音量を均一化し、より聞き取りやすくする』ことにあります。
なので、上手く導入できればメリットにはなるはずです。コンプレッサーを上手く使えないものでしょうか?
このよく分からないパラメータをもう少し調べます。
コンプレッサーをカスタムに設定して疑似的にAudacityという音声加工ソフトでコンプレッサーを試してみます。
初期設定に準じてかけてみると音量が大きめの場所に大きく加工がかかってます。
このかけ方を緩やかにするには、アタックタイムの設定が重要になるそうです。
アタックタイムとリリースタイムはこんな図になるそうで、ここのアタックタイムをかけるとかかり方が緩やかになります。
実際に先ほどの記事を頼りに20ms(0.02秒)かけてみると、ここの場面では一切かかってない感じになりました。
というわけで、アタックタイムを適度にかけてみて、それぞれの音声を比較してみた動画がこちら。
この20msもまだ検証値ですが、ここの顕著に違いが出ていた場面だけ見るに影響は出なくなっているので、このあたりを基準に合わせていく形が良さそうです。
リリースタイムに関しては未検証ですが……。
結論
コンプレッサーは「やりすぎないように使う」というのが大事なようなので、かかり方を工夫していけば動画の音声をより聞きやすくできると思います。
が、役割もよく分からない状態で自動でエンコード時に効果がかかるようになってしまったので、効果が分からないうちは効果はかけないほうが良いでしょうね。
ひとまずコンプレッサーもすこしだけかけるようにして今の設定はこんなかんじで様子見です。
とりあえず検証途中ですが、環境によっては私と同じ状態になっている方もいそうなので、今日の記事を書いてました。
おしまい!