
動画出力設定を見直そう! YMM4(v4.33.0.0)以降でエンコード後の音声がこもったように聞こえたので検証した
2025/01/09 追記
v4.36.0.0以降からコンプレッサー周りの改善が行われ、エンコード時の初期設定が変更になりました。もし下記の記事をもとにエンコード時の設定を変更した場合は初期設定の値を一度ご確認ください。

※画像内の「目標音量にする」設定は私の環境に合わせた設定です
アップデート前

アップデート後
初期設定と合わせて「先読み」機能をONにしておくと音声がこもる現象を改善できると思います。

アップデート後の設定でエンコードをしても以前と同様の音声がこもる現象が出続ける場合はコンプレッサーから「圧縮しない」を選択するのが無難です。
↓ここから以前の記事です↓
とある日のゆっくりムービーメーカー4(YMM4)のエンコード設定に変更が掛かり、今までのやり方と違う点が出てきました。
ゆっくりMovieMaker v4.33.0.0 を公開しました!https://t.co/w68B6glPLN
— 饅頭遣い (@manju_summoner) October 1, 2024
主な変更点は以下の通りです
- 「拡大縮小(ピクセル)」エフェクトを追加(べにかずら(benikazura_X)さんによる実装です)
- 「色覚異常」エフェクトを追加
- タイムライン上でアイテムをドラッグした際の操作性を改善
-… pic.twitter.com/TXe91LWPDC
こちらのv4.33.0.0のアップデート以降、エンコード設定に以下のメニューが加わりました。
音量調整
音割れ対策(コンプレッサー)

ってことで、
「音割れ対策」と「音量の最大化」はどこいったの!?
音割れ対策 (コンプレッサー) ってなに!?
ってことで戸惑った人のメモ書きです。
経緯
v4.33.1.0以降、今まで使用していた「音量の最大化」オプションが消え、そしてエンコード後の動画で合成音声の音声がこもったように聞こえるようになっていました。
YMM4の動画出力高速化プラグインでエンコードしてみたらなんかIAちゃんのボイスがいつもと違うような……YouTube対応の384kbpsでエンコードしてるけど、そんなに変わらないかなと思ったらやっぱり違うのかな…。
— あおもや (@bluemist_im) October 14, 2024
その後、アップデート内容を思い出して「コンプレッサーの設定が悪さをしているのでは?」という仮説を立ててみたところ、どうにもそれが正解のようでした。
コンプレッサーが効いてるせいだ!!!!!!!! https://t.co/BXGynJNk8r pic.twitter.com/brLzsVj5vE
— あおもや (@bluemist_im) October 14, 2024
この音割れ対策のコンプレッサーはv4.33.1.0の現在では初期設定が自動で効くようになっており、普段とエンコード設定を変えていないのに音がこもるように聞こえるのはこれが原因のようでした。
エンコード設定の見直しと検証
ひとまずコンプレッサーは「圧縮しない」に設定し直し、エンコードをし直すことで事なきを得たのですが、こう見ると正しい設定がなんなのか一度見直してみないといけません。
音量調整
まずv4.33.1.0以降のアップデート内容で追加された音量調整機能について。
以前までは「その他」から「音量の最大化」だけ選んでおけばたいてい良い結果が得られたんですが、この「音割れ対策」と「音量の最大化」もメニューから消えました。

このふたつの代替機能としては以下が用意されています。
最大音量を0dB以下にする:最大音量が0dBを越えないように全体の音量を下げる。以前のバージョンの「音割れ対策」に相当
最大音量を0dBにする:最大音量が0dBになるように全体の音量を上げ下げする。以前のバージョンの「音量の最大化」に相当
まとめると、
最大音量を0dB以下にする:以前の「音割れ対策」に相当
最大音量を0dBにする:以前の「音量の最大化」に相当
目標音量にする/下げる -15.0LKFS:ニコニコの規定ラウドネス値目指し(YouTubeは-14.0LKFS)

念のためそれぞれの音声波形も調べてみましょう。それぞれ同じ実況動画の場面を5つの設定で音声だけ出力してみました。コンプレッサーは「圧縮しない」で設定しています。


(音量が目標音量以下なので①と変化なし)

(先ほどより音量が上がる)

(音量が目標音量以下なので①と変化なし)

(③よりも音量が上がっている)
ということで、この場面だけの話にはなりますが「音量が目標音量(-15.0LKFS)を下回っているため、音量調整は③、⑤のオプションの適用が望ましい」となります。でもって、ニコニコ向けの投稿がメインなので「目標音量(-15.0LKFS)にする」の設定をしておけば音量調整は間違いないとは思います。
音量は場面で左右されてしまうため、あくまで私の環境(基本は合成音声のボイスが一番大きく聞こえる環境+ゲームの動画)の話ですけども。
音割れ対策 (コンプレッサー)
そして今回のメインです。
そもそもDTM知識皆無なので「コンプレッサーをどこで使うんだ?」という程度に認識です。
調べてるとちょうど分かりやすく解説してくださっている記事があったのでこちらに則りましょう。
そもそもコンプレッサーとは
コンプとは、みたいな感じで調べるとその働きとできることがごっちゃになって出てきます。
コンプレッサーでできることはいろいろありますが、コンプレッサーがそもそも何をするものか、というのは1つで「指定した音量よりも大きな音を小さくする」というものです。(アップワードコンプみたいな働きもありますがここでは割愛します)
つまり、指定した音量(-15.0LKFS)や音割れになる0dbを超える音量になった際に、音を圧縮して規定の音量を超えないようにする、というのがコンプレッサーの役割のようです。
実際に音がこもって聞こえるようになった音声の波形を見てみますと、音が大きくなる部分で音のギザギザがなくなり、丸くなっているのが分かるでしょうか?


一部分を重ねてみると、音量は均質化されていますが、けっこう丸みが出てますね。

とにかく以前のように戻したいというなら、コンプレッサーは「圧縮しない」に設定し直すのが吉です。少なくとも私みたいにコンプレッサーの役割がよく分からないようなら……。
コンプレッサーはなしのほうがいいの?
せっかくなのでもう少し踏み込んでみようと思います。
そもそもコンプレッサーの役割は『場面ごとの音の大小の差を減らして、動画全体の音量を均一化し、より聞き取りやすくする』ことにあります。
なので、上手く導入できればメリットにはなるはずです。コンプレッサーを上手く使えないものでしょうか?
このよく分からないパラメータをもう少し調べます。

コンプレッサーをカスタムに設定して疑似的にAudacityという音声加工ソフトでコンプレッサーを試してみます。

初期設定に準じてかけてみると音量が大きめの場所に大きく加工がかかってます。
このかけ方を緩やかにするには、アタックタイムの設定が重要になるそうです。
アタックタイムとリリースタイムはこんな図になるそうで、ここのアタックタイムをかけるとかかり方が緩やかになります。

実際に先ほどの記事を頼りに20ms(0.02秒)かけてみると、ここの場面では一切かかってない感じになりました。

というわけで、アタックタイムを適度にかけてみて、それぞれの音声を比較してみた動画がこちら。
YMM4のv4.33.0.0以降エンコード設定に音量調整とコンプレッサーが入りました。が、この初期設定のコンプレッサーが音のこもりを生んでいるのでは?ということで検証してました。
— あおもや (@bluemist_im) October 19, 2024
で、コンプレッサーのアタックタイムを0.02秒ほどにしたらだいぶ改善する気が。 https://t.co/xsC3pwqa91 pic.twitter.com/x21HdqWDwi
この20msもまだ検証値ですが、ここの顕著に違いが出ていた場面だけ見るに影響は出なくなっているので、このあたりを基準に合わせていく形が良さそうです。
リリースタイムに関しては未検証ですが……。
結論
コンプレッサーは「やりすぎないように使う」というのが大事なようなので、かかり方を工夫していけば動画の音声をより聞きやすくできると思います。
が、役割もよく分からない状態で自動でエンコード時に効果がかかるようになってしまったので、効果が分からないうちは効果はかけないほうが良いでしょうね。
ひとまずコンプレッサーもすこしだけかけるようにして今の設定はこんなかんじで様子見です。

とりあえず検証途中ですが、環境によっては私と同じ状態になっている方もいそうなので、今日の記事を書いてました。
おしまい!