いまさら聞けない配信音声処理 -ゲイン編-

皆様ごきげんよう。
LLSY music & Vch.のレーシーです。

今日はボカロPでVtuberとなった私が実際配信をしていくにあたって気になったこと、周りのお友達が疑問に思っていたところなんかを書いていくことで少しでも誰かの助けになればなぁという記事を書いていこうと思います。

配信をしていくにあたって一つの鬼門が「音声」だと思っています。
映像と違ってなかなか目に見えるものではないし、オーディオインターフェイスやVSTプラグインはその出自が音楽制作用の器材だったということで今でも配信に特化したものというのは多くないです。

この記事はいずれシリーズ化して、通して読むと基本的な「どのように音声の設定をしていけばいいの?」ということと「具体的に何をどう操作すればいいの?」
ということがわかるようにしていきたいと思っています。

各記事は2段構成にして、難しいことはわからないけど何をどうすればいいの?という話と、もう一歩踏み込んでどういう理屈なの?という話をしていこうと思っています。

第一回の今回は「オーディオインターフェイス / マイクプリアンプのゲイン」の話です。

マイクを接続し、ゲインを上げる

マイクをオーディオインターフェイスに接続します。
この時ファンタム電源と呼ばれる電源を使用するタイプとしないタイプのマイクが存在します。
一般的にはダイナミックマイクと呼ばれるマイクは不要で、コンデンサマイクと呼ばれるマイクは必要です。(稀に"プリアンプ内蔵"ということで電源供給を求められるものもあります。)
この辺りはご自身のマイクをしっかり確認しましょう。

ファンタム電源は多くの機材で「+48V」と表記されています。
マイクとケーブルで接続してからオンにしましょう。ケーブルを外すときはオフにしてから(なにやらオフにしなくていい勢もいるようですが、無駄なリスクを背負う必要はないかと思います)
ファンタムが不要なマイクを繋いでいるときはオンにしないようにしましょう。
もしマイクの接続にミキサーを使っている場合、機種によっては1~4chでまとめてファンタムがかかる等の場合もあるので複数のマイクを混在させるときは気を付けます。(個人配信ではあまりないかとは思います)
USBで接続するマイクであれば、オーディオインターフェイスの機能が内包されているのでUSBで接続したのちそれぞれのソフトなどで操作します。

「電源を使うマイク」が開発されたときに、納入されたスタジオにあったヒーターと同じところから電源をとれないか、という理由で48Vになったそう
Phase(位相)のInvertは2本以上マイクを立てるとき位相差をそろえる目的などで使われます。

どこまでゲインを上げればいいの?

ゲインを上げますがどのあたりまで上げるかというところで悩む人もいるかと思います。
これは使っているマイク、インターフェイスのマイクプリアンプの性能、話し声の大きさ、マイクとの距離などいろいろな要素で変わってきてしまうので、「いくつにすればオッケー!」というものが残念ながらありません。
一番無難な方法としては、「大きな声を出したときに赤いランプがつかない程度」まで上げます。
上げなさ過ぎて緑のランプもつかないとなると音は小さすぎて、後々ノイズなんかの問題を起こしやすいです。
レベルの管理は機材によってメーターの種類が異なります。
一番シンプルなのはLEDが一つだけついているタイプ。緑→赤、もしくは緑→黄色→赤と変わっていきます。正直視認性は悪いです。赤のランプがついてしまうとその時点で音割れを起こしているということなので、赤いランプがたびたびつくのであればゲインを下げましょう。

後述しますが、OBSで下げれば大丈夫、ではありません。
複数LEDがついているタイプはもう少しわかりやすいです。
一番わかりやすいのはメーターとして見れるタイプ。新しいScarletなんかはノブの周りがメーターになっていたり工夫されています。


低価格ながら人気のMOTU M2 LCDメーターで視認性は抜群です。
第四世代になった"世界一売れている"FocusriteのScarlet。ゲインノブの周りがメーターになっていて視認性と省スペースを両立している。ゲインを自動で調節してくれるオートゲインに、1サンプル単位でクリップした瞬間に自動で音量を下げる機能など難しい操作がわからなくても簡単に使えるようになっている。
私も使用している Zen Q SC
ソフトウェア上でルーティングを組めるだけでなく、画面上でより分かりやすいメーターを見ることができる。
何dbまで増幅可能か、はプリアンプによって異なります。
また、同じ増幅量でもADによって何dbが0dbFSに相当するかは変わります。
数字で意識するよりIFのメーターを見ながら操作しましょう。

もしミキサータイプの機材を使用している場合、もう少し音の流れを意識する必要はあります。
一般的なアナログミキサーは音が「上から下に」流れます。

いわゆる"チャンネルストリップ"。
これはプラグインなのでHAセクションはなく、左上から下、真ん中上から下、右上から下という流れになる。
LP/HPフィルター→コンプ→ゲート(エキスパンダ)→EQ→アナログシミュレートのための電圧→メーター→ポストフェーダーとなっている。

たいていの場合一番上のHA(ヘッドアンプ)と呼ばれるセクションにゲインはあります。逆に一番目立つ下にあるフェーダーは最終的なバランスをとるためのものなので、おそらく8割ほど上がったところにある0に合わせておきます。
トリムはフェーダーの最大値を決めるところです。
少しややこしいですが、同じ音量の信号でも、インターフェイスによってデジタルになったときの音量が異なります。
どういうこっちゃという感じですが、いずれインターフェイスの記事を書くときに触れてみようと思います。

ここからはもう少し深く知りたい方に向けたものになります。

上の方法を試したとき、「思ったよりゲインってあげるんだな」と感じた方は多いかと思います。
そして「ここでこんなに上げなくてもOBSとかで上げればいいんじゃないの?」と思った方も多いかと思います。
プリアンプ側の設定の一つの基準として、マイクの出力レベルというものがあります。かなりおおざっぱですが、ダイナミックマイクで-40~-60dbu、コンデンサマイクで-30dbu前後のものが多いのではないでしょうか。
ラインレベルは+4dBuとなります。
マイク側が-50dbuのとき基準信号を入れてプリアンプでのゲインで+54dbするとちょうどクリッピングするところまでレベルは稼げます。
しゃべり声は基本小さいことが多いので多くの場合この出力数値よりも大きなゲイン設定を行うことが多いです。
ちなみにデジタルではdbFSという単位が使われますが、オーディオインターフェイスでデジタル音声にした際何dBuが何dbFSになるかは少し信じがたいですが機種によって異なります。
0dBuが-18dbFSになる機種や+3dbFS(すでにクリッピングしている)になる機種まであります。

アンブレラカンパニーさんの記事「レベル の はなし」から引用。非常にためになる記事です。
0dbFSが何dBuになるかは各メーカーが自由に決める。例えば低価格高音質で名高いAudientのid4mk2は12dBu=0dBFSとなっている。AG03mk2は3dBu=0dBFS(マニュアルに-3dBFSでクリップとある)なので、同じマイクで同じゲインであればPCに入る音はAG03mk2のほうが9db大きくなるが、同時にノイズ類も9db大きくなる。
単純なSNとは別のところで、しっかりとレベルが稼げるのならよりヘッドルームの大きなid4のほうが有利だ。
ただid4のHAゲインレンジは54db。ダイナミックマイクを使ってしゃべり声を録るとなると割とギリギリだろう。

※一般的に配信の世界では「ダイナミックマイクよりコンデンサマイクのほうが音がよい」と考えられていますがその誤解の一端にこの出力の問題があるのではと思います。
コンデンサマイクは基本的にはダイナミックマイクより出力が大きくなりやすいです。
そしてスピーチ向けダイナミックマイクの定番 SM7Bの開回路感度は-59db re 1V/Paとなっており、Shureの公式Q&Aにも60db以上のゲインを持ったマイクプリアンプを使用するよう書かれています。
配信において低価格と機能で絶大な人気を誇るYamaha AGシリーズですが、AG03のマイクプリアンプのゲイン量は50dbちょっとだったと記憶しています。
(ただしAG03の基準レベルは+3dbu=0dbFSです、これはかなりギリギリな数字ですが、DSPやポストフェーダーがあることと、小さなゲイン幅でも極力大きな音でPCに送ろうという意図が見えます。)
ただこう言った工夫もデジタルトリムで、マイクプリアンプの質は特に中域において大きく変わったりします。(1万円のオーディオインターフェイスがあったとして、マイクプリアンプにどのくらい予算が割かれているでしょう。方やマイク録音に使われるマイクプリアンプ単体機は10万円でかなり安い部類です。)なので安価なインターフェイスほどダイナミックマイクを使用するとどうしても音が小さい、ノイズが多い、中音域のよさが生かせずこもったように聞こえてしまう、ということになってしまいがちで、これが配信者さんの間でコンデンサマイク>ダイナミックマイクという図式につながってしまっているのかなと思います。
(実際にはラージダイアフラムのコンデンサマイクはダイナミックレンジが小さくなってしまう傾向があったり、どれが優れている、というより場面にあったマイクを選ぶという話になってきます。)

ちなみに外部マイクプリアンプを導入するとき、少し気を付けないといけないことがあります。
それはプリアンプとIFの接続方法です。

2万円前後で買え、コンプまでついている。ラックで見栄えもよく大人気のマイクプリアンプdbx 286s。格安だからと侮ることなかれ、A160直系のコンプは硬さはあるけど扱いやすい。どれだけ削っても1ch5万~、2万前後にはTube入りの怪しいマイクプリばかり、という中にあって、IF内臓のプリアンプに不満はあるけど高いIFは買えない、という人におすすめ。

マイクプリアンプの出力はバランス接続、XLRになってることが多いです。
そうするとマイクケーブルでIFのXLRに接続したくなるところですがここが注意点。
IFのコンボジャックはXLRで入れるとマイク入力になり、TRS・TS(フォンケーブル)で入れるとライン入力になるものが多いです。
マイクプリからXLR-XLRケーブルで繋いでしまうとライン信号がマイク入力に入ってしまい、クリップしないようにするため音量がとても小さくなってしまいます。上げようと思うとクリッピングしてひずんでしまう。
こういう場合はXLR-TRSのケーブルを使います。
FMRのように出力がもともとTRSのマイクプリアンプであれば、TRS-TRSのフォンケーブルでおっけーです。(TS-TSのフォンケーブルでも大丈夫なはずです。)

どうしてOBSで音を大きくすることは避けたほうがいいの?

これも多くの人が持ちやすい疑問かなと思います。
もちろんご法度だ!ぜったいだめ!ということではないですし、私もいろいろな手段で音量を持ち上げることは多いです。
ただ極端に小さなインターフェイスからの音を、OBSなどで極端に持ち上げてしまうと大きなノイズの原因になってしまうことがあります。

もしここまで読んだ方であればなんとなく想像はつくかと思います。
マイクをはじめ各機材には、その機材が持つ固有のノイズがあります。
マイクであればS/Nという言葉で仕様表にかかれることも多いです。
マイクから出たノイズや環境音などはプリアンプで声といっしょに増幅されます。これはもう仕方がないです。
ではインターフェイスが持つ固有のノイズはどうでしょう。
これはほとんどの場合一定の大きさを保ちます。
デジタル化されたデーターがインターフェイスからPCに送られるとき、声が大きければ大きいほど機器固有のノイズレベル、ノイズフロアとの差は大きくなります。
逆に声が小さく、PC内で音量を上げなければならないとき、持ち上げた分だけ当然ノイズフロアも持ち上がります。
PC上でコンプレッサーをかけたりすればよりノイズ成分は持ち上がります。
こうして積もり積もって機器のセルフノイズが気になってしまう音量まで持ち上がってしまうことがあります。
インターフェイスそのものの仕様、マイクプリアンプの質、電源環境でこの辺りは大きく変わってきます。音量が足りないからとPC内で大きく持ち上げた時、積もり積もったそれらが大きなノイズとなって立ちはだかります。

一つ気をつけておかなくてはいけないのはDSPやFPGAチップ(オーディオインターフェイス上で動作するエフェクト等)を搭載した機種です。
マイクプリアンプとPCまでの間にレベルが変化する可能性があるので、ゲインステージングはきちんと考えましょう。とはいっても難しいことではなく、OBSに直接入れる場合は基本的にフェーダーを0にして赤いところまでいかなければ大丈夫です。

使っている方も多いであろうフリールーティングソフトの雄 Voicemeeter Banana
ハードウェアインプットに入れた場合PCに入ってきた音をまずここで受けることになります、フェーダーがユニティ(0db)でクリッピングしてなければ大丈夫です。
ワンノブコンプはかなり極端な効き方がするので、OBS上でプラグインなどを使うほうが自然かなと思います。

ノイズを減らすために新しいソフトや機材を入れることはいいことだとは思いますが、まずは自分の環境がきちんとできているのかなということを見ていくのは大切なことかなと思います。

私のnoteではボカロPがVtuberをやってみてたどり着いた音声設定について、全体の流れを解説していく記事を書いています。

ボカロP・VTuberによる配信音声のつくりかた|れー (note.com)

この記事を中心とし、各記事に飛んでいけるように執筆中です。
こういうことも聞いてみたいな、という話題があればコメントやXなどでお気軽にご連絡ください。


LLSY music 


この記事が気に入ったらサポートをしてみませんか?