見出し画像

【技術解説】ラウドネスとトゥルーピークを極める

2025年1月にリリースされた「Live Extreme Encoder v1.15」では、ライブ配信中のコンテンツの「プログラム・ラウドネス」や「トゥルーピーク」をリアルタイム表示できるようになりました。配信コンテンツのラウドネス管理は、視聴者が快適に視聴する上で重要なだけでなく、一部空間オーディオ・フォーマットでは規格上必須となっています。今回はこのラウドネスについて、国際規格である「ITU BS.1770」をベースに技術解説していきます。


ラウドネス管理の重要性

ラウドネスとは人間の聴感上の音の大小を示す心理量です。人間は、ラウドネスの低い音楽より高い音楽の方が、パッと聴いた時に派手さが増し、良い音に錯覚する傾向があります。

ラウドネス戦争からラウドネス・ノーマライゼーションへ

過度にラウドネスを上げると、楽器本来のサウンドを大きく損なったり、音楽の抑揚がなくなるなどの弊害があるものの、1990年代半ばから、音のインパクトを重視し、「ラウドネス戦争」と呼ばれる現象が発生しました。新しくリリースされるCDのラウドネスが、競い合うように上がっていったのです。

マイケル・ジャクソン の "Black or White" では、時代の流れと共に音の大きさが増加している
Wikipedia「ラウドネス・ウォー」より引用

2000年代にiPodのような大容量の音楽プレイヤーが普及すると、音質劣化以外の弊害も顕在化してきました。1980年代から2000年代の音楽データを連続再生すると、ラウドネスが大きく異なるため、リスナーが自らボリュームを制御する必要がでてきたのです。

そこで、Appleは2002年にiTunesとiPodに「Sound Check」という機能を導入、他社製品でも「ReplayGain」という類似技術が普及しました。これは、楽曲のインポート時にラウドネスを計測、再生時に計測されたラウドネスに従って音量を自動調整する機能で、一般に「ラウドネス・ノーマライゼーション」と呼ばれています。これにより、アルバムを跨いだ連続視聴が快適になっただけでなく、(過大なラウドネスで制作する意味が失われたことで)ラウドネス戦争も落ち着くことになりました。

YouTubeやSpotifyなど、更に大量のコンテンツを扱うストリーミングの時代となった現在、コンテンツごとのラウドネスのばらつきを抑えるラウドネス・ノーマライゼーションは更に重要な機能となっています。

TV放送におけるラウドネスのばらつき

2000年代にはTV放送がデジタル化し、音声のリニアリティが増したことで、TV放送におけるラウドネスのばらつきも課題になってきました。具体的には、番組とCMの切り替わり時、あるいはチャンネルを変えたときの音の大きさの違いが、視聴者の快適な視聴を阻害する要因となっていました。当時、民放の深夜番組を観る時は、いつも手の届く範囲にリモコンを置いておき、CMに入ったらすぐにボリュームを下げるということがよく行われていたのではないかと思います。

このような背景から、放送業界においてもラウドネス管理(ラウドネス測定方法の標準化)の重要性が認識されるようになってきました。そこで登場したのが「ITU BS.1770」です。

ITU BS.1770と関連ラウドネス規格

ITU BS.1770は、2006年に国際電気通信連合 (ITU) が策定したラウドネス測定アルゴリズムで、各国の放送の運用基準や、多くのストリーミング・サービスの納品基準もこの測定方法に基づいて規定されています。

BS.1770以前の放送やレコーディングでは、VUメーターに基づいた音量管理がなされていましたが、VUメーターはあくまで電圧を計測しており、必ずしも人間の聴覚特性と一致していませんでした。

そこで、BS.1770では、入力されたオーディオ信号に「K特性フィルタ」という人間の聴覚特性を模したフィルタを通してから、ラウドネスを測定するように規定されています。

K特性フィルタの周波数応答

BS.1770で規定されているラウドネスは、K特性フィルタを通過したデジタル音声信号を二乗平均した上で、dB等と同様に対数(log)スケールで表したもので、単位には「LKFS」が使用されます(「LUFS」が使用される場合もありますが、両者に違いはありません)。また、2つのラウドネス値の差を表す場合は「LU」という単位が利用されますが、1 LU = 1 dB となっています。例えばラウドネスを -13 LKFSから -16 LKFSに 3 LU 下げたい場合には、マスターフェーダーを 3 dB 下げれば良いわけです。

BS.1770には、後述のIntegrated LoudnessとTrue Peakのみ規定されていますが、以下に欧州放送連合 (EBU) の「TECH 3341」や「TECH 3342」で追加された測定法(EBU Mode)も含めてご紹介します 。

プログラム・ラウドネス (I)

プログラム・ラウドネスは「Integrated Loudness」とも呼ばれ、コンテンツ全体の平均ラウドネスを表します(単位: LKFS)。「ゲーティングブロック」という400msの区間を100msずつずらしながら測定し、コンテンツ全体の平均を算出します。

プログラム・ラウドネスの測定方法(オーバーラップ法)
ARIB「デジタルテレビ放送番組における ラウドネス運用規定」より引用

また、BS.1770には「2段階閾値によるゲーティング」というユニークな仕組みがあり、ラウドネスが小さい区間が平均ラウドネスの算出から除去されるようになっています。

絶対ゲーティング
測定区間内に無音部分が含まれると、人が感じる音の大きさと測定したラウドネス値との誤差が大きくなります。BS.1770では無音と見なせる絶対閾値(-70LKFS)以下のゲーティングブロックは平均ラウドネスの計算から除外されます。

相対ゲーティング
測定区間内に含まれる比較的音量の小さい部分を除去すると、人が感じる音の大きさと測定したラウドネス値との直線性が改善します。BS.1770では、絶対ゲーティング後の平均ラウドネス値から 10LU 以下の比較的小音量のゲーティングブロックも除外した上で、最終的なプログラム・ラウドネスを再計算します。

ラウドネス・レンジ (LRA)

プログラム・ラウドネスがコンテンツ全体の平均ラウドネスを示しているのに対し、EBU「TECH 3342」で規定された「ラウドネス・レンジ」はコンテンツ全体でラウドネスがどれほど変化するか示しています(単位: LU)。ラウドネス・レンジが大きいほど抑揚が大きく、ラウンドネス・レンジが小さいほど平坦なコンテンツと言えます。

実際の計算は少し複雑で、以下の手順で算出されます。

  1. 400msのゲーティングブロック(100msオーバーラップ)のラウドネス値の発生分布を求める

  2. -70 LKFSの絶対ゲーティングを行った後、コンテンツ全体の平均ラウドネスを算出する

  3. 平均ラウドネスより-20LU以下のゲーティングブロックを無視する

  4. 残りの分布のうち、下位10%はフェードイン/アウトなどの影響、上位5%は突発的な大音量とみなして除外し、残った範囲をラウドネス・レンジとする

ゲーティングブロックのラウドネス値の分布

モメンタリー・ラウドネス (M)

直近400msの "瞬時的" なラウドネス(単位: LKFS)。ゲーティングは行いません。

ショート・ターム・ラウドネス (S)

直近3秒間のラウドネス(単位: LKFS)。ゲーティングは行いません。EBU Modeでは100ms以下の更新間隔が求められています。

Live Extreme Encoderにおける実装

Live Extreme Encoderでは最大4系統の音声を同時に配信することができますが、Live Extreme Encoder v1.15からは、各音声系統のプログラム・ラウドネスがメイン画面にリアルタイム表示されるようになりました。

プログラム・ラウドネス表示部

この値は、配信開始時、およびプログラム・ラウドネス実測値をクリックした時に、全て同時にリセットされます。

ターゲット・ラウドネス設定

Live Extreme Encoderでは、設定の「音声 > ターゲット・ラウドネス」にライブ・コンテンツのプログラム・ラウドネスの目標値(ターゲット)を記入してから、配信を開始する必要があります。

ターゲット・ラウドネス設定メニュー

この設定に基づき、メイン画面のプログラム・ラウドネス実測値の色がリアルタイムに変化します。

  • ターゲット・ラウドネスの ±1.0LU 以内に収まっている場合:緑(適正)

  • ターゲット・ラウドネスを 1.0LU 以上上回っている場合:赤(過大)

  • ターゲット・ラウドネスを 1.0LU 以上下回っている場合:青(過小)

PCM配信の場合は、ターゲット・ラウドネス設定は上記表示にしか影響しないので、実態が乖離していても大きな問題にはなりません。

しかし、MPEG-H 3D Audio配信の場合は、ターゲット・ラウドネスの値が配信されるメタデータに記述され、再生側でラウドネス・マネジメント(音量調整)されることになります。もしターゲットと実態が大きく乖離している場合は、再生側で歪みが発生するなどの問題が生じる可能性がありますので、配信ミックス担当者に適切にラウドネスを管理してもらう必要があります*。

*Live Extreme Encoderにはラウドネスを自動調整するラウドネス・レベラーは搭載されていません。

サラウンド/イマーシブ・オーディオの扱いについて

BS.1770では、原則すべてのチャンネルの信号を使って(二乗平均の合計から)ラウドネスを測定します。

マルチチャンネル音声のラウドネス計測アルゴリズム
ARIB「デジタルテレビ放送番組における ラウドネス運用規定」より引用

ただし、チャンネルによって重みが異なり、

  • LFEチャンネルは測定に含めない

  • 水平レイヤー(仰角±30°未満)のサラウンド・チャンネル(左右60°〜120°)は +1.5dB の重みづけをして加算する

  • そのほかのチャンネルはそのまま(重みなし)加算する

ことになっています。Live Extreme Encoder v1.15では、上記に基づいて最大22.2chのプログラム・ラウドネスを測定することが可能です。

尚、オブジェクト・ベース配信の場合は、ダイナミック・オブジェクトは測定に含めず、ベッド・チャンネルのみから測定するようになっていますのでご注意ください。

ハイレゾ信号の扱いについて

BS.1770には48kHzを超えるハイレゾ信号の扱いについて規定されていません。ただし、K特性フィルタが人間の聴覚特性に基づいて設計された経緯からも、24kHz以上の信号を除外して計算するのが自然でしょう。実際のところ、24kHz以上の信号が音色や空気感に影響することはあっても、ラウドネスに影響への影響はほとんどないと考えられます。

Live Extreme Encoderでは、DSDを含むすべてのハイレゾ音声は、一旦48kHz以下にダウンコンバートしてから、ラウドネスを計算しています*。

* ダウンコンバート処理は、あくまでもラウドネス計算のためだけに行っています。配信自体はオリジナルのハイレゾ音声で行われますので、音質に影響はありません。

トゥルーピークの概要

デジタル信号による録音や伝送では、その信号のレベルがオーバーロードしないように調整することが大切です。しかし、一般的なピークメーター(サンプルピークメーター)は、音声信号のサンプルごとのピーク値を検出して表示しているだけで、アナログ信号波形の「トゥルーピーク (真のピーク)」の値を検出することができません。

高い周波数成分を含む音声信号では、ピーク値がサンプルとサンプルの間で発生している場合があります。つまり、サンプルピークメーターでは 0dBFS 以下であっても、D/A 処理された段階でオーバーロードを生じ、音声出力が歪んでしまう可能性があります

サンプルピークとトゥルーピークの誤差
ARIB「デジタルテレビ放送番組における ラウドネス運用規定」より引用

BS.1770では、デジタル信号のピーク値とクリッピングレベルであるフルビットとの間のヘッドルームを正確に把握するための「トゥルーピークメーター」を規格化しています。これは入力信号(48kHz)を4倍オーバーサンプリング(192kHzに変換)した上でピークを検出するもので、サンプルとサンプルの間に存在するピークの値を検出することを目的としています。

トゥルーピークメーターと「真のピーク」の誤差

実はトゥルーピークメーターは厳密には「真のピーク」を検出しきれず、誤差を含んでいます。理論上の誤差の最大値は0.688dBにも上ります。ただし、この数値はナイキスト周波数(24kHz)の純音を入力した場合という特殊な条件であり、通常の音楽では0.1~0.2dB程度であると考えられます。

インターネット配信においては、あまり気にしすぎる必要はないと思いますが、オーバーロードの可能性を完全に回避したい場合は、-0.688dBTP以下にトゥルーピークを抑えると良いでしょう。放送における「-1dBTP以下」という運用基準(後述)も、この数字が基になっていそうです。

Live Extreme Encoderでの利用方法

Live Extreme Encoderは、メイン画面右側に、オーディオ・インターフェイスからの入力信号、および内蔵プロセッサ(HPLなど)の出力信号のピーク・メーターが表示されています。

レベル・メーター表示部

Live Extreme Encoder v1.15以降は、設定から「音声 > レベル・メーター > トゥルーピークを表示する」を有効にすると、上記メーター表示を従来のサンプル・ピーク (dBFS) から、トゥルーピーク (dBTP) に切り替えることができます。

レベル・メーターの表示設定メニュー

ハイレゾ音声の扱いについて

Live Extreme Encoderは、ITU BS.1770に従い、48kHz音声を192kHzにオーバーサンプリングしてトゥルーピークを測定います。そのほかのサンプルレートが入力された場合については規格化されていませんが、Live Extreme Encoderでは以下のように扱います。

  • 44.1kHz & 48kHz: 4倍オーバーサンプリングでピークを検出

  • 88.2kHz & 96kHz: 2倍オーバーサンプリングでピークを検出

  • 176.4kHz & 192kHz以上のPCM: サンプルピーク(dBFS)と同じものを表示

  • DSD: サンプルピーク (dB SA-CD) と同じものを表示

ライブ配信時のラウドネス/トゥルーピーク

各国の放送や配信サービスの運用基準

ラウドネスの運用基準は、各国の放送や配信サービスによって異なります。ラウドネス・メーター製品で有名なRTWのウェブサイトには、各国の放送や配信サービスの状況がまとまっているので、大変参考になります。

各国の放送や配信サービスのラウドネス運用基準
RTW「Worldwide Loudness Delivery Standards」より引用

特徴的なのは放送においては、

  • 北米(ATSC A/85):【I】-24 LKFS (±2.0LU), 【TPmax】-2 dBTP

  • 欧州(EBU R128):【I】-23 LUFS (±0.5 LU), 【TPmax】-1 dBTP

  • 日本(ARIB TR-B32):【I】-24 LKFS, 【TPmax】-1 dBTP

とかなり低めなのに対し、インターネット配信では、

  • Spotify:-14 LUFS

  • YouTube:-14 LUFS

  • Apple Music:-16 LUFS

と10LUほど高めに設定されていることです。

Live Extreme配信ではどうすべきか

Live Extremeは、配信エンコーダーでもサーバーでもラウドネス調整(レベリング)を行わず、入力された音声データをそのまま配信します。一部フォーマットを除き、プレイヤー内でもラウドネスの変更はされませんので、エンコード時のラウドネスのまま再生されることになります*。

* Dolby Atmos, MPEG-H 3D Audioについては、コーデックの仕様により、配信されるデータにラウドネス情報が書き込まれます。この場合、環境によって再生(デコード)時にラウドネス・マネジメントされる可能性があります。

Live Extremeは各社のストリーミング・プラットフォームに組み込んで使われるので、基本的にはプラットフォーム側の基準に従って配信してください。もしプラットフォームに基準がない場合は、YouTubeなど他の配信サービスと音量差が生じないように -14〜-16 LKFS をターゲットにするのが良いでしょう

まとめ

従来、Live Extremeの配信管理では、外部機器を利用してラウドネスを監視する必要がありましたが、ハイレゾ配信や空間オーディオ配信となると、対応機器の入手が困難で、なかなか難しいものがありました。

今後はLive Extreme Encoder単体でラウドネスの監視まで行えますので、ハイレゾや空間オーディオであっても最適なラウドネスで視聴者の元に送り届けてもらえれば幸いです。

いいなと思ったら応援しよう!