Zoomの入力方法による音ズレの具合を検証する
今回のテーマはZoomです。
Zoomで配信する際、映像・音声の入力方法はいくつかあります。これまではその方法による画質の差を検証してきました。
この記事では更なる検証として、音ズレの具合を検証したいと思います。
これまでのお話
Zoomには大きく3種類の映像入力の方法「ビデオ」「第二カメラ(最適化なし)」「第二カメラ最適化あり」があります。
方法ごとに特徴がありますが、イベント内容に合わせて「第二カメラ」の2つを使い分けるのが良さそう、というのがこれまでの結論でした。
これまでの詳細は、以前の記事をご覧いただければと思います。
今回は音ズレの検証です
これまでは映像の面から検証をしてきましたが、今回は音声面からも検証をしたいと思います。検証するのは、映像入力の方法による音ズレの変化です。
前提として、音声は2つの入力方法「マイク」と「サウンドを共有」があります。これと映像入力の3種類を組み合わせて、それぞれの音ズレ具合を検証します。
検証結果
今回は音ズレ検証用の動画を使い検証を行いました。
細かいですが、OBSからZoomに映像・音声を入力し、別のPCのZoomで録画、そのファイルを動画編集ソフトで比較を行いました。どちらのPCも有線LANで接続をしています。
音声は仮想オーディオデバイスを経由していますが、それによる影響は1フレーム未満のようだったので無視しています。
この構成で、以下の5パターンを検証してみました。
①第二カメラ(最適化なし)+マイク入力
結果:33.3ms(約1フレーム)音が早い
②第二カメラ(最適化あり)+マイク入力
結果:966.7ms(約29フレーム)音が早い
③カメラ+マイク入力
結果:100ms(約3フレーム)音が遅い
④第二カメラ(最適化なし)+音声共有入力
結果:100ms(約3フレーム)音が遅い
⑤第二カメラ(最適化あり)+音声共有入力
結果:33.3ms(約1フレーム)音が早い
明らかにおかしい遅延量
まず「②第二カメラ(最適化あり)+マイク入力」の構成だけ遅延量がおかしいです。-966.7msだと音声が約1秒早いことになり、見ている人は強く違和感を覚える量です。
明らかにおかしいので、再起動・端末を変えて再検証も行いました。多少の違いはあったものの、これだけ遅延量が大きいのは変わりませんでした。
他の組み合わせは常識の範囲内なことを考えると、この組み合わせだけ何か不具合が起きているのではないかと疑っています。改善されるまでは「②第二カメラ(最適化あり)+マイク入力」を使わない方が良さそうです。
所感
異常な②以外の組み合わせは、差こそあれど、いずれも許容できる遅延量です。
以前に検証も行いましたが、早い方は90msまで、遅い方は185msまで人間は許容できるという文献もありました。②以外はその範囲を超えていません。
また、タイミングによって値も異なったので、今回の検証だけで①③④⑤のどれが良いかは決断ができないと思いました。むしろ、Web会議がしばしば音ズレしやすいことを思えば、そこまで意識しなくて良い差にも思います。
むしろ、インターネット回線については明確に影響がありそうです。上記は有線LANの検証でしたが、Wi-Fiで試すとどれも約1フレームの劣化が見られました。
なので、良好な回線で行うことは大事だと言えそうです。
次回はHDビデオの検証!
以上、Zoomの映像・音声の入力方法による音ズレ検証でした。
次回はZoomサポートへの依頼でONになる、HDビデオの品質を検証したいと思います。既にサポートが対応を完了してくれたので、その辺りも含めたお届けする予定です。
どうぞご期待くださいませ。