カラオケ字幕付きの楽曲動画の作り方 その6-2(ボーカルカットソフトとマルチトラック動画の作成)
はじめに
カラオケ動画の作成にはオンボーカルが必要ですが、いざ歌うとなるとカラオケ音源(ボーカルカット,オフボーカル,インストゥルメンタルとも呼ばれる)が必要になります。
CDに付いているときは良いのですが、そうでないときはカラオケ音源を自分で作成する必要があります。
この記事では、まずボーカルカットのやり方を解説します。ここでは作成したカラオケ音源のことをボーカルカットと呼びます。
次に作成したボーカルカット音源とオンボーカル音源を1つのmp4の中で切り替えることができるマルチトラック動画の作成方法を解説します。
ボーカルカットとは
機械学習を活用したボーカルカットが登場する前は、音声波形編集ソフトのエフェクトを使ってインストゥルメンタルを抽出していました。
具体的にはL/R 両方のチャンネルに共通する周波数を維持または削除することで、ボーカルやインストゥルメンタル部分を抽出していました。
ただし抽出のクオリティは音源にかなり左右されますし、そもそものクオリティもあまり高くはありませんでした。
一方、Ultimate Vocal Remover GUIはAI(機械学習)による分離を行っており、抽出のクオリティはあまり音源に左右されず、きれいにボーカルカット音源が作成される印象があります。
ただ複数人で歌う曲は苦手なようでそこはDemucsの方が優秀に思えます。
以下の動画でそれぞれのボーカルカット音源を比較しています。
00:00 元音源
00:31 ボーカルカット Adobe Audition 2023
01:02 Spleeter
01:32 Demucs
02:03 UVR(v5:5_HP-Karaoke-UVR)
Ultimate Vocal Remover GUIのインストール方法
まずはリリースサイトにアクセスしてMain Doenload LinkからUVR_v5.5.1_setup.exeをダウンロードします。exeファイルをダブルクリックするとPCが保護されました画面が出るので詳細情報をクリックしてから、実行ボタンをクリックします。
同意してインストール場所を選んでインストールボタンをクリックします。
インストール時間はそこそこかかります。(私の環境では3分くらい)
Ultimate Vocal Removerの使い方
スタートメニューからUltimate Vocal Remover GUIを起動します。
画面中央左の
Select Inputで変換したい音声を選択。
Select Outputで書き出す場所を選択。
※wav以外のファイルを読み込むにはFFmpegのインストールが必要です
モデルのダウンロード
ここでボーカルカット作成に適したモデルをダウンロードします。
左下のスパナマークをクリックするとSetting Guideが開きます。右上のDownload Centerのタブを選択します。
VR Archにチェックを入れてNo Model Selectedをクリックするとダウンロードするモデルが選べます。VR Arch Single Model v5:5_HP-Karaoke-UVRというモデルをダウンロードします。
(全部のモデルの比較はしていませんが、5とすぐ下にある6を比較すると5の方がコーラスが残る印象で個人的には5の方が気に入りました)
ダウンロードマークをクリックするとダウンロードが開始されます。
ダウンロード後、Refresh Listボタンをクリックするとダウンロードしたモデルが表示されます
ボーカルカット音源の作成
デフォルトから変更した箇所は
CHOOSE PROCESS METHOD→VR Architecture
CHOOSE VR MODEL→5_HP-Karaoke-UVR
Instrumental Onlyのみチェック
※GPU Conversionを使用する場合には、8 GB の VRAM を搭載した Nvidia GPU が推奨されています。CPUでも8分で変換できました。
マルチトラック動画の作り方
ボーカルカット音源を作成したところで、動画にいれるためにツールをダウンロードします。
MP4ファイルと複数の音声を連結するためのソフト
MP4Box
Yamb (Yamb-2.1.0.0 beta 2)
MP4Boxの設定
変更点はないのでそのままインストールして大丈夫です
Yambでこの場所を読み込むので場所を覚えておいてください。
Yambの設定
Yambはインストールの必要はなくzipファイルを解凍すれば使えるようになります。
ただこのままでは使えないのでYambがMP4Boxを使えるように設定します。
Yambを起動しSettingをクリックして、右側のAdvanced Settings for Yamb~(中略)Mp4Box)をクリックします。
先程MP4Boxをインストールした場所を選択します。
マルチトラック動画の作成方法
Editingをクリックし右側のClick to join supported filesをクリックします。
Concatenation of Filesの画面になるのでオンボーカル動画とボーカルカット動画をドラッグ&ドロップします。
※wavファイルはサポートしていません。ボーカルカット音源は動画編集ソフトで一度書き出し直す必要があります。(ここではH.265 AAC 44.1kHz 32000kbpsで書き出しています。)
ボーカルカットに付いている動画はいらないのでチェックを外します。
On Voaclの音声ファイルを選び右のPropertiesボタンをクリックします。
Track nameにOn Vocalと入力してOKボタンをクリックします。
日本語ではなく英語で入力するほうが文字化けなどのトラブルが起きにくいです。
同様にボーカルカット音源もPropertiesを開いてTrack nameにVocal Cutと設定していきます。
Concatenation of Files画面に戻ったらNextをクリックします。これでオンボーカル音源とボーカルカット音源の2つが入ったマルチトラック動画が作成できました。
動画プレイヤーで確認
Windows標準の映画&テレビでも2トラックあることは確認できますが、Yambで入力したトラック名は確認できません。
そこでビデオプレーヤーMPC-BEをダウンロードします。
メニュー>再生>音声トラックからトラックの切り替えと先程入力したトラック名の確認ができます。
またMPC-BEの場合、動画再生中に「A」キーを押すことで音声を切り替えられます。
この記事が気に入ったらサポートをしてみませんか?