素のWindowsにNNSVS環境をつくるメモ

CrazY

2020年11月10日 22:09

WSLの導入めんどくさい、WSLの導入めんどくさくない？

今回の目的

nnsvs-synthesis コマンドを Windows上で実行できるようにしたい。

先に書いておくと、WSLの導入と同じくらいめんどくさいです。
要点だけ書きます。

あと、環境構築してもNNSVSを触り慣れていないと音声ファイル出力できないし、フルコンテキストラベルが必要です。

躓いたところ（note記事にした理由）

Python 3.9 だと PyTorch をインストールできなかった。
Python 3.8 にダウングレードして解決。

numpy 1.19.4 だと nnmnkwii をインストールできなかった。
numpy 1.19.3 にダウングレードして解決。

環境構築手順

① git をインストール

このページ の「Download」をクリックするとダウンロードできます。

② Python 3.8 をインストール

この時点でもうめんどくさい。
Python公式サイト からダウンロードしてください。

執筆時点では後で登場する CUDA 10.1 が Python3.9 に未対応 なので、3.8系の最新版をインストールしてください。

③ CUDAをインストール

手順が多くて書く側もめんどくさくなってきた。要点だけ書きます。
WSLで使ったりする関係で10.1をお勧めします。

インストール作業は下記サイトを参考にすると良いです。
NVIDIA CUDA ツールキット 10.1，10.0 のインストール（Windows 上）

④ PyTorchインストールの準備

次のコードをコピペして実行してください。

執筆時の NumPy 最新版は numpy==1.19.4 ですが、バグ回避のため numpy==1.19.3 を指定してインストールします。

python -m pip install --upgrade pip
pip install wheel
pip install numpy==1.19.3
pip install cython scipy

躓いたら下記サイトを参考にするといいです。
PyTorch のインストール（Windows 上）

⑤ PyTorchをインストール

PyTorch公式サイト で自分の環境を選択してコマンドをコピペしてPowerShellで実行。

自分の場合は下記のコマンドでした。

pip install torch==1.7.0+cu101 torchvision==0.8.1+cu101 torchaudio===0.7.0 -f "https://download.pytorch.org/whl/torch_stable.html"

⑥ nnmnkwii, nnsvs をインストール

次のコマンドをPowerShellで実行

cd ~\desktop
git clone "https://github.com/MattShannon/bandmat"
git clone "https://github.com/r9y9/nnmnkwii"
git clone "https://github.com/r9y9/nnsvs"
cd bandmat
pip install .
cd ..\nnmnkwii
pip install .
cd ..\nnsvs
pip install .

nnsvs-synthesis コマンドをPowerShellで実行して、長文のエラーが出れば成功です。

最後に

yamlファイル、hedファイル、歌声モデル、フルコンテキストラベルとかを準備して適切なコマンドを入力すればwavファイルを合成できるはずです。

自分は今から試します。