まっさらなGPUマシンにUbuntu、CUDA、cuDNNをインストールしてPyTorchを動かすまでの話
東大松尾研の公開寄附講座であるDeep Learning 基礎講座の最終課題向けに、GPUマシンを貸与して頂けるとのことで、ありがたくお借りして一通りのセットアップをしました。もしかするとそう遠くない将来に自分でもGPUマシンを買ってしまいそうな気がするので、その時向けにメモとしてここに残しておきたいと思います。
こちらの記事の位置づけとしては、基本的には色々な記事を参照させていただきながらセットアップしましたので、そちらを掲載させていただきながら差分だけ補足していくような記事になります。(大変有用な記事を残してくださった皆様、本当にありがとうございます!)
GPUマシン
今回お借りしたマシンはこちらです。
GPUはNVIDIA GeForce GTX 1070です。GPUマシンと言えばゴツイ筐体のものしか知らなかったので、こんなにコンパクトな製品があることに驚きました。私はINCASEのバックパックを使っているのですが、MacBook Proが入った状態で手前のスペースに入れて持ち運び可能でした。
自分用にもちょっと欲しいなと思ったのですが、日本での販売代理店ではラインナップがかなり限られているようでした。
OSインストール
まずはOSインストールです。と言うわけでまずはこちらの公式サイトから。
今回はUSBからUbuntuをインストールすることにしましたので、こちらの記事を参考にUbuntuをUSBに入れました。
Ubuntuはこちら。
ただ、私は起動ファイル作成にはこちらを利用しました。実は最初ただのisoファイル(起動用でない)をUSBにコピーして起動を試みてしまい、起動しないもんだからしばらくあれなんで?っなってました・・・こんなセットアップするのたぶん10年ぶりぐらいだったもので・・・
あとは普通にインストーラの指示に従っていけばUbuntuはあっさり入りました。
ここでいきなりPyTorchを入れてGANのモデルを回してみたのですが、CPUだった頃と速度がそれほど変わりません。そこでGPUを正しく利用できているのか確認してみると…
>> import torch
>> torch.cuda.is_avaialble()
False
ですよね、何も設定してないですもんね。続いてPyTorchからGPUを利用するための設定です。
CUDA、cuDNNの設定
差分としては、NVIDIAのドライバのバージョンを10.0を利用しました。また、以下のコマンドは順序に依存関係があり、以下の順番で実行するとうまくいきました。
$ sudo dpkg -i libcudnn7_7.5.0.56-1+cuda10.0_amd64.deb
$ sudo dpkg -i libcudnn7-dev_7.5.0.56-1+cuda10.0_amd64.deb
$ sudo dpkg -i libcudnn7-doc_7.5.0.56-1+cuda10.0_amd64.deb
途中、解像度がだいぶアレな感じになってちょっと不安になりますが、ドライバ入れれば元に戻るので大丈夫です。このあと、再度PyTorchからGPUを利用できる状態になったか確認すると、
>> import torch
>> torch.cuda.is_avaialble()
True
よしきたー!と言うわけで再度GANのモデルを回してみたら Iteretionひとつの所要時間がCPUに比べて1/30ぐらい(1分半→3秒)になっていて、GPUの威力を思い知りました。本当にGPUマシン個人用に欲しいです。圧倒的な生産性の違いがありますね。
GPUモニタリング
学習中のGPUマシンの温度が結構熱くなってきて気になったので、こちらのコマンドで確認しました。
にしても本当にこちらで紹介させて頂いた記事のおかげでどん詰まることなくスムーズに環境構築できました。環境構築の所要時間は調べながらで3時間ぐらいだったと思います。多分今同じ作業やれば小1時間ぐらいで終わらせられると思います。
おまけ
海外Amazonから買ってる人いました。ううう・・・買いたい・・・
この記事が気に入ったらサポートをしてみませんか?