DeepSpeed Chat by Docker
導入手順
Ubuntu 18.04または20.04をインストールします。
NVIDIA GPUドライバをインストールします。
NVIDIA Dockerをインストールします。
Dockerイメージをビルドします。
Dockerコンテナを起動します。
以下に、各手順の詳細を説明する。
Ubuntu 18.04または20.04をインストールする
Ubuntu 18.04または20.04のISOファイルをダウンロードし、USBドライブに書き込みます。
USBドライブから起動し、Ubuntuをインストールします。
NVIDIA GPUドライバをインストールする
NVIDIAのWebサイトから、NVIDIA GPUドライバの最新バージョンをダウンロードします。
ダウンロードしたファイルを実行し、NVIDIA GPUドライバをインストールします。
NVIDIA Dockerをインストールする
NVIDIA DockerのGitHubリポジトリから、NVIDIA Dockerの最新バージョンをダウンロードします。
ダウンロードしたファイルを実行し、NVIDIA Dockerをインストールします。
Dockerイメージをビルドする
DeepSpeed ChatのDockerfileが含まれるGitHubリポジトリから、Dockerfileをダウンロードします。コマンドライン、
docker build -t deepspeed-chat .
Dockerコンテナを起動する。
docker run --gpus all --rm -it deepspeed-chat
DeepSpeedChat対応モデル
2023.4.16 時点のDeepSpeedChat対応モデル。
facebook-opt
bloom
gpt_neox
gpt2
codegen
現時点での今後の強化項目
LLaMA モデル対応
ZeRO-offload対応
DeepSpeed-RLHFの汎用化とRLalgorithm関連強化
自動システム最適化
感想
Installで何度も躓き、動くまでにかなりの根気が必要だった。つまずいた点をいくつか下記に示す。
Dockerfile 指定のubuntuが18であり、様々なライブライが未対応。結局、ubuntu20.04LTSに置き換えた。
python module not found が出たものについては、Dockerfileにpip install xxを追加。packages等
proxy 設定と ssl certificate 対応。Firewall配下だと仕方ない。
git-lfsが必要で、apt でインストール。repository のDockefileに追加。
対応モデルが少なく、手元にあったモデルは未対応だった。小さめのopt-125mで動作確認。
動作確認をopt-125mで実施した。How are you? 程度ならI'm fine. と答えてくれるが、それ以上は難しい。もう少し大きめのモデルを使わないと厳しい。
最後に
お試しマシンのGPUが古く、速度的な評価はできないが、OPT125Mであれば、ほぼ問題ない時間で返事が返ってくる。雰囲気的には、出力が始まるのは1秒未満。モデルサイズとGPUにより反応速度が変わるため、OPT66B +DGX/H100x8辺りで試してみたい。簡単には借りられないが。
以上