WSL2でOmniGenを試してみる
「マルチモーダルプロンプトから幅広い画像を生成できる統合画像生成モデル」らしいOmniGenを試してみます。
使用するPCはドスパラさんの「GALLERIA UL9C-R49」。スペックは
・CPU: Intel® Core™ i9-13900HX Processor
・Mem: 64 GB
・GPU: NVIDIA® GeForce RTX™ 4090 Laptop GPU(16GB)・GPU: NVIDIA® GeForce RTX™ 4090 (24GB)
・OS: Ubuntu22.04 on WSL2(Windows 11)
です。
1. 準備
環境構築
python3 -m venv omnigen
cd $_
source bin/activate
リポジトリをクローンして、インストールします。
git clone https://github.com/VectorSpaceLab/OmniGen
cd OmniGen
pip install -e .
app.py実行に必要となるパッケージを追加でインストールします。
pip install gradio spaces
2. 試してみる
app.pyを実行してみましょう。
CUDA_VISIBLE_DEVICES=0 python app.py
起動してくるまでのログがこちら。必要なモデルのダウンロードも自動で行われます。やさしい、ありがたい。
special_tokens_map.json: 100%|█████████████████████████████████████████████████████████████████| 670/670 [00:00<00:00, 8.92MB/s]
.gitattributes: 100%|██████████████████████████████████████████████████████████████████████| 1.57k/1.57k [00:00<00:00, 33.9MB/s]
tokenizer_config.json: 100%|███████████████████████████████████████████████████████████████| 10.1k/10.1k [00:00<00:00, 82.4MB/s]
README.md: 100%|███████████████████████████████████████████████████████████████████████████| 7.60k/7.60k [00:00<00:00, 16.3MB/s]
config.json: 100%|█████████████████████████████████████████████████████████████████████████| 3.29k/3.29k [00:00<00:00, 74.5MB/s]
demo_cases.png: 100%|██████████████████████████████████████████████████████████████████████| 3.42M/3.42M [00:00<00:00, 19.8MB/s]
vae/config.json: 100%|█████████████████████████████████████████████████████████████████████████| 607/607 [00:00<00:00, 6.98MB/s]
tokenizer.json: 100%|██████████████████████████████████████████████████████████████████████| 1.85M/1.85M [00:00<00:00, 2.32MB/s]
diffusion_pytorch_model.safetensors: 100%|███████████████████████████████████████████████████| 335M/335M [00:14<00:00, 23.8MB/s]
model.safetensors: 100%|███████████████████████████████████████████████████████████████████| 15.5G/15.5G [06:37<00:00, 39.0MB/s]
Fetching 10 files: 100%|████████████████████████████████████████████████████████████████████████| 10/10 [06:37<00:00, 39.80s/it]
Loading safetensors100%|██████████████████████████████████████████████████████████████████▉| 15.5G/15.5G [06:37<00:00, 33.0MB/s]
* Running on local URL: http://127.0.0.1:7860
To create a public link, set `share=True` in `launch()`.
ブラウザで 127.0.0.1:7860 にアクセスします。
下部にスクロールするとサンプルがいくつかあります。こちらを使って生成してみましょう。3つ目のサンプルを選択して、Generate Imageボタンを押下します。
生成されたものがこちら。
生成にかかった時間は丁度2分でした。
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [02:00<00:00, 2.42s/it]
VRAMは、23.0GBほどです。
おまけ
ルカン先生とイーロンマスクさんで乾杯。