見出し画像

PyTorch2.5.0をソースからビルドしてインストールしましたが

 タイトルの通りですが、ComfyUIのマニュアル版で画像生成をするためにCUDA12.4対応のPyTorch(nightly)をソースからビルドとインストールしてComfyUIで認識させました。
 
 pythonのバージョンを3.10.14から、python3.12.5に上げて、pytorchをソースからクローン、ビルドとインストールして、ようやくcomfyuiで認識して、上記の画像のとおり生成まできるようになりました。
 
 ソースからクローン、ビルド後インストールしたpytorchが何度やってもpythonインタプリタで認識されないのを繰り返していたのですが、やっと認識されたので安心しました。
 

nightlyバージョンだと、2.5.0a0+gitdb707c9がインストールされました

 

 最初、普通にpip install -r requirements.txtでインストールさせた時は、torchvisonがpytorch2.5.0a0+gitdb707c9をアンインストールして、cuda非対応のtorch2.4.0をインストールさせてくるので、表記が出た瞬間にctrl+cでキャンセル。
 結局、pytorchのインストール後にcomfyuiの依存関係で、torchvisionと、torchaudioが互換性の問題が出たため、再度2つをソースからビルドしてインストールさせました。
 

 ソースからビルドして、インストールさせたtorchaudioと、torchvisionのバージョンがこのようになり、再度pip install -r requirements.txtで依存関係を確認しましたがエラーが出なかったので完了でよかったと思うのですが、改めて見るとインストールさせるtorchaudioとtorchvisionのバージョンがミスっているような気がする。特にtorchvisionのバージョンが0.20.0a~~というのが気になる。これが正しいのか分かる方いたら教えてください。

 

 依存関係のエラーがでなくなったので、comfyuiのマニュアル版を起動させてみて、pytorch2.5.0a0+gitdb707c9が認識されて問題なく起動できました。起動後1回目の画像生成した際の時間は32.61s、2回目1.91sとエラーなく画像生成しました。
 
 あとは、xformers、flash attention、stable fast等と機能統合が出来るか試してみようと思います。

 とりあえず、xformersもソースからクローンと、ビルドしてインストールしてみました。もっと調整が必要ですが、インストール後に初期モデルのv1-5-pruned-emaonly.ckptで、画像を1枚作成しました。

W512×L720サイズ

ポジティブ、1women,smile,blond hair
ネガティブ、bad anatomy
バッチ20 
生成時間 2.31s

 〇構図と目、隠した手の描写、服のクオリティが気になる画像だったの
で、まだまだ色々とインストールしたり、調整したりして、ベストな画像を作れるように目指します。次は、stable fastがpytorchとxformersに統合できるかをやってみます。
 
 また、xformersをビルドしたときにflash attentionライブラリが自動的に作成と機能統合されていたみたいなので、これを有効化する方法を今度は調べないといけないかな


 

この記事が気に入ったらサポートをしてみませんか?