見出し画像

Promptで画像加工できるテンセントのPhotoMakerのGoogleColabにおける使い方

HuggingFaceのSpaceで、1位になっていたPhotoMakerをGoogle Colab経由でGradioで動かす方法を紹介していきます。

Tencentという中国系の巨大IT企業が作っています。

指定した画像をベースにPromptで指示できる仕組みとなっています。

HuggingFaceのデモページで試せるのが手間が少なくて良いですが、利用者が多いので使えないので、Google Colabで実行していきます。

GitHubページは以下です。


今回は、Google ColabのA100を使用します。

!git clone https://github.com/TencentARC/PhotoMaker.git
%cd PhotoMaker
!pip install -r requirements.txt
!pip install git+https://github.com/TencentARC/PhotoMaker.git

次に、GradioをPublic URLで使用するために、/content/PhotoMaker/gradio_demo/app.pyを修正します。

app.pyの最後の行を下記のようにShare=Trueにします。


app.pyの修正

最後に、次を実行します。

!python gradio_demo/app.py

実行ログの最後の方に書かれているRunnning on public URLをクリックすると、次の初期画面が出てきます。


初期画面

使い方は、下記のように左枠に画像を指定します。次に、Promptと書かれているところに、どうしたいのかを書いてSubmitをクリックします。


アイアンマン風のサングラスをかけた感じにしてくださいというPromptです。

Submitをクリックしますと、右側に画像が作成されます。


生成された画像


今度は、アイアンマン風ではなくバットマン風にしてくださいとPromptで指示してみます。


バットマン風のPromptの場合

いいなと思ったら応援しよう!