![見出し画像](https://assets.st-note.com/production/uploads/images/157493078/rectangle_large_type_2_2ffdd1ff50b855a45c34081b3be2389c.png?width=1200)
【ローカルAI生成】こっち向かないポートレート【ツール組み合わせ】
はじめに
AIツールを組み合わせたやり方でポートレート画像を生成します。無料(オープンソース)のローカルAI生成ツールのみを利用します。
画像プロンプト生成
LLMにお願いしてプロンプトを生成します。やり方は様々あると思いますが、今回はOpen WebUIライブラリに登録されているプロンプト・ジェネレータ「Stable Diffusion Image Generator Helper@michelk」を利用してみます。
かなり作り込まれたジェネレータですね。(プロンプトカテゴリでは一番人気でした)
![](https://assets.st-note.com/img/1728583055-dgVQnP3RribYUtCjpN0ql2hK.png?width=1200)
Open WebUIの導入方法(Windows)は下記事で紹介しています。
Open WebUIライブラリから(ダウンロード、またはコピペ)導入後、プロンプト入力欄にスラッシュ「/」を打ち込むと、プロンプトのショートカット一覧から選択できるようになります。「/stable」と入力すると「Enter」のみで登録されたプロンプトが入力されます。
![](https://assets.st-note.com/img/1728583340-SXQWay1BT0fKCzOr5pdj2Zvm.png?width=1200)
入力後に「Tab」キーを押すと、変数へフォーカスが移ります。
![](https://assets.st-note.com/img/1728583605-VcU3Zn8TMSw0LIKqE1z9krJx.png?width=1200)
ここに指示を記入します。「赤いドレスを着た美女」とします。実行すると、詳細な指定を聞いてきます。
![](https://assets.st-note.com/img/1728583784-14uLBkb3Catc7ZvwAD6JUnrd.png?width=1200)
特に指定しない場合は「GO」を入力すると、最終的なプロンプトを(複数)得ます。
![](https://assets.st-note.com/img/1728583954-oFjrZTtgAIkP4Lb1BHn9zEVm.png?width=1200)
モデルはローカルの特権である脱獄モデルを利用します。ポリコレや変な規制を避ける事ができます。※ もちろん利用は自己責任です
画像の生成
Stable Diffusion WebUI forgeを利用します。
![](https://assets.st-note.com/img/1728584904-fKGSOVuzhQ8pBli9gRyeWkUA.png?width=1200)
日本系の顔にするため、アップスケールも含めて、アジア系SD1.5のモデルでimg2imgします。
![](https://assets.st-note.com/img/1728585080-K18AahvnmUFTM3HQ4RO6ZxuN.jpg?width=1200)
顔をあっちに向ける
顔の方向を変えるために、FacePokeを利用します。
FacePokeで扱いやすいように、Gimp等で画像をトリミングします。注意点ですが、トリミングした画像は、jpgで保存した方がトラブルが少ないようです。※ たぶんAlpha値入りの画像でエラーが出るようです
![](https://assets.st-note.com/img/1728585294-ABdRIc01w6xtlFJvSuf4rnpo.jpg)
トリミングした画像をFacePokeで読み込み、マウスでグリグリして顔の角度と表情を変えます。
![](https://assets.st-note.com/img/1728585717-Fjo4AmGlnYXTydrh3twqf9LM.png?width=1200)
表情が決まれば画像をダウンロードして保存します。
Gimp等で再合成します。雑コラ程度の精度で構いません。
![](https://assets.st-note.com/img/1728585825-HqOk263rbZWixVFlTKsvyIza.jpg)
仕上げ
FacePokeを利用すると、どうしても解像感が落ちてしまうので、仕上げとして、頭部付近を軽くインペイントします。雑コラ違和感も無くなります。同じSD1.5モデルでdenoising strengthを0.25程度にします。
※ FacePokeで作った表情をより正確に残したい場合は、ControlNet(Depth/canny)を利用すると、より強く画像の一貫性を得られます。
![](https://assets.st-note.com/img/1728585943-XiKgb6HNAmcE2f8kWzFdsq5y.png?width=1200)
![](https://assets.st-note.com/img/1728586059-DGdnOARPW9YieNzSaCvFM785.jpg?width=1200)
以下、関連する記事の【PR】です。