見出し画像

ComfyUI/Omost x モデルカード的な使い方について

はじめに

過去2回の記事で取り上げたOmostですが、個人的には思ったほど話題になっていないように感じます。私の記事もそれほど視聴数が伸びていません。

これは、OmostがChatGPT-DALLI3と同じような構造を持っているため、より高速で賢い方を選ぶという認識が多いことが一因かと思います。
しかし、すべてのAI絵師がGPTに移行しているわけではありません。これは、GPTでは表現できないものがあるからです。プロンプトに慣れているからという理由もあるでしょう。

Omostの可能性

私自身、Omostを少し触ってみた感想ですが、生成時間の問題はありますが、特にStable DiffusionでのAI絵の歴が長い人ほどOmostの可能性を感じると思います。

モデルカード的な利用方法について

さて、本題のモデルカード的な使い方についてです。

今回の記事は、SillyTavernで使用したモデルカード的なものをOmostに使ってみようという話です。SillyTavernはLLMを使用したチャットアプリで、チャット相手のキャラクターを任意で設定することができます。そのデータが記載されているモデルカードには、容姿や性格、対話形式などが設定されています。この設定をプロンプトに反映させるという話です。

画像生成における一流と二流の技術・視点の違い

私自身は画像生成を趣味として楽しんでいる2-3流レベルの人間ですが、通常の画像生成に関しては性格や設定がいらないと考えていました。
しかし、一流の方々はそういう設定を織り込んで練り上げて生成しているようです。

GPTに設定を作成してもらい、それを画像に反映させるプロンプトを生成する段階は非常に高度で手が出しにくいです。
この点をOmostが解決してくれるかもしれません。
二流のAI絵師も、一流に近づく可能性があります。

実際に試してみた

実際に試してみると、その違いを感じることができます。プロンプトでただ指示を出すのと、設定したキャラクターに動いてもらうのでは、感覚的な差が出てきます。例えば、「このすば」の「アクア」を取り上げてみます。以下のサイトに性格などが書いてありますので、これをGPTにまとめてもらいましょう。

アクアのキャラクター設定
外見
髪色とスタイル:水色の長い髪をポニーテールにしている
瞳の色:同じく水色
服装:青と白を基調とした巫女風の衣装、胸元には大きなリボン
装飾:頭には水の象徴であるティアラを着けている
性格
明るくおおらか:常に前向きで明るく振る舞う
自信家で自尊心が高い:自分が女神であることを誇りに思っている
ドジでおっちょこちょい:しばしばミスを犯し、トラブルメーカーになることが多い
人懐っこく感情豊か:感情が表に出やすく、泣き笑いが頻繁に見られる
能力
水を操る力:水を自在に操ることができる
浄化の力:死者を浄化し、悪霊を退ける能力
回復魔法:傷を治す力があり、仲間のサポート役
関係性
Kazuma:しばしば彼と口論するが、お互いに信頼し合っている
ストーリー背景
女神としての立場:異世界に召喚され、冒険者としての生活を送る
異世界での生活:日常的な困難やモンスターとの戦いに直面しながらも、明るく楽しく過ごす

Omostに投げるプロンプト
少女が、kazumaに向けて助けを呼んでいる。少女は性的な魅力あふれる服装をしている・・・。場所は、昼の京都のような場所。
以下の設定を踏まえてください
少女の名前:アクア
少女の外見
髪色とスタイル:水色の長い髪をポニーテールにしている
瞳の色:同じく水色
服装:青と白を基調とした巫女風の衣装、胸元には大きなリボン
装飾:頭には水の象徴であるティアラを着けている
少女の性格
明るくおおらか:常に前向きで明るく振る舞う
自信家で自尊心が高い:自分が女神であることを誇りに思っている
ドジでおっちょこちょい:しばしばミスを犯し、トラブルメーカーになることが多い
人懐っこく感情豊か:感情が表に出やすく、泣き笑いが頻繁に見られる
少女の能力
水を操る力:水を自在に操ることができる
浄化の力:死者を浄化し、悪霊を退ける能力
回復魔法:傷を治す力があり、仲間のサポート役
少女の関係性
Kazuma:しばしば彼と口論するが、お互いに信頼し合っている
少女のストーリー背景
女神としての立場:異世界に召喚され、冒険者としての生活を送る
異世界での生活:日常的な困難やモンスターとの戦いに直面しながらも、明るく楽しく過ごす

以下が生成結果になります。
おおらかな性格のせいか、半分以上R18的な画像になり、露出を抑えるためにネガティブプロンプトで調節しました。
また、使用LLMモデルについて詳しく知らないですが、今回のモデルの容量は大きく無いので複雑な日本語プロンプトは難しい可能性があります。
DeepLなどで英語に直して貼り付けた方が良い結果になる印象があります。

このように、Omostを活用することで、AIによる画像生成の可能性がさらに広がります。プロンプト設定の重要性を理解し、試行錯誤を繰り返すことで、自分の作品のクオリティを向上させることができます。

<蛇足的なもの>

NSFW系については以下のサイトのモデルカードを参考に作成すると楽かと思います。Sillytavernの際に使用したやつですね。
久しぶりにアクセスしたら、ログイン登録が必要になっていました。

以前紹介した時はemotion pack付がおすすめでしたが、今回の用途はモデルカードのみなので、好きなものを選ぶと良いです。

私はまだやっておりませんが、そのままコピペではなく、DeepLで欲しい表現を切り取って作成するのが良さそうな印象です。


この記事が気に入ったらサポートをしてみませんか?