画像生成AIで難しい多義語をどう扱うか
みなさん、画像生成AI使っていますか???
便利なところと、意外と難しいところと、たくさんあるかと思います。
今回はそんな中でも特に難しいと感じる多義語の扱い方について紹介します。
昨日とあるコミュニティで話題になったものですが、
”ひよこのかわいいイラストが作りたい”
ができない。。
という話がありました。えっなんでと思うかもしれませんが、
ひよこは英語で" Chick "といいます。そして同時にこれは英語だと”若い女の子”の意味を持つ単語でもあります。
なので、何にも考えずに川沿いを走るひよこの画像を作ると。。。
めっちゃ女の子のイラストが出てきてしまいました。。。
これでは困る。ということで対処法を紹介します。
シソーラスを考える
シソーラスをご存知でしょうか。
これは言語学の専門用語なのですが、同義語や類義語を階層構造で定義したものになります。
例えばひよこのシソーラスを探します。
そうするとChickはAnimal youngに属して、関連ワードが出ていますね
もう一つ。
こちらではChickにはYoung bird とchildとYoung womanの3つの意味があって、類義語にはChickenやFledling,Nestlingの3つあるよーって教えてくれています。
はい。ということで、多義語のシソーラスを検索して、多義を避けた表現にすればいいんですね。
はい、どん。
簡単にひよこちゃんが生成できました。
なんでシソーラス?類義語でいいんじゃない?と思うかもしれません。
がいいたいことは階層的に考えるということなんですね。
ひよこは鳥に属しますし、鳥は生き物に属します。マインドマップのような形で言葉の類語、関係性を意識することが、画像生成においても重要です。
Negative Promptを活用
さて、これだけでひよこは生成できたのですが、もう1パターンご紹介。
この多義語の別の意味の言葉をNegative Promptで打ち消すやり方。
こんな感じで記載します。
baby Chick bird, running along the river --no child girl
Midjourneyでは--noに続いて単語を入れることで、その単語を生成の呪文から取り除くことができます。
こちらのPromptで出てきた画像がこちら
こちらでも無事ひよこができました。
ただ、女の子とひよこの画像とかはこの方法ではできないので別の単語で生成する必要がありますね。
さらに難しい問題です。
みんな大好きシマエナガ
何が問題なの?と思うかもしれませんが、シマエナガ。英語にするとLong-tailed long-tailed tit。これBannワードなんです。。(気になる方は調べて?)
ということで、生成できません。。。
さらにシソーラス。学名でAegithalos-caudatus-japonicus
こちらでもダメです。。
Image Promptを活用
こんな時に役立つのがシソーラスとImage Promptの活用。
シマエナガは白い鳥です。そして実際のシマエナガの画像。これを使います
生成された画像がこちら
はい。かわいい。
Image Promptと言って、画像のURLと呪文を組み合わせて生成する方法です。
生成するイメージに近い画像を用意しないといけないという手間はありますが、これでシマエナガっぽい鳥が生成できました。
Promptをいじればイラスト風もできますよー
ということで、今回は多義語でイメージ通りに生成できない時はシソーラスを考えよう!というお話でした。
ではまた!