画像生成AIで太田道灌・山吹の里伝説を再現

2023年11月27日 23:45

1 はじめに

　太田道灌の山吹の里伝説というものがあります。

ある日、鷹狩に出かけた道灌はにわか雨に遭い、蓑を借りようと農家に立ち寄った。出てきた娘は花が咲いた一枝の山吹を差し出すのみであり、彼女の意図を理解できなかった道灌は、蓑を借りようとしたのに花を出されたことに立腹しながら帰宅した。後でこの話を家臣にしたところ、それは兼明親王の歌「七重八重花は咲けども山吹の実の一つだになきぞ悲しき」（『後拾遺和歌集』所載）に掛けて、山間（やまあい）の茅葺き（かやぶき）の家であり貧しく蓑（実の）ひとつ持ち合わせがないことを奥ゆかしく答えたのだと教わった。道灌は古歌を知らなかった事を恥じて、それ以後は歌道に励み、歌人としても名高くなったという。

Wikipedia 太田道灌より

　太田道灌に山吹を差し出した娘の名前は「紅皿」といいます。さて、ここでは画像生成AIのDall-E を使って、この伝説に出てくる「紅皿」を再現してみようとおもいます。

　余談ですが、当職が作成したキー配列エミュレーションソフトウエア「紅皿」は、この逸話が元となっています。

https://qiita.com/kenichiro_ayaki/items/03ac81a20137c3d91554

数年前に使っていた「やまぶき」というソフトウエアの仕様にできるだけ近づけ、かつ適用できる対象を広げたため、この名前にしています。ここで紅皿の再現イメージを作成して、ソフトウエアのバージョンダイアログにでも付けようという考えです。

2 画像生成AI Dall-E の呼び出し方

（１）Microsoft Edge からBing Chat を呼び出します。以下をクリックしてください。
　　　GPT-4 を搭載した Bing チャット
（２）新しいトピックに「画像生成してください。（キーワード群）」を入力します。
（３）「それを作成しようとしています」のプロンプトの後、「画像が生成されています」と表示されたならば、暫く待ったのちに画像が生成されます。

（４）生成された画像のサムネイルをクリックすると、Bing のImage Creator が表示され、ダウンロード可能になります。

（５）上記を３０回くり返すと、現行のトピックは終了です。必要に応じて「新しいトピック」ボタンをクリックしてください。

3 生成結果とその課題

・以下のように、写真風の画像はAI臭がすごいです。やむを得ず、「マンガ風」のキーワードで生成しました。

・Dall-E は「山吹」のキーワードが花を示すことを理解していません。よって、「黄色い花」のキーワードとしたのですが、副作用として菜の花やハイビスカスの画像か多量に生成されました。

・「雨の庭」のキーワードから、７割がたの画像では傘をさしていました。「傘無し」などの「除くキーワード」を入れてみましたが効かないようです。
・なお、下の画像では、傘をどうやって持ってるんですかね。構造的におかしい画像がときどき生成されます。

・「和服」は、"kimono" と翻訳されたせいか、やたらと高価そうな服です。蓑が無い貧乏くらしなのだから、これはおかしいです。「貧乏な」「質素な」などのキーワードをつけましたが効かないようです。なお、和服を指定したせいか、日本人以外の人種の画像は生成されませんでした。

・複数人がいつの間にか登場するので、「独り」のキーワードを付与しました。

・殆どの画像にて、髪に花をあしらっていました。花を指定したせいだとおもいます。

・「紅皿が山吹を差し出す」というのを再現したかったのですが、なかなかうまく差し出してくれませんし、差し出したとしても傘をさしていたりします。以下は差し出してくれていますが、こんな微笑んだ表情ではないのでは？

・キャラクターの顔を固定させたかったのですが、bing-chat から呼び出す際の方法がわかりませんでした。なお、OpenAI社のHPから Dall-E を呼び出すならば、シード値を取得することで、キャラクターの顔を固定できるようです（未確認）。

・以下の画像では、「花が咲いた一枝の山吹を差し出すのみ」の筈が、ブーケでもできそうなほど摘んでいます。

・こちらもです。しかし高そうな着物を着て土砂降りの中に・・・。

・モノクロだとちょっと雰囲気あります。それに、モノクロだと着物が高価なものに見えないですし。

・「蓑を借りようと農家に立ち寄った」とのことですが、農家というより武家屋敷のように見えます。

・「花が咲いた一枝の山吹を差し出すのみ」には合っていますが、いまいち表情に違和感があります。「憂鬱な」のキーワードを付与した方がよいようです。

・「憂鬱な」のキーワードが効いたのか表情はOKです。せっかく偉い武士の方がお見えになったのに貸せる蓑がないということで、憂鬱な顔だったのではという想像です。

・一輪の山吹の花で憂鬱そうなのですが、これを差し出してくれればOKだったのですが・・・。

・あやまって、菜の花が生成されてしまいました。あと、流石に雨の庭には座らないと思うのです。

・これも山吹の花束です。「一輪の」のキーワードを付けても、なかなかうまく生成してくれませんでした。

3 おわりに

　Bing Chat から呼び出せるDall-E は、OpenAI社のHPから呼び出せるDall-E よりも制約が多いようです。しかし、これだけ高品質なイラストを生成してくれるにも関わらず、無料であり敷居が低いため、画像生成AI の使用感を知るためにはよいのではないかとおもいます。
　上記の細かな欠陥も、イラストレータならば簡単に修正できるほどの軽微なものです。つまり、イラストレータが自身の作業を高速化するために画像生成AIを使うと、その真価を発揮するのではとおもいます。