画像生成AIで太田道灌・山吹の里伝説を再現
1 はじめに
太田道灌の山吹の里伝説というものがあります。
太田道灌に山吹を差し出した娘の名前は「紅皿」といいます。さて、ここでは画像生成AIのDall-E を使って、この伝説に出てくる「紅皿」を再現してみようとおもいます。
余談ですが、当職が作成したキー配列エミュレーションソフトウエア「紅皿」は、この逸話が元となっています。
https://qiita.com/kenichiro_ayaki/items/03ac81a20137c3d91554
数年前に使っていた「やまぶき」というソフトウエアの仕様にできるだけ近づけ、かつ適用できる対象を広げたため、この名前にしています。ここで紅皿の再現イメージを作成して、ソフトウエアのバージョンダイアログにでも付けようという考えです。
2 画像生成AI Dall-E の呼び出し方
(1)Microsoft Edge からBing Chat を呼び出します。以下をクリックしてください。
GPT-4 を搭載した Bing チャット
(2)新しいトピックに「画像生成してください。(キーワード群)」を入力します。
(3)「それを作成しようとしています」のプロンプトの後、「画像が生成されています」と表示されたならば、暫く待ったのちに画像が生成されます。
(4)生成された画像のサムネイルをクリックすると、Bing のImage Creator が表示され、ダウンロード可能になります。
(5)上記を30回くり返すと、現行のトピックは終了です。必要に応じて「新しいトピック」ボタンをクリックしてください。
3 生成結果とその課題
・以下のように、写真風の画像はAI臭がすごいです。やむを得ず、「マンガ風」のキーワードで生成しました。
・Dall-E は「山吹」のキーワードが花を示すことを理解していません。よって、「黄色い花」のキーワードとしたのですが、副作用として菜の花やハイビスカスの画像か多量に生成されました。
・「雨の庭」のキーワードから、7割がたの画像では傘をさしていました。「傘無し」などの「除くキーワード」を入れてみましたが効かないようです。
・なお、下の画像では、傘をどうやって持ってるんですかね。構造的におかしい画像がときどき生成されます。
・「和服」は、"kimono" と翻訳されたせいか、やたらと高価そうな服です。蓑が無い貧乏くらしなのだから、これはおかしいです。「貧乏な」「質素な」などのキーワードをつけましたが効かないようです。なお、和服を指定したせいか、日本人以外の人種の画像は生成されませんでした。
・複数人がいつの間にか登場するので、「独り」のキーワードを付与しました。
・殆どの画像にて、髪に花をあしらっていました。花を指定したせいだとおもいます。
・「紅皿が山吹を差し出す」というのを再現したかったのですが、なかなかうまく差し出してくれませんし、差し出したとしても傘をさしていたりします。以下は差し出してくれていますが、こんな微笑んだ表情ではないのでは?
・キャラクターの顔を固定させたかったのですが、bing-chat から呼び出す際の方法がわかりませんでした。なお、OpenAI社のHPから Dall-E を呼び出すならば、シード値を取得することで、キャラクターの顔を固定できるようです(未確認)。
・以下の画像では、「花が咲いた一枝の山吹を差し出すのみ」の筈が、ブーケでもできそうなほど摘んでいます。
・こちらもです。しかし高そうな着物を着て土砂降りの中に・・・。
・モノクロだとちょっと雰囲気あります。それに、モノクロだと着物が高価なものに見えないですし。
・「蓑を借りようと農家に立ち寄った」とのことですが、農家というより武家屋敷のように見えます。
・「花が咲いた一枝の山吹を差し出すのみ」には合っていますが、いまいち表情に違和感があります。「憂鬱な」のキーワードを付与した方がよいようです。
・「憂鬱な」のキーワードが効いたのか表情はOKです。せっかく偉い武士の方がお見えになったのに貸せる蓑がないということで、憂鬱な顔だったのではという想像です。
・一輪の山吹の花で憂鬱そうなのですが、これを差し出してくれればOKだったのですが・・・。
・あやまって、菜の花が生成されてしまいました。あと、流石に雨の庭には座らないと思うのです。
・これも山吹の花束です。「一輪の」のキーワードを付けても、なかなかうまく生成してくれませんでした。
3 おわりに
Bing Chat から呼び出せるDall-E は、OpenAI社のHPから呼び出せるDall-E よりも制約が多いようです。しかし、これだけ高品質なイラストを生成してくれるにも関わらず、無料であり敷居が低いため、画像生成AI の使用感を知るためにはよいのではないかとおもいます。
上記の細かな欠陥も、イラストレータならば簡単に修正できるほどの軽微なものです。つまり、イラストレータが自身の作業を高速化するために画像生成AIを使うと、その真価を発揮するのではとおもいます。