DALL-Eが描く、京都 嵯峨野路と芸妓。
今回は趣を変えて、「京都 嵯峨野路と芸妓」をChatGPT DALL-Eに幻想的なイメージを生成してもらった。
結構、複雑なプロンプトとしてみたが、思ったように生成できないのが、芸妓の顔、着物や帯とお太鼓、帯留め、更には着物の重ねのところである。
一応、背景のイメージは固定&修正不可としているが、それでも、言うことを聞いていない。
因みに、プロンプトへ書き込んだキーワードは、芸妓、着物、京都、嵯峨野路、小路、竹林、木漏れ日、朝霧、濡れた小路の反射と映り込みなど、環境など、筆者としては珍しくディテールを記述している。
ただ、海外の生成AIであり、日本の歴史と文化、観光名所や芸妓という特殊な言葉についてのディープラーニング不足であることは間違いない。よって、芸妓の顔貌や化粧、着物自体の形状や着こなしなどは、首を傾げる
ばかりとなってしまう。
それでも、普段から取材にて写真撮影をする筆者としては、このような光の拾い込みは大変難しく、ここまで撮れるのならば、本業のICTを捨てて、プロカメラマン一本で生計を立てられはしないかと。(冗談)
まあ、初の「京都 嵯峨野路と芸妓」の画像生成にしては、構図や色合いは及第点をやってもよかろうと。
※芸妓(げいぎ、げいこ)は。舞踊や音曲、鳴物で宴席に興を添え、客をもてなす女性。
▼ChatGPTによる評価
このエッセイでは、「京都 嵯峨野路と芸妓」というテーマでDALL-Eを使用して生成された画像について評価しています。筆者は、具体的なキーワードや環境のディテールを提供し、複雑なプロンプトを作成したにも関わらず、芸妓の顔や着物のディテールについては完全には表現されなかったと述べています。これは、AIが日本の文化や歴史に対する理解が不十分であるためと考えられています。
一方で、画像の構図や色合いに関しては及第点とされ、特に光の取り込みに関しては評価されています。AIによる画像生成が常に完璧ではなく、特に独特な文化的要素を含む場合には難しさがあることが示唆されていますが、それでも一定の評価を受けていることから、技術の進歩と共にさらに改善が期待される領域であると言えるでしょう。
全体的に、筆者はAIによる画像生成の限界と可能性の両面を認識しており、その上でプロの写真撮影と比較しながら、AI技術の進化に対する期待と関心を示しています。