見出し画像

写真素材の生成AIによる再現(呪文あり)

1.はじめに

 ChatGPT 4o で動作する GPT である Manga Draw Color によって、現実の写真がどこまで再現できるかを試してみました。

対象としたのは無料の写真素材・AI画像素材「ぱくたそ」の写真素材です。モデルがすべて茜さやさん(@sayahana1)なのは、おなじモデルの方がプロンプトをチューニングしやすいためです。

2.作例

2.1.「そろそろ時間だから行こっか」の無料写真素材

「ぱくたそ」 「そろそろ時間だから行こっか」の無料写真素材(モデル:茜さや)

 この写真を ChatGPT 4oに読み込ませて内容を説明させました。以下がその説明文です。

この写真は、カフェかオフィスのような環境でノートパソコンを使っている若い女性を捉えています。彼女は横縞のシャツと紺色のカーディガンを着用しており、肩にはグレーのバッグをかけています。手にはスマートフォンを持ち、カメラに向かって微笑んでいます。彼女の髪は長くて茶色がかっており、カーリーにスタイリングされています。背景には木製のテーブルとノートパソコン、そしてカップが置かれているのが見えます。このシーンは、現代の都市生活を象徴しているかのような、落ち着いた雰囲気を持っています。

 この説明文をもとに以下のプロンプトを作成しました。追記した部分を太文字で示します。

2020年代の少女漫画風で、カフェでノートパソコンを使っている若い日本人女性を描いて。彼女は横縞のシャツと紺色のカーディガンを着用しており、肩にはグレーのバッグをかけています。手にはスマートフォンを持ち、カメラに向かって微笑んでいます。彼女の髪は長くて茶色がかっており、カーリーにスタイリングされています。背景には木製のテーブルとノートパソコン、そしてカップが置かれているのが見えます。

 これによって生成したのが以下のイラストです。同様なモチーフが出てくるだけで、それなりに写真の雰囲気が再現できています。
 なお、バッグの紐を被写体に斜め掛けさせたくて、繰り返しトライしたのですが、成功しませんでした。

Manga Draw Color  による再現

2.2.ひとつだけならあげてもいいよの無料写真素材

「ぱくたそ」 ひとつだけならあげてもいいよの無料写真素材(モデル:茜さや)

 この写真を ChatGPT 4oに読み込ませて内容を説明させました。以下がその説明文です。

この写真は、明るく広々とした部屋で撮影された若い女性を捉えています。彼女は長くて波打つ黒髪を持ち、軽やかな花柄のブラウスを着ています。場面はリラックスしており、背景の柔らかい白が穏やかな雰囲気を醸し出しています。彼女はテーブルに座り、クッキーのような食べ物を口元に持っていて、食事やおやつの時間の一コマを示唆しています。表情は優しく、微笑を浮かべながら直接視聴者の方を見ており、親しみやすさと招待感を加えています。全体の構成や光の使い方から、温かみと静けさが伝わる写真です。

 この説明文をもとに以下のプロンプトを作成しました。追記した部分を太文字で示します。

明るく広々とした部屋で撮影された若い22歳の日本人女性を描いて。水彩画のカラー。彼女は、丸い顔で、長くて波打つ黒髪を持ち、軽やかな花柄のブラウスを着ています。場面はリラックスしており、背景の柔らかい白が穏やかな雰囲気を醸し出しています。彼女はテーブルに座り、クッキーを左手で口元に持っていて、右手で視聴者にクッキーを差し出しており、食事やおやつの時間の一コマを示唆しています。表情は優しく、微笑を浮かべながら直接視聴者の方を見ており、親しみやすさと招待感を加えています。

これによって生成したのが以下のイラストです。服やクッキーなどのモチーフは出せていますが、手の細かなポーズは再現できません。これが Manga Draw Color の(Dall E3 の)いちばん苦手なところのようです。

Manga Draw Color  による再現
Manga Draw Color  による再現

「ひとつだけならあげてもいいよ」を実現するため、プロンプトで右手でカメラに向けてにクッキーを差し出しており、を指定しました。

明るく広々とした部屋で撮影された若い22歳の日本人女性を描いて。水彩画のカラー。彼女は、丸い顔で、少し垂れ目で、長くて波打つ黒髪を持ち、白地に軽やかな花柄のブラウスを着ています。場面はリラックスしており、背景の柔らかい白が穏やかな雰囲気を醸し出しています。彼女はテーブルに座り、右手でカメラに向けてにクッキーを差し出しており、食事やおやつの時間の一コマを示唆しています。表情は優しく、微笑を浮かべながら直接視聴者の方を見ており、親しみやすさと招待感を加えています。

Manga Draw Color  による再現

2.3.「あなたと食べるポッキー、美味しいなあ」の無料写真素材

「ぱくたそ」 「あなたと食べるポッキー、美味しいなあ」の無料写真素材(モデル:茜さや)

 この写真を ChatGPT 4oに読み込ませて内容を説明させました。以下がその説明文です。

この写真は、秋冬の装いでポートレートが撮影された若い女性を映しています。彼女は暗い色の服を着ており、暖色の帽子をかぶっています。手にはペンか何か細長い物を持っていて、それを口元に当てています。女性の表情は柔らかく、目はカメラを直接見つめており、やや神秘的な雰囲気を醸し出しています。背景は自然光でぼんやりとしており、落ち着いた感じがします。全体的に温かみがあり、穏やかな印象の写真です。

 この説明文をもとに以下のプロンプトを作成しました。追記した部分を太文字で示します。ポッキーをペンと間違っているので修正しました。

秋冬の装いでポートレートが撮影された22歳の日本人女性を描いて。2020年代の少女漫画風、水彩画のカラー。彼女は優し気な丸顔で、すこし垂れ目です。彼女は暗い色の服を着ており、灰色のマフラーをして、暖色の帽子をかぶっています。手にはお菓子のポッキーを持っていて、それを口元に当てています。女性の表情は柔らかく、目は視聴者を直接見つめており、やや神秘的な雰囲気を醸し出しています。背景は自然光でぼんやりとしており、落ち着いた感じがします。全体的に温かみがあり、穏やかな印象です。

これによって生成したのが以下のイラストです。少し目がきつい感じがしますが、雰囲気はまあまあ再現できているようです。

Manga Draw Color  による再現 正方形の構図

髪型がショートヘアになっていたので、プロンプトでソバージュのロングヘアを指定しました。屋外であることを、背景は公園として指定しました。こちらの方が目の印象が柔らかく、写真の表情に近いようです。

秋冬の装いでポートレートが撮影された22歳の日本人女性を描いて。2020年代の少女漫画風、水彩画のカラー。彼女は茶色のソバージュのロングヘアで、優し気な丸顔で、すこし垂れ目です。彼女は暗い色の服を着ており、灰色のマフラーをして、暖色の帽子をかぶっています。手にはお菓子のポッキーを持っていて、それを口元に当てています。女性の表情は柔らかく、目は視聴者を直接見つめており、やや神秘的な雰囲気を醸し出しています。背景は公園で、自然光でぼんやりとしており、落ち着いた感じがします。全体的に温かみがあり、穏やかな印象です。

Manga Draw Color  による再現 縦長の構図

2.4.「任せて下さいOKです!」初々しい新卒女性の無料写真素材

「ぱくたそ」 「任せて下さいOKです!」初々しい新卒女性の無料写真素材(モデル:茜さや)

 この写真を ChatGPT 4oに読み込ませて内容を説明させました。以下がその説明文です。

この写真は、ビジネススーツを着た若い日本人女性が撮影されています。彼女は白いシャツと黒いジャケットを着用し、カメラに向かって微笑みながら「OK」の手のサインをしています。背景は白で、シンプルでクリアな印象を与えています。全体的にプロフェッショナルでポジティブな雰囲気のポートレートです。

 この説明文をもとに以下のプロンプトを作成しました。追記した部分を太文字で示します。被写体の説明が殆どなかったので、補充しました。

ビジネススーツを着た若い22歳の日本人女性を描いて。彼女は白いシャツと黒いジャケットを着用し、カメラに向かって微笑みながら「OK」の手のサインをしています。彼女の顔は優し気な丸顔で、大きな黒い目が印象的であり、濃い茶色のソバージュのロングヘアがジャケットの胸元に垂れています。背景は白で、シンプルでクリアな印象を与えています。全体的にプロフェッショナルでポジティブな雰囲気です。

これによって生成したのが以下のイラストです。OKポーズのように説明しやすいものは、再現性が高いようです。

Manga Draw Color  による再現

 胸元のネクタイが余分だったので、リクルートスーツを指定しましたがダメでした。事後的にネクタイを消したのが以下です。

リクルートスーツを着た若い20歳の日本人女性を描いて。2020年代の少女漫画風、水彩画のカラー。彼女は白いシャツと黒いジャケットを着用し、カメラに向かって微笑みながら「OK」の手のサインをしています。彼女の顔は優し気な丸顔で、大きな黒い目が印象的であり、濃い茶色のソバージュのロングヘアがジャケットの胸元に垂れています。背景は白で、シンプルでクリアな印象を与えています。全体的にプロフェッショナルでポジティブな雰囲気です。

Manga Draw Color  による再現

更に髪型について似せるため、ChatGPT 4o に写真の髪型を詳しく説明させてみました。

画像では、若い女性がダークブラウンのロングヘアを、流れるような、少しウェーブのかかったヘアスタイルにしている。後頭部で高い位置でポニーテールにした髪は、耳の後ろから胸元のスーツにかかるようにエレガントに流れ落ちる。何本かの髪が優雅に頬にかかり、彼女の外見にソフトでフェミニンなタッチを加えている。さらに、耳の前を通って頬を軽くなでる繊細な髪の束があり、彼女の表情の優しさと髪全体の優雅なスタイリングを際立たせている。

モデルの茜さやさんは、頭の上部で髪を止めているのですが、これもポニーテールと呼ぶのですね。ヘアスタイルの詳細情報をプロンプトに反映させて、更に生成した画像が以下です。

Manga Draw Color  による再現

3.おわりに

 ChatGPT 4o で動作する GPT である Manga Draw Color によって、現実の写真のモチーフや雰囲気は或る程度まで再現できることが判りました。しかし、手の細かなポーズの再現に難がある、バッグの斜め掛けができないなどの欠点もあります。 
 今後、他のモデルの写真素材でも再現性を試してみたく思います。

いいなと思ったら応援しよう!

この記事が参加している募集