見出し画像

「ChatGPTに服の組み合わせ画像を生成してもらえば買う前にイメージできる」試み(主婦的見解)

前回の記事ではGPT4oに画像を見せて似合うコーデを考えてもらいました。


買った服がちょっとイメージと違った時。
手持ちの服のコーデがうまく行かない時。


どんな組み合わせが合うのか聞いてみると、(期待していたものと違う可能性も高いけど)意外とヒントをもらえるかもしれません。

では複数のアイテムを提示した場合、それを組み合わせたイメージ画像を生成してくれないか。

それができれば、新たに購入する服と手持ちの服が合うかどうか、頭の中でイメージするよりも的確に判断できるのではないでしょうか。

早速やってみました。


結論は、画像生成にはDALL-Eが必要です。
でもそれを知らなかった私。

DALL-Eを使用するにはAPIのアカウント登録や使用料も発生するとのことでそれはまた回を改めます。


今回は今できる範囲で。
画像生成に至るまでのやり取りをまとめます。


**全くのAI知識のないただの主婦のたわごとです。事実とは異なるかもしれません。本文で「できない」と書いていることも知識があればできるかもしれません。

ただの主婦が最新の技術を触ればこんなものだという記録に過ぎません。本記事の内容は鵜呑みにせず、1アイデアとして見ていただければ幸いです。



GPT-4oなら画像生成ができる?

GPT-4oが発表されて「画像からイラストが生成できる」
確かにどこかでそう聞いた。

イラストを生成している人の記事もたくさんある。

では私も!意気込んでGPT-4oに聞いてみました。


やりたいこと:指定した洋服の画像でコーデ画像を生成する

「画像のサマーニットとシフォンスカートを組み合わせたコーデ画像を生成してくれますか」

指定したのは某通販サイトの画像。

GPT-4oの答えは以下でした。


テキストでコーデの提案をしてくれました。

必要なアイテム
サマーニット (画像1のようなベージュ色のニット)
シフォンスカート (画像2のようなミントグリーン色のスカート)

って、それを合わせたいんだよ・・・

聞き方がまずかったのかな?と、もう一度。


「画像のサマーニットとシフォンスカートを組み合わせて画像を生成してもらえますか」


すると「できない」という返事が返ってきました。

画像の生成機能は持っていませんが、サマーニットとシフォンスカートの組み合わせをイメージするためのガイドを提供できます。

とともにコーデの提案をテキストで教えてくれました。

この時点ではまだ、なぜ生成できないのか気づいていません。

「では上の画像のサマーニットとシフォンスカートを合成できますか」

イラストがダメなら画像のまま合成してくれ。
(いやいや、無理だろ)


GPT-4oの答えは以下。

現状、画像の編集や合成を行う機能は備えていませんが、そのような作業をサポートするためのアドバイスを提供できます。

サマーニットとシフォンスカートの画像を合成するためには、以下の方法を試してみてください。

そしてPhotoshop 、 GIMPを使った画像合成方法を教えてくれました。
なるほど〜


この時点でようやくイラストが生成できないと理解しました。


GTP-4oでイラストを描いているのはなぜ?

そこで聞きます。
「GPT-4oでイラストを描くにはどうしたらいいですか」


ようやく辿り着きました。
複数のツールが紹介される中で見つけました。

方法2: AIアート生成ツールの使用
AIアート生成ツールを使用すると、テキストからイラストを自動生成できます。以下に手順を示します。

使用するツール
MidJourney
DALL-E (OpenAIが提供するテキストから画像生成モデル)

DALL-Eかぁ。
いろいろ調べた結果、すぐにはできなさそうなので次回にトライしたいと思います。

で。
今できる方法で何かないか。


無料で指定した画像からイラスト生成はできる?

調べていると、ある記事の中に

Microsoft Bing Image Creatorは個人の非商業目的のみ利用可能で、商用利用不可

【DALL-E 3】ChatGPTで画像生成する方法!使い方や料金、プロンプトのコツを解説


Image Creator は、Microsoft Edge のサイドバーから DALL-E を使用して 画像生成ができるツールで無料で使えるそう。


ただし、Windowsのみ。

イメージクリエーターはどこで利用できますか?

Image Creator は現在、Windows 10 および Windows 11 デバイスの Microsoft アカウントを持つユーザーのみが利用できます。

Designer の Image Creator


私のパソコンは残念ながらmac・・・

でも諦めきれないので試しに聞いてみます。


今度はCopilotに。

「コパイロットではDALL-E 3を使ってイラストを生成できますか」


Copilotの答えはこうでした。

はい、もちろんです!DALL-E 3を使ってイラストを生成することができます。

ChatGPTにしたのと同じ質問をしてみます。
ですが、Copilotでは画像を一度に一枚しか送れず、一枚ずつ聞いていきます。

「画像のサマーニットを着た女の子のイラストを生成してください」


生成されたのは下の絵。

ううん・・・
なんか違う。白のサマーニットではないし。


「もう少し露出が少なく白のサマーニットにできますか?そして、そこに画像のスカートを合わせてください」

すると。

ああ。
なるほど。私が提示した画像に少し近づいた。

ただ、サマーニットなんだけどな。
露出しないって言ったら長袖になるのか。


やっぱり無料版の範囲ではこれくらいが限界みたいです。
複数の洋服の画像を提示して、コーデ画像を生成してもらうのは難しいのか、、、


有料のDALL-Eに可能性を期待し、チャレンジしてみたいと思っているけどそれはまた後日。

無料では複数画像を組み合わせたイラスト生成には限界(初心者意見)

限界と言い切るものではありません。

なぜなら私はAIもGPTも何もわかっていないただの主婦。

もしかしたら色々できるのかもしれません。

ただ、ここに描いているのは全然知識のないただの主婦が最新のAI技術を使うとこうなるという記録結果です。

同じようにAIなど全く知識がないに等しい人が、ちょっとでも最近流行りのテクニカルに触れたい時には馴染みやすいのではないかなーと思います。

簡単なこと、思いつきから触ってみると、意外と面白いかもしれません。




この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?