![見出し画像](https://assets.st-note.com/production/uploads/images/152558900/rectangle_large_type_2_3b4754bbfddea39eb7ace7f57ec3685a.jpeg?width=1200)
Midjourneyプロンプトを生成AIで作る<chatGPTとPerplextiy比較編>
こんにちは、まつけんです。
今日はタイトルにあるように、Midjourneyに入れるプロンプトを生成AIで作る流れを簡単に説明していきます。
僕自身、Midjourneyで作成した画像をいくつかのフォトストックサイトに登録して販売をしています。
とりあえず、今回は「和服を着た若い日本人の女性、コンクリートの壁の前、金髪と黒髪のまだら」というお題です。
使った生成AIは
・chatGPT (自分用のGPTで作成)
・Perplextiy
の2つ。上記の日本語をそれぞれの生成AIでプロンプトを作って、Midjourneyに出力してもらいました。
chatGPT
![](https://assets.st-note.com/img/1725051767076-28lUH1gMqW.png?width=1200)
Perplextiy
![](https://assets.st-note.com/img/1725051848751-0YPuVo5XHq.png?width=1200)
どちらも「和服を着た若い日本人の女性、コンクリートの壁の前、金髪と黒髪のまだら」としかいれず、出力されたプロンプトに対して修正や追加は行っていません。
では、それぞれ出力されたプロンプトを紹介します。
chatGPT
best quality, A photo of a young Japanese woman wearing a kimono, standing in front of a concrete wall, with blonde and black streaked hair --style raw --ar 16:9
(※文頭best quality と文末 --style raw --ar 16:9はGPTで追加するように指示してます)
Perplextiy
best quality, A photo of a young Japanese woman wearing a kimono, standing in front of a concrete wall, with blonde and black streaked hair --style raw --ar 16:9 --v 6.0
(※文頭best quality と文末 --style raw --ar 16:9はMidjourney入力時にて手入力で追加)
なぜ、プロンプトを生成AIで作るのか?
ある程度大量に作成したいので、Midjournyにいれるプロンプトの作成は極力、省力化させたいわけです。
まあ、Midjourneyのプロンプトは英語なわけで、さまざまなパラメーターを考えないといけないわけですよ。
最初の2ヶ月ぐらいはプロンプトを日本語で考えて、英訳して、
文頭にbest quality, 8k
文末に --ar 16:9をつけてたわけです。 (いまは--style rawも付加)
数秒の作業とコピペが1日200枚以上生成するころにはつもり積もって…
ということで、その頃はchatGPTに作らせるようになったのです。
GPTが出て、更に省力化。
--
入力された日本語をAI画像生成ができるように英訳をすること
ただし、
文頭に、 best quality, A photo of japanese
文末に --style raw --ar 16:9
と追加すること。
---
な感じで非公開のGPTを作って、出たきた英文をMidjourneyにコピペ。もうめっちゃ楽になりました。
![](https://assets.st-note.com/img/1725052222936-W5tHwQIWU4.png?width=1200)
この記事を書く、一週間ほど前にPerplextiyに出会いました。いや、これ使ってみると衝撃的で生成AIの進化にびっくりしました。
で、chatGPT同様にこちらでもプロンプトを作るのはどうか?と思ったわけです。
そして、「以下の内容で画像生成したいので、midjourneyのプロンプトにしてください。」という言葉でいろいろ作るようになりました。
今回だと、
---
以下の内容で画像生成したいので、midjourneyのプロンプトにしてください。 和服を着た若い日本人の女性、コンクリートの壁の前、金髪と黒髪のまだら
---
で出たきた英文をコピペした、Midjourneyにいれたら、文頭にbest quality, 8k 文末に--style raw --ar 16:9を追加してしばし待つ。
![](https://assets.st-note.com/img/1725052479256-vAiJ8Hnc8m.png?width=1200)
どっちが良い悪いというわけではいまのところないので、どちらでもガンガン出力させて、OKなものを1枚単位でさらに出力していきます。
そうやって、大量に出力させて、そのなかからピックアップです。
途中で髪型やポーズ、背景など買えたいときは、直接プロンプトを修正してまた、大量出力っていう感じです。