見出し画像

DeepSeekでWordPress用の画像生成AIプロンプト作成プラグインのバージョンアップしたがコイツは賢い!

最近はいろんな画像生成AIがブームですよね。

Midjourneyに代表されるような高品質な画像生成AIから、Stable DiffusionやNovelAIなどの自前で動かせるタイプまで、本当にたくさん登場しています。

SNSなどを見ても、AI画像でイラストや写真っぽいアート作品を作っている方がかなり増えた印象です。

でも、実際に画像生成AIを使ったことがある人ならわかると思うのですが、理想の絵や写真を出力させるプロンプトを考えるのって地味に大変なんですよね。

日本語でも対応してくれるAIはあるものの、やっぱり英語の方がAI画像生成の世界での“共通言語”のように扱われているのが現実だと思います。

そこで、「日本語でイメージを膨らませたいけど、最終的には英語のプロンプトにしたい」という課題を感じている方は多いはず。

私もそうで、数多くの生成AIに触れるうちに、「もっと簡単にプロンプトを作りたい」「自分が書いた日本語を一発でいい感じの英語に翻訳してAIに投げてほしい」といつも思っていました。

そんな思いの中で、WordPress上で直接プロンプトをサクッと作るプラグインを作成したのが前回。

だけど、そのときは翻訳機能なしだったんですよね。

後から「やっぱり英訳欲しいよね」となり、翻訳機能を搭載した新バージョン、v3.1.0を作成したというわけです。


GPT 4oとの格闘とGPT 1oの意外な有能さ

さて、まずはプラグインを作るにあたり使用したのChatGPTです。

世の中、ChatGPTっていろいろバージョンがあって、GPT 4oが最新かつ高性能だと言われてますよね。

私も当初は「どうせなら最新のGPT 4oでがっつりやってみよう」と思ってコードを書いてもらったんです。

ところが、これが意外とポンコツな部分があったんですよ。

「なんか知識はすごく豊富っぽいんだけど、時々的外れな答え返してくるな…」とか、「フルバージョンで書いてってお願いしてるのに、一部しか書いてくれない」とか、要は振る舞いがちょっと雑な感じ。

さらに何度も間違ったり、会話の途中で省略したりと、こっちの想像以上に手こずらされました。

一方で、GPT 1oの方を試してみたら、これがなかなか素直。

聞いたことに対して、すごく丁寧に、ちょっと長すぎるくらい回答を返してくる。

それも仕事がきっちりしている感じで、必要以上の説明までしっかりカバーしてくれるんです。

もちろん、GPT 4oと比べると「最新の知識」はやや弱いのかもしれませんが、少なくともコード生成という面では全然問題なしで、むしろサクッとゴールに近づけてくれる雰囲気がありました。

イメージで言うと、GPT 4oは「むちゃくちゃ物知りだけど、集中力がない後輩」。

一方のGPT 1oは「誠実で世話好きな先輩」という感じですね。

ちょっと昔気質だからか、余計なところまで口を出してくるけど、その分仕事がちゃんと終わるのが早い。そんな印象でした。

ただ、問題はGPT 1oのPro版がめっちゃ高いということ。

実際にはGPT のPlusプランで制限付きで使っている状態なので、プラグイン作成みたいに何度も会話を重ねる場合は、どうしても回数制限に引っかかっちゃうんですよね。

「使いたいときに使えない」というのは、作成する身としてはかなりストレスです。

しかもコードを長々とやり取りするとなると、やっぱりChatログが膨大になるので、余計に制限が気になるわけです。

そのうえ、テキストファイルのアップロードができないので、既存のプラグインファイルをアップデートする際にいちいちコピペする必要がある。

これがまた地味にキツい…。
そんな状況下で「どうしようかな…」と思っていたところに出会ったのがDeepSeekというツールなんです。

DeepSeekの登場



DeepSeekって、名前だけ聞くとなんだかすごそうじゃないですか? ましてや中国開発というとなんだか怖い気もしますし・・・

私も最初に名前を聞いたときは、「何だその厨二感ある名前は!」って思ったんですけど、実際に使ってみると想像以上に頼りになる。

中国発の生成AIということで、政治的な問題の回答などを巡り、欧米などでは懸念を示す声も多くありますし、日本政府も対応していく可能性を示しています。
ただ、私見ではありますが、現在のところ、商用に利用するとか、政治的な問題や個人情報的な内容以外は問題はないと判断しています。
とはいえ、これは現在の私の判断ですので、皆様方におかれましては、使用する際は注意しておくに越したことはありません。(しばらくすると猛反対していたりしますw)

このDeepSeekでまず嬉しいのが、ファイルのアップロードに対応しているところ。

プラグイン作成でよくある作業は、「すでにあるプラグインファイル(PHPやJSやCSSなど)を手直ししながらアップデートしていく」というフローですよね。

でも、ChatGPT o1(4oはアップロードできます)だと大量のコードをペーストしなきゃいけなかったり、制限を食らったりして、結構手間がかかる。

DeepSeekの場合、「はい、これが既存のファイルです」って感じでペタッとアップロードして読ませると、その内容をちゃんと解析してくれる。

そこに新しいコードを追加したいとか、UIを変えたいとか、翻訳機能を実装したいとか、そういう要望を出すと、わりとスムーズに対応してくれるんです。

今回は、「画像生成AIプロンプト作成 WordPressプラグイン」のバージョンアップを作成する際に、このDeepSeekをメインに使いました。

数時間くらいのやり取りで、思った以上にスムーズにプラグインが完成したので、「これはもしかしたらGPT 1oを超えるかもしれないな」なんて思ったほど。

実際、GPT 4oで作ったときは何日もかかったのに、DeepSeekでは数時間でほぼ形になっちゃったんですよ。

さすがに細かい修正点とかUIのデザイン変更のリクエストとかは、何度かやり取りしなきゃいけなかったので「数時間」とはいえ普通に作業は必要でした。

だけど、比較すると相当ラクになったと思います。

ただ、長い時間やり取りしていると、そのうち中国語で「服务器繁忙,请稍后再试。(サーバーがビジー状態です)」って返されちゃったんですよね。

「あ、やばい。これ以上はもう無理だ!」という状況になったので、最後の微調整だけはGPT 4oに戻って仕上げたという感じです。

つまり、プラグインの作成フローとしては、「DeepSeekでガリガリ書いて、最後のやり残しをGPT 4oに依頼する」という二段構え。

これが思ったよりうまくハマったんですね。結果、無事に翻訳機能付きのプラグインが完成したというわけです。

「画像生成AIプロンプト作成 WordPressプラグイン」バージョンアップ

では、その完成したプラグインについて、改めて紹介しましょう。

前回はVer2.0.0としてリリースしていたのですが、その時点では翻訳機能がなかったんですよ。

今回のバージョンアップでは、Google翻訳APIを使って日本語から英語へ変換する機能を搭載しました。

「英訳」に特化しているので、あえて他の言語はサポートしていません。

そこは「とりあえず英語でプロンプトを投げたいんだよ」というニーズがメインだからです。

もちろん、UIもがらっと変えました。

Webページ画面

今回のアップデートでは淡いパステル調を使って、見た目にも可愛らしいデザインに仕上げています。

プロンプト入力欄とか、翻訳表示欄とか、ちょっとしたところにアニメーションを入れたりして、使っていて楽しくなるようなUIを目指しました。

操作感は基本的に変わっていません。

WordPressの管理画面からプラグインを有効化し、管理画面に行きます。

そこで、CSVデータをアップロードします。Google翻訳APIも管理画面でアップロードしてください。

フォーマット通りのCSVをアップロード
APIキーも入れてください

フロントエンドでは、まず日本語で好きなイメージを入力します。

例えば「夕日が沈む海岸で佇む女性」みたいな感じで、ざっくり日本語で書いてもOK。

そして、「翻訳」ボタンを押すことで、Google翻訳APIが走って英語のプロンプトを生成してくれます。

APIキーを持っていない場合は、翻訳アプリやツールで翻訳した英文をエディタに直接貼り付けてもOKです。

その下に「プロンプト選択」がありますので、カテゴリー選択し、その内容を選択します。

「追加」ボタンを押すとエディタに反映されます。

出来上がったプロンプトを「コピー」し、MidjourneyとかStable Diffusionとか、お好みのAI画像生成サービスに貼り付ければOK。

そのまま丸投げMidjourney
そのまま丸投げStable Diffusion
そのまま丸投げSeaArt(さすがにイメージが違いましたw)

さらに、「プロンプトにもっと要素を追加したい!」という場合は、日本語で追加要素を書いてまた翻訳すればいいし、「ちょっと翻訳が微妙かも?」と思ったら翻訳内容を手動で修正することも可能です。

とにかく、日本語と英語を行ったり来たりする面倒くささから解放されるように作っています。

バージョンアップで苦労したポイント

今回のアップデートするにあたって、やっぱり苦労したのはコードの改変と翻訳APIの実装ですね。

まずコードの改変に関しては、プラグインが既に存在しているので、「前のバージョンのここを変更して、これを追加して…」といった感じで、小刻みに修正していく必要があるんです。

GPT 4oで始めたのですが、一度に全部書いてくれず、なぜか一部の変更しか提示してくれなかったり、途中で処理が切れちゃったりすることが頻繁にありました。

加えて、翻訳APIの実装ではGoogle翻訳APIのキーを取得して、それをプラグインに組み込むというステップが必要でした。

個人的には自分のGoogleクラウドアカウントでAPIキーを発行してテストすればOKだったんですが、それを誰でも使えるようにプラグイン側で設定する方法とか、ユーザーにどう案内するかとか、いろいろと検討が必要でしたね。

結局、「Google翻訳APIの取得方法はユーザー各自でお願いします」という形に落ち着きました。

さすがにAPIキー発行の手続きは個人情報やクレジットカード情報との紐づけもあるので、こちらでサポートしきるのは難しかったんです。

DeepSeekがなかったらもっと遅れていたかもしれない

今回の作成で一番感じたのは、「DeepSeekがあって本当に助かった!」ということです。ファイルベースでやり取りできるのは大きいですね。

もしDeepSeekがなかったら、コードを少しずつコピペして、その都度GPT 4oと会話しながら修正して…という地道な作業を繰り返していたんじゃないかと思います。

それこそ、これまでと同じように何日もかけて完成させる羽目になっていたでしょう。

もちろんDeepSeekも万能ではありません。

長時間やり取りしていると、中国語で「服务器繁忙,请稍后再试」みたいに返されますしね。

しかし、コード生成に関してはGPT 4oよりも作業効率が高かったですね。

最終的にはGPT 4oで仕上げをしたとはいえ、全体の8~9割はDeepSeekのおかげで完成できたと思います。

今後もしAI関連のプラグインを作成する機会があれば、またDeepSeekとGPTを併用して進めるのがベストかなと感じました。

Google翻訳「英訳」のポイントとして

もし翻訳がちょっと微妙だなと思ったら、さらに手動で追記したり、修正したりしてもOKです。

AIの自動翻訳って便利だけど、どうしてもニュアンスが100%完璧とは限らないですからね。

そこはユーザー側の編集で微調整してもらう前提です。

たとえば「神秘的な雰囲気」を翻訳したときに、単に“mysterious atmosphere”になってしまうことがありますが、もう少し幻想的なニュアンスを出したかったら“surreal and mysterious atmosphere”みたいに書き換えてもいいと思います。

要は、AI翻訳の結果をベースに、自分のイメージに合わせて英語をブラッシュアップしていく感じです。

また、追加の要素を入れたいときは、再度テキストエリアに書いて翻訳ボタンを押すと、追記分だけ翻訳されます。

ただし、現時点では「追記分を前回の英語テキストに自動的に合体する」という機能までは実装していません。

そこは手動でまとめていただく形になります。

そういった便利機能があればよいのかもしれませんが、まずは基本的な翻訳とプロンプト生成に特化しています。

Google翻訳APIのサポートについて

先ほどもちょっと触れましたが、このプラグインはユーザーご自身でGoogle翻訳APIのキーを用意していただく必要があります。

APIキーを取得するには、Googleクラウドプラットフォームのアカウントを作成して、そこからAPIの有効化とキーの発行を行うという手順が必要です。

正直なところ、この手順はそれなりに面倒かもしれません。

コンソールの使い方がわかりにくかったりしますので、初めての方にはちょっと敷居が高く感じるかもしれません。

でも、こればっかりは仕方ないんです。
「そこは手取り足取りサポートしてあげればいいじゃん」という声もあるかもしれませんが、やはりAPIの発行には個人情報が絡むので、私の立場からすると責任を持って対応するのが難しいところなんですよね。

だからこそ、プラグインとしては「APIキーを入力する欄を用意しておく」以上の対応は難しいというのが正直なところ。

面倒だな…という方は、無理に翻訳APIを使わずに、他の翻訳アプリやツールで作成することになります。

購入方法と販売ページ

そして、このプラグインですが、以下のページで販売しています。

こちらはnoteの有料記事として公開していてます。

価格はコーヒーを一杯飲むより安い設定にしています。

また、このページでは、webツール版も販売予定です。

WordPressを使っていない方でも、ブラウザ上で翻訳プロンプト生成を気軽に使用できますので、興味のある方はwebツール版をご検討ください。

こちらはGoogleのAPI取得は不要です。

ただし、利用者が多くなった場合は、翻訳に制限がかかる場合もありますので、あらかじめご了承ください。

まとめ

というわけで、今日は「画像生成AIプロンプト作成 WordPressプラグイン」のバージョンアップを、DeepSeekで作成したということを語ってみました。

やっぱりAIって便利なんだけど、万能じゃないんですよね。

特にコード生成とかプラグイン作成みたいな複雑な作業だと、どうしてもAIだけに任せきりにはできません。

人間が何度も確認したり、AIに「そこ、違うよ」「これ全部書き出して」ってお願いしたりする手間が発生します。

AIはサポートしてくれるツールと考えなきゃね。

最終的に完成したプラグインは、英訳機能が加わって、前よりもずっと使いやすくなりました。

外観もかわいくなったし、日本語でイメージを膨らませるだけで英語プロンプトが作れるので、これからAI画像生成にチャレンジしたいという方にはかなり重宝するんじゃないかなと思っています。

もし興味を持ってくださった方がいたら、ぜひ上記のリンクから購入してみてください。

一杯のコーヒーを飲むくらいのつもりで支援していただければ、そのお金でまた美味しいコーヒーでも飲みながら、次回のアップデート案を練らせてもらいます。

何か面白いアイデアが浮かんだら、さらに便利なプラグインを作りたいと思います。

では、長々とお付き合いいただきありがとうございました。AI画像生成の世界が、みなさんにとってもっと身近で楽しいものになりますように。今後ともよろしくお願いします。

いいなと思ったら応援しよう!

ほぼほぼAIで
フォローしてくれたら喜びます。コーヒーを御馳走してくれたらもっと喜びます!