
「将棋の駒を持つ女子高校生」を生成AIで作ってみた:ImageFX編
はじめに
このnoteでは、生成AIで「将棋の駒を持つ女子中学生」を作ってみる企画を行っています。
ここ数日、ImageFXの話題が非常に盛り上がっておりますので、さっそくこの実験を行うことにしました。
ImageFXとは
まず、ImageFXについてです。
グーグルは8月28日、Geminiの画像生成用AIモデルとして、リアルな表現に強い最新の「Imagen 3」を採用した。この記事ではそんなImagen 3を、Geminiを経由せず、ブラウザーから手軽に利用できるサービス「ImageFX」の使い方をご紹介する。
(略)
ImageFXはグーグルが公開している実験的な画像生成サービス。Googleアカウントでのログインは必要だが、無料で使うことができる。
利用方法は上の記事をご参照ください。私もGoogleアカウントですぐに利用できました。
お試し
早速画像生成に入ります。まずは、いつも通り「将棋の駒を持つ女子中学生」というプロンプトだけで作ってみます。日本語プロンプトはうまくいくかどうかわからないので、Bing翻訳にかけて、英語のプロンプトで生成しました。

おもわず「マジか」と声を上げてしまいました。というのも、これまで「女子中学生」部分はともかく、「将棋の駒」部分は
将棋の駒でもチェスの駒ですらない「枝状」のナニカ
しか出力されなかったからです。そのため、これまでは「将棋の駒」を出力させるために
「5角形の木片」などの文言を使い、プロンプト側で工夫
してなんとか画像を出力していたのですが、今回は最初から「将棋の駒」が再現されました。学習データが増えたのでしょう。非常に感慨深いです。
とはいえ、なぜか
盤面は4人将棋のように向かい合っており
(おそらく、麻雀の学習データも加わっているのではないかと想像します)これは改善のし甲斐があると感じました。
やはりトライ&エラーが大事
このImageFXでは、生成に失敗すると「このプロンプトを変えてみてはいかが」というように選択肢が表示されます。「女子中学生」は難しいようで、「女子高生」に変えると安定して画像が出るようになりました。
最終的には、12回目のトライで

このクオリティで出力できるようになりました。もともと、将棋の駒を持つ女子中学生というのは
が起点だったのですが、並べて見るとますます似ている気がします。

正直なところ、写真と生成AIを一目で見抜ける自信がありません。生成AIの進化は凄まじいですね。
所感
ImageFXで「将棋」に関する画像を生成する場合、これまでの生成AIのように、下手にプロンプトを多く与えると、逆に意図しない側に結果が出ると感じました。駒は「木片」などと入力せず、素直に「将棋の駒」と書いた方が安定した出力が得られる気がします。これは将棋学習データが少なかった時代の
「将棋 → 英語で“Japanese Chess” → Chess をもとに画像生成」
理論から、生成AI側が脱却しつつあるのではないでしょうか。その場合においては、下手に人間側で小細工をせず、AIにすべて任せた方がOptimizeされるのだと思います。
ただ、やはりこれまでの生成AIと同じく「指」は弱点のようで、

上記の画像は、最初「駒の持ち方」を含め非常に良い構図だと感じたのですが、よく見ると右手の指が4本です。こればかりは生成AIの特性上仕方がありません。何度もトライ&エラーが必要です。
おわりに ~ 「AI、1年使わざれば刮目して見よ」
今回はImageFXを使って、将棋女子を生成AIで作ってみるシリーズを実施いたしました。このシリーズの最初の記事は2023年3月なのですが、たった1年でこの進化は「驚き」の一言です。「男子、三日会わざれば刮目して見よ」という慣用句がありますが、AIでも同じなのですね。

まじめな話をすると、以前の記事で「学習データに『日本っぽくないもの』しかなければ、日本っぽくない絵しか描けない」と書いたのですが、1年もあれば日本っぽいデータが溜まってきたということでしょうか。まさに「刮目」すべき進化だと感じました。
現在では、静止画だけではなく、動画の生成などの技術も出てきています。今後もいろいろチャレンジしていこうと考えています。
2024.09.18追記
静止画生成には目途がついたので、動画生成にもトライしてみました。
(つづく)
いいなと思ったら応援しよう!
