「将棋の駒を持つ女子学生」を生成AIで作ってみた:ImageFX編(2)
はじめに
このnoteでは、生成AIで「将棋の駒を持つ女子学生」を作ってみる企画を行っています。
すでに、ImageFXとLumaAIで大体の答えが出つつあるようにはなってきていますが、最近の研究課題についていくつか紹介します。
研究1:生成された「背景」でも消せる
以下のような記事を見つけました。
恥ずかしながら、この機能は知らなかったのですが、Windows11に標準で入っている「ペイント」で、背景を簡単に削除できるようになったようです。(「フォト」でもできるようです)
この記事を読んだ時に考えたのですが、生成AIで作りだした画像でも背景部分のみ消せるのかが気になったので試してみました。結論から言うと、ちゃんと消えました。
当たり前ですが、ペイント(に実装されているAI)からすれば、
実際の写真なのか、生成AIが作った画像なのかは区別していない
わけですから、奇麗に背景が消えて当然といえば当然です。
この機能を使えば、動画生成AIでの活用で自然さを増すのに使えるかもしれないと感じました。生成AIで生成された画像を作る時には、背景も生成されますが、LumaAIのように2枚の異なる画像を開始・終了で繋ぐような生成をする時に、背景が異なると、その間を補完するような動画になるため、どうも
中間が気持ち悪い動画になりがち
です。そこで、背景を消すとうまくいくのでは?と思い、実験中です。
研究2:感想戦の「手刀」ポーズ指定が難しい
もう一つの課題は「静止画生成におけるポージング」ですが、具体的に言うと
感想戦の「手刀」はどう指定したらよいのか
がまだわかっていません。このポーズ、正式名称はないのでしょうが、要するに感想戦で二本指で盤面を差しているポーズで、最近よく見るようになった気がします。
このポーズ、具体的には
人差し指と中指の二本で盤面を差す
というものですが、プロンプトで入力するのが難しく、毎回出力が安定しません。最初に示したものが二本指で盤面を指してくれた例ですが、このような出力になるのはかなりレアで、なかなか思い通りのポーズをしてくれません。
プロンプトを細かく指定してもその通りにポージングしてくれるわけではなく、このあたりは引き続きの研究課題です。
おわりに
今回は、「将棋の駒を持つ女子学生」生成AIの応用編ということで、研究課題をいくつか紹介しました。特に前半の物はWindows11のペイントを使って背景を消してみたということで、簡単な画像加工であれば、Windows標準機能だけでもいろいろできそうで、次の動画化に向けての研究も深まりそうです。
今後も、探索を続けていこうと思います。
(つづく)