見出し画像

AI生成画像の背景ぼけ問題とその対策・検証と考察

AIを活用した画像生成の際に、特にMidjourney(v6.1)FLUXといったツールを使用すると、背景がぼけてしまう問題に悩まされている方は少なくないのでは?と感じています。

これは、特に「AI美女系」などのリアルなスタイルを目指した画像生成において顕著に表れます。

背景がぼけた画像は、確かにフォトジェニックな効果を生み出すことが多いですが、クリエイティブな目的やリアルな表現を追求する際には、この"ぼかし"が逆に違和感を与えることがあります。

背景をぼかさずに鮮明な画像を生成するためには、プロンプトを工夫することが必要

と考えるのは至って当然だと思います。

つまり、背景がぼけない画像を生成するためのプロンプトということです。

以下、背景がぼけないようにするためのプロンプトフレーズをリストアップしました。

これらのフレーズを組み合わせて使用することで、背景の鮮明さを保った画像を生成する可能性が高まることを期待します。

  • Sharp focus on both subject and background

  • Detailed background with no blur

  • No blur at all in the background

  • No bokeh effect, everything in focus

  • High depth of field

  • F/22, focus on both subject and background equally

  • No background blur

  • Detailed cityscape, photorealistic background

  • No depth of field effect

  • Cinematic clarity

  • Equal sharpness on both subject and background

  • Clear background with no blur

  • Ultra-clear background with no distortion

これらのフレーズを使用して、Midjourney(v6.1)FLUX、さらには動画生成AIのKLINGで試してみましたが、結果は必ずしも期待通りとはいきませんでした。

背景のぼかしを完全に回避するのは、現時点での生成AI技術の限界が影響しているようです。

たとえば、「A beautiful model standing in a city street, wearing a fashionable dress, natural lighting, realistic style, sharp focus on both subject and background, detailed background with no blur, no bokeh effect, everything in focus, high depth of field, f/22, focus on both subject and background equally, no background blur, detailed cityscape, photorealistic background, no depth of field effect, cinematic clarity, equal sharpness on both subject and background, clear background with no blur, sharp focus on all elements」というプロンプトを使っても、背景はやはりぼけたままでした。(何度か試みましたが、↓のような生成結果です)

Midjourney(v6.1)での生成結果
FLUX.1での生成結果①
FLUX.1での生成結果②

↓動画生成AI・KLINGでの例


背景をぼかさないためのワードをプロンプトに複数入れても、背景がぼけた画像や動画が生成されてしまう、これは、思うにAIが背景のぼかしを写真の「プロフェッショナル」なエフェクトと捉え、自動的に適用してしまうためではないかと考えられます。

背景が鮮明な画像を生成することは、今後の技術進化に期待するしかないかもしれません。

背景ぼかし問題は、AI技術が進化する中で克服される可能性があります。(あると思っています)

また、動画生成AIの精度が向上すれば、AI画像生成時の「被写体くっきり背景ぼけ」問題が解決するかもしれないとも思っています。

現時点では、プロンプトの調整や画像編集による後処理を駆使して、なるべく意図に近い結果を得る工夫が必要だといえます。

とはいえ、プロンプト1本では限界もあるとは思いますし、被写体と背景を別々で画像生成→合成、この形が画像としては確実ではあるでしょう。

背景と被写体の両方にこだわりがある場合、被写体と背景を別々に生成してから合成する方法が、より確実に意図に近い結果を得るための有効な手段だと言えます。

このアプローチなら、背景ぼけの問題を回避しつつ、被写体と背景の両方を理想的な形で表現することが可能になります。

被写体と背景それぞれ別画像から合成

プロセスとしては、左の画像)背景だけの画像を生成

真ん中の画像)被写体と背景(ですが背景は例によってぼけています)の画像を生成

真ん中の画像から被写体(女性)のみ抽出

右の画像)抽出した被写体を背景のみの画像と合成

手間はかかりますが、クオリティを追求する上では一考の価値がある方法だといえます。

合成の場合に気を付けなければならないのは、”被写体と背景が非常に自然に合成されており、特に問題はないように見える仕上がり”にしなければならないということだと考えています。

背景と被写体の解像度やライティングのバランスも整っていてこそ、全体的にまとまりのある仕上がりになると思います。

もし違和感があるとすれば、以下の点を調整することでさらに自然な合成が可能になると考えられます。

ライティングの確認
→被写体と背景の光の方向や色合いが一致しているかどうか確認。
例えば、背景が少し曇りがかっている場合、被写体に軽くフィルターをかけることでより一体感が出るかと思います。

シャドウの追加
→被写体の足元や周辺に軽くシャドウを追加することで、地面に立っているようなリアリズムが増します。

境界なじませ
→被写体と背景の境界部分をぼかし、なじませることで、合成がさらに自然になります。

合成で上手くいかない場合、試す価値はあります。

で、↑の合成画像をAI動画化してみました。

AI動画として生成後、4K化しています。

…が、個人的には被写体のはめ込み感があるなぁと感じる出来です。被写体以外の背景の人や車のディティールも粗い部分がありますし、「非常に現実的な良く出来たAI動画」とは思えない結果で、ただ単に全体として高画質というだけのものとなってしまいました。

実は何度か複数の動画生成AIを通して試みましたが、個人的にはしっくり来ませんでした。

背景がぼけているAI動画を良しとするか、背景がぼけていない現実的な目線のAI動画を良しとするのかは、見る側の人それぞれかもしれません。

ちなみに生成AIの特性上、同じプロンプトや画像を使用しても、毎回異なる結果が得られることがあります。

何度も試すことで、背景がぼけない動画が生成される「当たり」を引く可能性も十分にあります。これは、AIが各生成時に異なるランダムな要素を取り入れるため、同じ条件でも結果が変わることがあるからです。

試行回数を増やすことで、期待する結果が得られる確率を高めることは可能ですので、根気強くトライしてみるのも一つのアプローチかもしれません。この方法で成功するケースもあるので、継続的に試してみる価値は十分にあるかと思います。

また、妥協案ではありますが、背景ぼけを仕方がないものだと認識し、自分が許容できる範疇の生成画像で折り合いをつける、というのも一つかと思います。

例えば、↓のAI画像

これは個人的に「これくらいの背景ぼけなら、現実的な観点で見てもさほど違和感はない」と思える範疇のAI画像です。

このAI画像を動画化したのが↓です。リップシンク(口パク)でセリフも入れてみました。


…と、まあ色々と思ったり考えたりしつつも、SNS等の世間様の反応を見ている限り、”被写体くっきり背景ぼけ”のAI画像やAI動画に対してさほど違和感は感じてなさそうですよね(苦笑)

日本では生成AIモノは「とりあえずネタとして面白いか、また、簡単に可能か」という着眼点だと思いますし、背景ぼけに関してあまり気にしてなさそうです。(あとの層はAIやAI生成物に嫌悪感を抱いてそうな)

気にしないどころか、単純に「すごい!」止まりというのか。実際、私の友人のAI画像だとかAIリテラシーが全くない人に、リアル実写系のAI画像やAI動画を見せたところ、普通に「すごい!」と驚いているのみでした。

また、AIリテラシーはないものの、多少絵心があったり、趣味で絵を描いている友人は「何か構図がおかしいね」等、面白く興味深い意見も出ましたが。

映像を生業とする方々の見解というか意見が気になるところです。

映画監督さんとか、いわゆる映像のプロフェッショナルの方達はどう思う・どう感じるのだろうと。気になるところです。

引き続き、新しい技術やアプローチが登場することを期待しつつ、AI生成画像の可能性を探求していきます。

この記事が気に入ったらサポートをしてみませんか?