見出し画像

【Flux.1】 AIから学ぼう! 最高の写真の撮り方を考える

若い写真家の女の子が彼氏にAIの使い方を教えてもらう4コマ漫画

はじめに

こんにちは、きまま / Easygoing です。

AI は 50億もの画像データから学んでいます。

その知識をうまく引き出すことができれば、私たちはもっと魅力的な写真が撮れるようになるのではないでしょうか?

アニメ構図の記事は前に書いた

以前、アニメの構図をイラストに活かす方法について記事を書きました。

今回は、その時に気づいた点をもう少し掘り下げてみたいと思います。

お題:苺のショートケーキ

最初のお題は、食欲の秋にぴったりの苺のショートケーキです!

画像生成AIの SDXL / Flux.1 について、3つのモデルを比較してみます。

  • SDXL:前世代モデル、完成度が成熟

  • Flux.1:新世代モデル、リアルな質感に優れる

モデルによって、どのような特徴があるのでしょうか? 今回はイラストと一緒に明るさのグラフも見てみます。

SDXL - anima_pencil-XL_v500 (アニメ)

美味しそうなイチゴのショートケーキのアニメイラスト
美味しそうなイチゴのショートケーキのアニメイラストの明るさの分布
右が多いほど明るい
  • SDXL のアニメモデル

  • 表情や柔らかさの表現が得意

  • キャラクターの顔を明るく描写

アニメモデルは、グラフの右側の明るい部分が多くなっています。

アニメモデルでは、全体が 明るくポップ なイラストに仕上がります。

おしゃれなカフェのメニューに載っていたら、なんだか注文したくなるイラストです!

SDXL - RealVisXL_V5.0 (実写)

美味しそうなイチゴのショートケーキの実写風のイラスト
美味しそうなイチゴのショートケーキの実写風のイラストの明るさの分布
左の黒が強調されている
  • SDXL の実写系モデルの最高峰

  • FP32形式  13.6 GB

  • 推奨 50 STEP のスーパーモデル

RealVisXL は SDXL の実写系の最高峰モデルです。最新版は 2024年9月にリリースされていて、モデルの容量やステップ数からそのレベルの高さが伝わってきます。

前世代の SDXL モデルにも関わらず、ケーキのスポンジや苺の切り口など、質感がとてもリアルに表現されています。

明るさは 黒が強調されていて、コントラストが強く写真全体が引き締まった印象 になります。

Flux.1 - FluxesCore-Dev_V1.0 (実写)

美味しそうなイチゴとクッキーの実写風のイラスト
美味しそうなイチゴとクッキーの実写風のイラストのあかるさのぶんぷ
中央部分が多い(コントラストが低い)
  • 最新の Flux.1 [dev] の実写系モデル

  • 「Japanese」と入力すると人物がアニメ化する問題を修正

  • 追加学習を行って特にアジア人の描写に優れる

FluxesCore シリーズは、とーふのかけらさん制作の Flux.1 のフォトリアル系モデルです。

FluxesCore シリーズのうち、FluxesCore-Schnell モデルはメンバー限定配信ですが、FluxesCore-Dev モデルは無料で公開 されています。(商用利用は不可)

Flux.1 はショートケーキのイメージが少し日本人のイメージと違うようですが、質感と立体感の表現はさすがです。

明るさの分布はグラフの 中央部分が多く、実物に近い分布 になっています。

Flux.1 は地味?

3つの写真を比べると、最新のモデルにも関わらず最後の Flux.1 の写真は地味に感じます。

これは写真のコントラストが低いので、パッと見たときに目に映るインパクトが少ないからです。

コントラストは補正できるが・・・

Flux.1 の写真はコントラストが低いですが、オリジナルに忠実なので補正することができます。

美味しそうなイチゴとクッキーの実写風のイラストのトーン補正をしたもの
トーン補正
美味しそうなイチゴとクッキーの実写風のイラストのブレンドモードで色を変えたもの
ブレンドモード「青」

ただし、この場合の補正は RAW 現像と違って PNG に対して行うので、もともと無い情報は復元できませんし、補正するにたびに情報は失われていきます。

コントラストが低い写真は自然な表現として良いのですが、やはり見た目に映える写真にするには、AI による生成段階での明るさ補正 が欲しいところです。

Flux.1 でアニメ構図と明るさを再現する!

さて、ここからが本題です。

今回は、成熟した SDXL モデルの構図と明るさを、最新の Flux.1 で再現するワークフローを考えます。

ここでは、構図を固定するために controlnet の depth(深度情報)を使うことにします。

SDXL と Flux.1 の良いところを組み合わせた実写のワークフロー

動作確認モデル

上のモデルのうち、FluxesCore-Dev は商用利用不可 のモデルです。

なぜ RealVisXL を挟むのか?

今回は、アニメモデルから Flux.1 に直接深度情報を渡すのではなく、SDXL の実写モデルの RealVisXL を挟んでいます。これは次の考えから来ています。

  • RealVisXL の明るさを取り入れる

  • Flux.1 の controlnet モデルはまだ登場から日が浅いので、SDXL モデルの方が信頼性が高い

  • Flux.1 は VRAM の使用量が多いので、controlnet を VRAM の余裕があるSDXLで動作させる

Girl を描いてみよう!

それでは、実際に描いてみます。アニメ構図を再現するために、プロンプトに dutch angle と close up を入れておきます。

realistic, photorealistic, girl, teenage, dutch angle, close up

anima_pencil-XL

栗色の髪の少女のアニメイラスト

きれいな栗色の髪の女性が生成されました。anima_pencil-XL はアニメモデルですが、実写の表現も優れています。

ただし、アニメモデルの特徴で目が大きいのと、実写で使うには明るさ補正が強いので全体が明るくなっています。

depth (深度情報)

美味しそうなイチゴとクッキーの実写風のイラストをもとにした深度マップ

先ほどの画像から得た深度情報です。青色が手前、赤色が奥になります。

RealVisXL

深度マップをもとにした金髪の少女のイラスト

深度情報をもとに実写モデルで画像を生成します。画像生成AI のあるあるで、プロンプトで指定しないと多くの場合 金髪の女性 のイラストになります。

構図は深度マップの通りになり、目が小さくなって明るさもリアルな写真寄りになりました。

FluxesCore-Dev

金髪の少女のイラストを Flux.1 で書き直して質感を上げたもの

最後に Flux.1 で再描画して高解像度化します。

FluxesCore シリーズはアジア人の表現を得意にしていますが、今回は比較のために金髪のまま描写します。

Flux.1 の全体の質感や立体感はさすがです。

一方で、肌の自然な表現 については、今のところ成熟した SDXL モデルに軍配が上がります。

作例をドドン!

それでは作例集です。

  • 上:SDXL → Flux.1 アニメ構図

  • 下:Flux.1 オリジナル

果たして、アニメモデルからどのような構図が出てくるのでしょうか?

パリの街並み

パリの街並みの広角レンズのフォトイラスト
広角レンズ
パリの街並みの標準レンズのフォトイラスト

教会のステンドグラス

ステンドグラスのある教会の広角レンズでチルトした明るいフォトイラスト
斜め構図
ステンドグラスのある教会の標準レンズのフォトイラスト

精巧なジオラマ

精巧な鉄道ジオラマ模型の明るいフォトイラスト
フレーミング
精巧な鉄道ジオラマ模型の落ち着いたフォトイラスト

空港で行き交う人々

人々が行き交う空港の大胆な構図のフォトイラスト
線遠近法
人々が行き交う空港の落ち着いた雰囲気のフォトイラスト

日本の路地

日本の裏路地の明るい感じのフォトイラスト
ポイントを中央から外す
日本の裏路地の夕暮れの落ち着いた感じのフォトイラスト

着物の女性

青色の着物を着た若い日本人女性の斜め構図のフォトリアルイラスト
斜め構図で動き
青色の着物を着た若い日本人女性の落ち着いたフォトリアルイラスト

料理人

横から見た構図の真剣な表情の和食の料理人のフォトイラスト
動きのある食材の配置
正面から見た構図の真剣な表情の和食の料理人のフォトイラスト

競馬

斜め構図の疾走感溢れる競馬のフォトイラスト
左から右に走ると疾走感が出る
正面から見たリアルな競馬のフォトイラスト

摩天楼のカップル

広角レンズ構図の摩天楼の屋上のカップルのフォトイラスト
背後のスペースで気持ちを表現
暗い背景の夜景の中で見つめあう若いカップルのフォトイラスト

サイバーパンクの少年

サイバーパンクの世界でエレベーターに乗り込む少年のフォトイラスト
エレベーターに吸い込まれる
サイバーパンクの世界で光る広告の前に立つ少年のフォトイラスト

アニメ構図には動きがある!

アニメモデルの構図は大胆で、イラストに動きが生まれます。

それに対して、Flux.1 のオリジナルのイラストは対象を正面から捉えた構図で重厚感があります。

それぞれ、「動」と「静」を表現したいとき に応じて使い分けるのが良さそうです。

明るさは SDXL が使いやすい

明るさについてみると、SDXL を通した画像は明るくコントラストが強くなるように補正されていて、生成した画像をそのまま使うことができます。

私たちが、プロンプトの調整や出来上がった写真の補正にかけられる時間は限られているので、前世代モデルの SDXL を通して完成に近い画像がすぐに得られる のは大きなメリットです。

Flux.1 の質感はさすがですが、使い勝手はまだ SDXL に分があるといえそうです。

まとめ:AIを教師として使おう!

  • アニメモデルは構図が多彩

  • SDXL は完成度が高い

  • controlnet で Flux.1 に応用

AI は、人間が到底学習できない 50億 もの画像データから学んでいます。

また、それぞれのカスタムモデルには製作者のセンスが凝縮されています。

今回の取り組みを通して、AI に構図のアイディアをもらう という新しい使い方ができると思いました。

私は、普段はアニメイラストを生成していますが、SDXL / Flux.1 ともに実写系の表現力が高い ことも再認識しました。

画像生成AIは、まだまだ興味が尽きません。これからも探求を続けたいと思います。

最後までお読みいただきありがとうございます!


御礼

この記事を、K_Kameno さんにご紹介いただきました。

AI を教師として使うことについて、示唆に富んだ分析をされていて、とても参考になります。


モデル紹介

anima_pencil-XL_v500

RealVisXL_V5.0

FluxesCore-Dev_V1.0

DepthAnything-V2


参考書籍

先読み!画像生成AI インプレス 2023年3月

名画から学ぶ 写真の見方・撮り方 東京カメラ部 2022年10月


English Article




いいなと思ったら応援しよう!