Leonardo.Ai の動画かローカルPC の動画か...の比較がぶっ飛ぶTensol.Art の衝撃!
最近になってInstgram のタイムラインに頻繁にTensol.Art のプロモーション
が目立つようになったので、試してみました。
mage.Space やLeonardo.Ai と同様、クラウド系サービスなので、
GPU搭載などの特別なPC は不要です。
Text2Img、Img2Img、アニメートを切り替えて同一画面に成果が
蓄積される、シンプルで使い易いデザインです。
Leonardo.Ai のような建て増し続きでダンジョン化した混沌はありません。
驚くほど多数のモデル(CheckPoint ファイル)が無償利用出来ます。
更に驚くほど多数のLoRA ファイルも無償利用出来ます。
Leonardo.Ai のように道具立てが沢山あっても、実用的でないものも
沢山混じっているようでは意味がありませんので、片っ端から試して
みました。
mage.Space に蓄積している描画からプロンプトを持って来るのが
簡単なので、いろいろなモデル(CheckPoint)で描画してみました。
CheckPoint とLoRA を選択・組合せ出来るので、mage.Space の無償
SDXL のような西洋人系に留まらず、東洋人に馴染み深い表情も
ローカル描画同様に可能です。
Stable Diffusion XL(SDXL)1.0 による描画です。
Extra Realistic XL - v1 による描画です。
LucidDream Realistic - v1.0 による描画です。
CheckPoint、LoRA の組み合わせだけでも数えきれないほどで、
更にモデル、LoRA のアップロードも可能のようなので、ネット上
からローカルPC にダウンロード入手して来たそれらを、Tensol.Art 内
で利用することも可能そうで、ローカルPC 描画の緻密さに追いつける
可能性を持っています。
アニメート(動画)についても同様です。
沢山のCheckPoint ファイルが無償利用出来ます。
LoRA ファイルも同様です。
カメラワークに関して簡単な指定が可能なMotion LoRA ファイルも
用意されていました。
上出のLucidDream Realistic - v1.0 によるサイバー女子隊員の画に使った
プロンプトで動画化をしましたら、テスト段階の静止画描画の時点から
顔がロボット化するものが多発したので、背景の記述を幾分整理
しましたら、やや露出過剰になり意図とは違ってしまったものの、
Leonardo.Ai の動画よりも血の気のある人物の動画になりました。
ローカルPC での動画では到達しないレベルです。
気になるのは、ローカル描画での動画と同様、人物画の動画が1 本で
2 シーンに分かれることです。メカ画はその限りではありません。
…と、ここまでは凄かったものの、衝撃ばかりでなく、気になる部分
もあります。
メカ画の動画に関しては、静止画で効果的だったStable Diffusion XL
(SDXL)1.0 が動画では現状メニューにないこと、さらに静止画の描画に
おいても、その(SDXL)1.0 が上掲のように同一プロンプトで、バリバリ
に詳細を描く時と、次のようにそうでない時の差がどこから来るのか、
現時点ではいまいち良く把握出来ていない、という課題は残ってます。
さらに静止画においてはExtra Realistic XL - v1 が精緻な描写をする時も
ありますが、それを次善で動画に使おうとするも、やはり動画メニュー
には無く….。
まずはポイントを消費しない静止画で試して、うまく描けたCheckPoint
を使って動画の描画をしたいところですが、EpicRealism も
Stable Diffusion - V1.5 も静止画、動画の両方にあるものの、いまいち
な仕上がりで、最もましなのがこの Copax Realistic GirlPortrait - V2
による静止画と動画です。この題材に関しては動画にはあまり満足感は
ありません。(この結論に至るまでポイント枯渇に逢いながら3 日ほどの
試行錯誤を続けました。)
それよりも驚くことに、静止画、動画ともNSFW 領域への制限・警告が
全くありません。NSFW 用のCheckPoint やLoRA さえ用意されています。
(他の2 つのクラウドサービスのようにプロンプトチェックエラーも
なければ描画もします。一応「審査中」というフラッシングが描画完了
時には出るものの、描画NG にはなりません。公開はしませんが。^^)
ここに至って、Leonardo.Ai の動画かローカルPC の動画か...の比較は
ぶっ飛んでしまいました。それほどTensol.Art の無償範囲の仕様は
衝撃でした。
ローカルPC でのStable Diffusion Web UI (AUTOMATIC1111 版)での
描画に加味するクラウド描画サービスがmage.Space、Leonardo.Ai、
そしてこのTensol.Art の3つともなれば、優劣比較を通して何か
1 つの描画タッチに集約するということは諦めた方が良さそうです。
漫画家、画家ではあり得ない感じですが、そもそもAI 描画という
ものがCheckPoint ファイルという「画家」を沢山子飼いにしていて、
題材に合わせて「画家」を連れて来て描画させるという観点で理解する
ことも出来、ローカル、クラウドの環境も超えて、それぞれの利点、
欠点をよく吟味し作画に合ったものを居直って使って行くしか
無さそうです。
以下にそれぞれの利点、欠点を纏めました。
◆Tensol.Art:
・利点
他に無いほどの膨大な数のモデル(CheckPoint ファイル)が用意
され無償で使用できる。
同様にLoRAファイルも多数の無償利用が可能で、その組合せは
さらに膨大。
動画についても同様。
(最大768pixels 正方。16コマまで。コマ数 / 秒の調整可)
モデル、LoRA のアップロードも可能で、ネット上から入手した
それらをTensol.Art 内で利用することも出来そうで、ローカルPC 描画
の緻密さに追いつける可能性を持っている。
加えてNSFW 領域への制限・警告も全く無し。
無償範囲でも動画、静止画合わせて20 画 / 日ほどは描画出来る。
(静止画だけなら80 画 / 日ほど。宣伝のように100 画 / 日は難しい。)
・欠点
Tensol.Art 内に描画が保存される期間が15 日間に限られる。
(mage.Space やLeonardo.Ai のように無尽蔵に蓄積され、Rerun や
プロンプト参照が出来る訳ではない。しかし描画されたpng ファイル
のメタデータに描画プロンプト情報は含まれる。)
100 ポイント / 日の無償ポイント付与が14時ごろまで待たされる。
描画サンプリング回数を30 より大きく指定すると有償契約を促される、
くらいか…。(特にこの点が問題になる描画は私の場合は無い)
【2024/02/05 追記:「描画サンプリング回数を30 より大きく」 ⇒
「描画サンプリング回数を25 より大きく」に縮小。】
◆mage.Space:
・利点
無償のCheckPoint ファイルは3 つ。しかし実用的なのはSDXL だけ。
しかしローカルPC では荷が重いSDXL なので貴重。
メカ画やサイバーSF 画が得意だがアメコミ風なら人物画まで万能。
NSFW に抵触しない範囲でなら事実上描画回数は無制限。
(1度「本日分は終了」を見たことはある)
・欠点
有効なCheckPoint が1つだけ、LoRAファイルも無償では使えない
ので、美しい東洋美人画を追求するといったローカルPC 描画が
持つ優位を無償範囲では覆すことは出来ない。
描画されたjpg ファイル内にメタデータとしてのプロンプト情報が
含まれない。(mage.Space 内では参照が可能)
◆Leonardo.Ai:
・利点
描画させた静止画から後追いで4 秒の滑らかな簡易動画が得られる。
動画素材を得るために静止画を描画するという逆転の発想が可能
となった。
(この機能に関して別記事で追報と追々報を既に本日時点で執筆完了)
・欠点
無償利用出来そうなCheckPoint が沢山メニューにあるように見えて、
実用的なものはそれほど多くない。LoRAファイルもない。
プロンプト入力フィールドで受け付けられる文字数が少なく、表現
に対する記述への理解範囲が狭い。(NSFW に限らずエラーの詳細が
知らされない)
そのため題材によっては完成度が非常に落ちることが少なくない。
描画されたpng ファイル内にメタデータとしてのプロンプト情報が
含まれない。(Leonardo.Ai 内では参照が可能)
◆ローカルPC のStable Diffusion Web UI (AUTOMATIC1111 版):
・利点
CivitAI などネット上にある作例とプロンプトを参考にCheckPoint
ファイル、LoRA ファイルをダウンロード入手して、静止画描画の
詳細を際限無く詰めて行ける。当然ながらNSFW 領域にも全く境界なし。
描画されたpng ファイルのメタデータに描画プロンプト情報は
含まれる。
・欠点
環境構築にやや専門知識的な熟練が必要。(過去記事参照)
Geforce RTX20xx 以上のGPU が搭載されていないPC では
インストール処理も完了しない。
GeForce RTX4060 搭載ノートPC (GPU メモリ8 GB)でも動画生成に
やや無理がある (512 pixels 正方で48 コマ程度が限界、静止画で
追求した折角の詳細ニュアンスがかなり減損する)。
静止画もHires. fix 機能を使っての拡大再描画を併用しないと、
1024 pixels 正方以上の画像を得るのが難しい。
(奇形や暴走が頻発する)
◆ローカルPC のNMKD Stable Diffusion GUI :
・利点
img2img 処理をtxt2img処理の背景補完で使うことを容易にする
1 画面設計。
img2img 処理に過去の生成画を取り込むとCheckPoint ファイル名
以外の全ての描画情報を参照出来、コピペで再描画に利用可能。
(上述の通り、mage.Space 描画のjpg、Leonardo.Ai 描画のpng
には描画情報が含まれないので参照不可)
GPU を持たない低速PC (Intel 社Core-i5 CPU 機程度)でも512pixels 正方
程度の小画像なら30 分ほどで描画出来(1024 pixels 正方だと4 時間弱)、
AI 描画のお試し入門には最適。
環境構築も解凍・インストールだけで容易。
Stable Diffusion Web UI (AUTOMATIC1111 版)同様にNSFW 領域にも
全く境界なし。
生成された描画はフォルダを含めて自動保存される。
描画されたpng ファイルのメタデータに描画プロンプト情報は
含まれる。
・欠点
急に原因不明の画質劣化が起こる時がある。
対策で最新バージョンへのアップグレードを実施すると動作不能に
なる。(低速PC、GPU 搭載高速PC に関わらず、まだ幾分でも
動作が安定なのは、バージョン 1.11.0 )
人物画の詳細を詰めて行くと、作例と同じCheckPoint、LoRA、プロンプト
などをもってしても、どこか似て非なる次元に留まる時がある。
ご覧いただきありがとうございます。