見出し画像

最近のAI二次元画像生成事情/来週東京行ってきます!!!!

前にTwitterなので話題になったNovel AIの画像生成について触ってみた感想を綴りましたが、そこからまだ半年も経ってないのに進化が目まぐるしいものですのう~

最近はimg2imgで遊ぶくらいしかやってなかったので、最新のAIモデルについて検索してみると、精度や絵柄の広さもかなり幅が広がっていて一日潰してしまった


昨今に使われるモデル


Nobel AIはあまり使われずに、異次元系では7th_anime_V3AbyssOrangeMix3などのモデルが散見される印象
その他、Pastel Mixは絵柄が名前の通りパステル調で結構好みかも
各モデルの比較はこのページが参考になりました


早速生成したみた

褐色黒髪ロング紅目メイド

とりあえずメイドさんを生成したいと思いませ
プロンプトはだいたいこんな感じです
あと、VAEはだいたいAnythins V4.0.vae.ptです

Prompt
masterpiece, best quality,llustration,1girl,dark skin,black hair,long hair,maid apron,maid headdress,maid apron ,maid,looking at viewer,red eyes,50mm F1.4,sunlight,in the library

Negative Prompt
NSFW, (worst quality:1.4), (low quality:1.4), text, error, cropped, blurry, signature, watermark, username, monochrome, multiple views,

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 15, Clip skip: 2

細かいところで変なところはあるけど、今までのNovel AI感がまったくないですね
これは楽しい
1650Super 4GBの超低スペ環境なので384x512で書き出した後にSwinIR 4x掛けてるせいで色々破綻してる部分があるのかと思われ
本当はアップスケースと並行で生成できるといいのですが…そのほうが画質が安定するので

あと、サンプリングアルゴリズムは以前はEular Aを普通に使っていたけれど、他の人のものを見てもだいたいDPM++SDE KarrasやらDPM++M2 Karrasを使ってる全然技術については詳しくないけれどなんかいい感じになるやつくらいの認識をしている

AbyssOrangeMix3の癖

こちらはAbyssOrangeMix3で書き出したものですが。絵柄がリアル系に近い感じがします。原因はプロンプトにultra realistic lighting,ultra-detailedとか入れちゃたのでこういう絵柄になってしまったのだと思われます。取ってやれば、想像通りの絵柄になります。

ショート制服少女

Prompt
masterpiece, best quality,llustration,1girl,black hair,short hair,looking at viewer,blue eyes,large breats,50mm F1.4,sunlight,white shirt, kaidan, stairs, scenery,school uniform

Negative Prompt
NSFW, (worst quality:1.4), (low quality:1.4), text, error, cropped, blurry, signature, watermark, username, monochrome, multiple views,

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 889, Size: 384x384, Clip skip: 2

光の当たり具合と制服の布のシワが細かく描写されてて良い


斜め構図で

Pastel Mixが良い感じ

Prompt
masterpiece, best quality,1girl,solo,black hair,short hair,looking at viewer,green eyes,dutch angle,phone in hand,orange hoodie,dual monitor,

Negative Prompt
NSFW, (worst quality:1.4), (low quality:1.4), text, error, cropped, blurry, signature, watermark, username, monochrome, multiple views,

Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 889, Clip skip: 2

おー背景の散らかった感じとAIの相性がマッチしてますの

ちなみに全く同じ呪文で別のモデルにて

これもこれでいい感じですね

LoRaは低スペPCで全然動かない

他の人が学習させたLoRaモデルを読み込んで出力しようとすると、VRAMが足りん!!!って言われちゃう。
めっさ画像サイズ小さくするといけるものもあった。

この日本の学校を学習させたLoRaを使ってエモエモな画像を生成したい!!!!

このためにRTX3060 12GBほしすぎっ
助けてくれ~

もうそろ眠いので終わります
来週は初めて北海道出て一人で東京行っちゃうYO!!!
修学旅行なかった代わりみたいなもんだね

この記事が気に入ったらサポートをしてみませんか?