見出し画像

NovelAI V4の新機能を試す

NovelAIV4のプレビュー版がリリースされました。
さっそく、新機能を試してみました。


マルチキャラクタープロンプト

最大6人までのプロンプトを個別に指定できるようになりました。

ベースプロンプトで絵柄を決めるクオリティタグや背景などを指定して、キャラクタープロンプトでキャラデザに関するタグを指定します。

キャラクタープロンプトでは、1girlや1boyを使わず単にgirlやboyなどのタグを使用します。

キャラクターごとにネガティブプロンプトも設定できますが、ベースのネガティブプロンプトをコピーしていくと4人目くらいでトークン数がオーバーしてしまいました。
おそらく、ベースプロンプトで指定したネガティブプロンプトがキャラクタープロンプトにも適用されていて、キャラごとに特に排除したい要素のみキャラクタープロンプトのネガティブプロンプトで指定するといった使い方が正解かと思います。

共通設定

ベースプロンプト

◯girls, absurdres, best quality, highres, detailed eyes, {excellent, finely detail, elaborate}, amazing quality, very aesthetic, street,

※◯には2~6の数字を入れます

ネガティブプロンプト

blush, blush stickers, nsfw, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract], bad anatomy, long_body, mutated hands, missing arms, extra arms, extra legs, bad hands, missing limb, disconnected limbs, extra fingers, missing fingers, liquid fingers, ugly face, deformed eyes, cropped, big belly, earrings, choker, ribs, deep shadows,

品質タグ:オフ
除外:強い
ステップ:28
プロンプトガイダンス:7
サンプラー:k_dpmpp_2s_ancestral
プロンプトガイダンスの再調整:0
ノイズ:karras

キャラクタープロンプト

1人目

girl, absurdly long hair, single hair bun, lavender hair, metaric hair, colored tips, bangs, tareme, sulphur yellow eyes, flat chest, turtleneck sweater, suspender skirt,

2人目

girl, very long hair, hair pulled back, purple hair, wet hair, colored tips, crossed bangs, jitome, spring green eyes, disproportionate breasts, bandeau, lowleg shorts,

3人目

girl, very short hair, flipped hair, pistachio green hair, tired hair, colored tips, hair over eyes, tsurime, coconut brown eyes, large breasts, striped shirt, micro shorts,

4人目

girl, medium hair, side ponytail, chartreuse yellow hair, ultra-detailed hair, colored tips, blunt bangs, sanpaku, burnt sienna eyes, large breasts, sash, lowleg skirt,

5人目

girl, very short hair, flipped hair, apple green hair, hair reflecting light, two-tone hair, parted bangs, tareme, apricot eyes, small breasts, dress shirt, tassel,

6人目

girl, big hair, folded ponytail, red hair, metaric hair, two-tone hair, short hair with long locks, jitome, amethyst eyes, disproportionate breasts, letterman jacket, shorts under skirt,

キャラクタープロンプトのネガティブプロンプトは設定していません。

2人

3人

4人

5人

6人

4人になると画像のクオリティが低下して、5,6人になると人数が正確に出づらくなるという結果になりました。
プレビュー版は学習データが一部のみということなので、正式版に期待です。

アクションタグ

アクションタグを使うことで、複数キャラのポーズの指定が簡単にできるようになりました。

アクションタグは、させたい動作タグの前に「source#」「target#」「mutual#」をつけることで、キャラクターのポーズを指定します。

  • 「source#」する側(主体)

  • 「target#」される側(客体)

  • 「mutual#」互いにする

動作やポーズに関する1000個以上のタグにアクションタグを付けて画像生成してみました。その結果を画像付きで有料noteにまとめています。

共通設定

ベースプロンプト

2girls, absurdres, best quality, highres, detailed eyes, {excellent, finely detail, elaborate}, amazing quality, very aesthetic, cowboy shot, library,

ネガティブプロンプト

blush, blush stickers, nsfw, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract], bad anatomy, long_body, mutated hands, missing arms, extra arms, extra legs, bad hands, missing limb, disconnected limbs, extra fingers, missing fingers, liquid fingers, ugly face, deformed eyes, cropped, big belly, earrings, choker, ribs, deep shadows,

品質タグ:オフ
除外:強い
ステップ:28
プロンプトガイダンス:7
サンプラー:k_dpmpp_2s_ancestral
プロンプトガイダンスの再調整:0
ノイズ:karras

1人目キャラクタープロンプト(主体)

girl, succubus, dark skin, small breasts, very short hair, gray hair, [[messy hair]], blue eyes, narrowed_eyes, slit pupils, mini succubus wings, succubus tail, grey hooded jacket, micro shorts, source#〇〇,

2人目キャラクタープロンプト(客体)

girl, short hair, bob cut, blunt bangs, tyrian purple hair, jitome, slit pupils, grey eyes, flat chest, slim waist, succubus wings, succubus tail, black hoodie jacket, hood up, untucked shirt, denim shorts, kneehighs, zettai ryouiki, target#〇〇,

キャラクタープロンプトのネガティブプロンプトは設定していません。

バックハグ(hug from behind)

2/3でバックハグしてます。

壁ドン(kabedon)

3/3で壁ドン成功。

あごを掴む(grabbing another's chin)

3/3であご掴み成功。

お姫様抱っこ(princess carry)

3/3でお姫様抱っこだが、主体と客体が逆になりがち。

腿の上に座って向き合う(Sit on the other person's lap and face each other)

動作を自然言語で指定してみます。
グレーっ子がむらさきっ子の膝の上に座るイメージです。

2/3でグレーっ子がむらさきっ子の上に座ってますが、向き合ってなかったり左右のソックスの長さが違ったり目の色が異なったりしてますね。
自然言語を入れると崩れやすくなるのかな?

2人でハートマークを作る(heart hands duo)

以下「mutual#」を使います。

3/3でハートマーク完成。

鼻同士をくっつける(noses touching)

3/3で鼻同士をくっつける成功。

手を繋ぐ(holding hands)

3/3で手つなぎ成功。

かなり成功率が高くて驚きました。
正式版でnsfwが解禁されたら、かなり捗りそうですね。

英語の自然言語

プロンプトでの英語の自然言語の理解が深まりました。

V3で自然言語を使った画像生成については以下のnoteをご覧ください。

V3で使用したプロンプトを使いV4で生成してみました。

共通設定

ネガティブプロンプト

nsfw, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract], lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract], bad anatomy, long_body, mutated hands, missing arms, extra arms, extra legs, bad hands, missing limb, disconnected limbs, extra fingers, missing fingers, liquid fingers, ugly face, deformed eyes, cropped, big belly, earrings,

品質タグ:オン
除外:強い
ステップ:28
プロンプトガイダンス:7
サンプラー:k_dpmpp_2s_ancestral
プロンプトガイダンスの再調整:0.5
ノイズ:karras

富士山とネオン鳥居

プロンプト

A futuristic cyberpunk landscape with Mount Fuji in the background. A glowing neon torii gate in the foreground, surrounded by cherry blossom petals glowing in the dark. The sky is filled with vibrant neon hues of purple and blue, with holographic billboards in the distance. A blend of traditional Japanese aesthetics with futuristic elements. Hyper-detailed, cinematic lighting, ultra-realistic textures.

日本語訳

富士山を背景にした近未来的なサイバーパンクの風景。手前にはネオンに輝く鳥居、その周りには暗闇に輝く桜の花びら。空は紫と青の鮮やかなネオンで埋め尽くされ、遠くにはホログラムの看板が見える。伝統的な日本の美学と未来的な要素の融合。ハイパーデテール、映画のような照明、超リアルなテクスチャ。

V3

V4

V4は謎文字が入ってしまいました。ネオンに反応しているのかな?

サイバーな舞妓さん

プロンプト

A cyberpunk-style geisha in a glowing neon kimono with intricate holographic patterns. She is holding a futuristic umbrella with LED lights, standing in a rainy street surrounded by glowing signs in kanji. The atmosphere is misty and filled with vibrant neon lights, blending traditional Japanese elegance with a high-tech futuristic vibe. Hyper-detailed, ultra-realistic, cinematic lighting.

日本語訳

複雑なホログラム模様の光るネオンの着物を着たサイバーパンクスタイルの芸者。彼女はLEDライトのついた近未来的な傘をさし、漢字で書かれた光る看板に囲まれた雨の通りに立っている。雰囲気は霧に包まれ、鮮やかなネオンで満たされ、伝統的な日本のエレガンスとハイテク未来的な雰囲気が融合している。超細密、超リアル、映画のような照明。

V3

V4

V4ではちゃんと傘と着物が光ってますね。漢字はやはり無理みたいです。

桜吹雪とサイバーパンク都市

プロンプト

A cyberpunk cityscape illuminated by glowing neon lights in purple, pink, and blue. A pathway lined with holographic cherry blossom trees shedding glowing petals in the wind. A traditional Japanese pagoda integrated into the futuristic city skyline, with high-tech holographic displays. Atmospheric fog and cinematic lighting.

日本語訳

紫、ピンク、ブルーのネオンが輝くサイバーパンクな街並み。ホログラフィックの桜並木が風に吹かれて光る花びらを散らす小道。ハイテクなホログラフィック・ディスプレイを備えた、近未来的な街並みに溶け込んだ日本の伝統的な塔。雰囲気のある霧と映画のような照明。

V3

V4

やっぱり謎文字が入ってしまいます。

サムライとサイバーパンクの融合

プロンプト

A cyberpunk samurai standing in a neon-lit alley. His armor is a mix of traditional samurai plating and glowing futuristic elements, with holographic kanji symbols floating around him. The background shows a blend of Japanese temples and cyberpunk skyscrapers. Dynamic composition, cinematic lighting, ultra-detailed textures.

日本語訳

ネオンに照らされた路地に立つサイバーパンクのサムライ。彼の鎧は伝統的な侍のメッキと光り輝く未来的な要素がミックスされており、ホログラフィックな漢字のシンボルが彼の周りに浮かんでいる。背景には日本の寺院とサイバーパンクの高層ビルが融合している。ダイナミックな構図、映画のような照明、超詳細なテクスチャ。

V3

V4

V3より甲冑っぽさが出てます。ただ、画面が暗すぎますね。

近未来のお茶室

プロンプト

A futuristic Japanese tea house in a cyberpunk city. The tea house is glowing softly with neon lights, surrounded by holographic koi fish swimming in the air. Inside, a traditional tea ceremony is being performed with robotic arms serving tea. Outside, neon cherry blossoms glow under a dark, rainy sky. Hyper-detailed, cinematic lighting, ultra-realistic.

日本語訳

サイバーパンクの街にある近未来的な日本の茶室。茶室はネオンでやわらかく輝き、ホログラムの鯉が宙を泳いでいる。中ではロボットアームがお茶を点て、伝統的な茶道が行われている。外では、暗い雨空の下で桜のネオンが輝いている。超細密、映画のような照明、超リアル。

V3

V4

V4でもお茶室は無理そう。

一部に自然言語を用いたプロンプト

プロンプト

1girl, bob cut, black hair, Pompeian Red eyes, jitome, disproportionate breasts, She is holding a paper bag in her right hand and her phone in her left., She is walking while looking at the screen of her phone. , street,

自然言語部分の日本語訳

右手に紙袋、左手に携帯電話を持ち、携帯電話の画面を見ながら歩いている。

V3

V4

このプロンプトに関しては精度的にはV3と大差がなさそう。ただV4は指の本数ミスが少ないみたいですね。

まとめ

学習データが限定的なプレビュー版でも、特にアクションタグはかなり実用的になっています。

学習データが増えた正式版がかなり楽しみです。

いいなと思ったら応援しよう!