![見出し画像](https://assets.st-note.com/production/uploads/images/129254212/rectangle_large_type_2_bce07cc1c2b867d7922dc2eafd57f554.jpeg?width=1200)
Leonardo AI の新モデルと新Element; [ Kino XL&Cybertech ]による画像生成-2 人
はじめに
2024年1月に入って、Leonardo AIに、新たなモデルと、Elementがそれぞれ加わっています。
これらを用いて、どのような画像が生成されるかをいくつか試してもたのでご紹介します。
今回は、モデルとしてKino XLを用いて、Elementの重み(Weight)の値を変えたときに、人、の画像生成結果がどのようになるかを見てみました。
画像の生成
設定した条件
モデル: Kino XL
エレメント:Cybertech
Alchemy V2: ON
画像サイズ: 768 × 1024(横☓縦)縦長のパターンとなります。
Alchemy Upscaleの有無は、各画像の下に記載しました。
Low/Medium/High - (Smooth )ON、または、無しの場合はオリジナル、と表記しています。
用いたプロンプト
オリジナルの比較的シンプルなPromptを基に、PromptGenerationが生成した下記のPromptを用いてみました。
In a fusion of cultures, a Japanese woman dons a sleek black suit with a crisp white shirt, her jet black hair styled in a modern bob. Her intense black eyes seem to reflect the city lights as she walks through the bustling streets.
文化の融合において、日本の女性がスリムな黒いスーツとクリスプな白いシャツを着て、漆黒の髪をモダンなボブスタイルにしています。 彼女の強烈な黒い瞳は、彼女が賑やかな街を歩くときに都市の光を反映しているように見えます。
2-0 Element 無し
なお、番号については、前回の子猫を1-として、今回は2-とします。
2-0-1
![](https://assets.st-note.com/img/1706747270137-qXdcRBNxs6.jpg?width=1200)
![](https://assets.st-note.com/img/1706747373870-wvVe2Y1hrl.jpg?width=1200)
2-0-2
![](https://assets.st-note.com/img/1706745347265-ZwuuTn5ewe.jpg?width=1200)
![](https://assets.st-note.com/img/1706746303270-hgSKH5ogXW.jpg?width=1200)
同じPromptからの2つの生成画像の例を示しました。
生成結果として、比較的普通の女性像が得られている感じもします。
そのような意味ではリアリティが高く、人工的に生成されたという感じがしません。まぁ、このレベルはもはや当たり前かもしれませんが、あらためて怖い気もします。
普通にオフィスで働いている若い女性というのが第一印象です。
なお、2-0-2の画像からも少し伺えるのですが、日本人と指定すると、着物を着た画像が生成される傾向にあるようです。この下にきているのは、シャツではないようです。それにしても、これは左前ですね。
また、Alchemy Upscaleの有無は、無し、が素顔に近く、有り、が少しメイクでシャープになったという感じで、それほど大きな変化がないように見えます。
これは、前回の子猫と同じような印象です。Kino XLでは、はじめから、Alchemy Upscale的な処理がされているのでは?とも思えます。
2-1 Element Weight 0.3
エレメントの重みを0.3に設定して画像を生成しました。
2-1-1
![](https://assets.st-note.com/img/1706747524577-6eJ256VH50.jpg?width=1200)
2-1-2
![](https://assets.st-note.com/img/1706747595024-PMKL8oIR0f.jpg?width=1200)
どちらも、表情がキリっとしてきた印象を受けます。
また、何故か、ともに肩にベルトが加わりました、ガンベルト、でしょうか。2-1-2では、頭にアクセサリーというよりも何かの器具が装着されています。
2-2 Element Weight 0.7
重みを0.7に設定して画像を生成してみました。
2-2-1
![](https://assets.st-note.com/img/1706748286299-9zYnmVYEXW.jpg?width=1200)
2-2-2
![](https://assets.st-note.com/img/1706748401380-lglVNQrJh9.jpg?width=1200)
もう既に、サイバーパンクの世界です。
一見、華奢な体つきだけど、恐ろしいパワーを秘めたサイボーグという感じでしょうか。
0.3から0.7にしたときの変化が大きいので、その中間の場合も生成してみます。
2-3 Element Weight 0.5
重みを0.5に設定して画像を生成してみました。
2-3-1
![](https://assets.st-note.com/img/1706750233263-y9i5R4cwJN.jpg?width=1200)
2-3-2
![](https://assets.st-note.com/img/1706750266287-iIiTOtqngG.jpg?width=1200)
Element強度がこのレベルになってくると、Alchemy Upscaleの効きがよくなるようです。いずれも、入れたほうが表情が豊かになった印象を受けます。
2-3-1では、プロンプトの指示のスーツが、タイトスーツに解釈されたのかもしれません。水着の延長のように、初めて肌を露出しているので、サイボーグというよりも、機能強化スーツを着た人間、という感じです。
2-3-2は、ある意味、プロンプトに忠実で、黒いスーツと白いブラウスです。
腕や、頭にもメカ的要素が、入ってきていますが、人間、という感じではあります。
オリジナルのプロンプトのCybertechをアクセント的に、軽く使いたい場合は、この0.5以下での設定がいいようです。
次に0.7よりも大きな重みを設定した場合を見てみます。
2-4 Element Weight 1.2
重みを1.2に設定して画像を生成してみました。
2-4-1
![](https://assets.st-note.com/img/1706751810668-1Y1BpvDc4t.jpg?width=1200)
2-4-2
![](https://assets.st-note.com/img/1706752015326-Zjvx79leq7.jpg?width=1200)
重みが0.7の画像から、一層サイボーグ化が進んでいます。
また、子猫の場合同様、周囲の背景が町並みから室内から、窓越しに外がみえるような設定に変わってきています。
なお、これらは、いずれもAlchemy Upscaleをかけてありますが、実は、これで人間的な見た目に回復されています。
たとえば、2-4-2のオリジナルは、次の様に生成されています。
![](https://assets.st-note.com/img/1706752413840-hSXv6wnL6b.jpg?width=1200)
なんとなく、バイオハザードにでてきそうな、何かに感染しているような表情になっています。
これは、これで、用途によってはいいかもしれません。
Alchemy Upscale処理後の画像とオリジナル画像との遷移で、ドラマが想起される感じもします。
此処から先の重みは、もはや行き過ぎになることが予想されますが、続いてやってみます。
2-5 Element Weight 1.7
重みを1.7に設定して画像を生成してみました。先ほどから、Alchemy Upscaleの効果が更に大きくなっているので、両方を示します。
2-5-1
![](https://assets.st-note.com/img/1706753018456-MXNw3tMuKy.jpg?width=1200)
![](https://assets.st-note.com/img/1706753372775-z8FcxiBQBf.jpg?width=1200)
2-5-2
![](https://assets.st-note.com/img/1706753330974-DnEFoy7jE2.jpg?width=1200)
![](https://assets.st-note.com/img/1706753402058-a0FTQlg0eQ.jpg?width=1200)
ほぼ、予想された結果ですが、Alchemy Upscaleによる補正効果がかなり効いています。物語の設定次第では、この値のオリジナル画像も使えるかと思います。
色々試しましたが、次に示す2.0ぐらいが、重み設定として画像が崩れない限界に近いようです。
2-6 Element Weight 2.0
重みを2.0に設定して画像を生成してみました。先ほどから、Alchemy Upscaleの効果が更に大きくなっているので、両方を示します。
2-6-1
![](https://assets.st-note.com/img/1706754060090-tQDIEUYjuc.jpg?width=1200)
![](https://assets.st-note.com/img/1706754150862-Agtt5dkqel.jpg?width=1200)
2-6-2
![](https://assets.st-note.com/img/1706754128534-BHnGmtLBqO.jpg?width=1200)
![](https://assets.st-note.com/img/1706754185213-NXRYrppUNF.jpg?width=1200)
Alchemy Upscaleで補正した場合は、未来人とかの設定で使えそうですが、補正前は、かなり、崩れています。画像としては、そろそろ限界のようです。
まとめと付記
今回のまとめ
新しいElementのCybertechを、重み(weight)を変えて適用して人の画像を生成してみました。
オリジナル画像へのアクセントしてつかう場合には、0.5以下0までの範囲がいいようです。
また、0.5以上だと、サイバーパンク的な世界が強調されますので、SF的な世界の表現には使えそうです。
値が、0.7ぐらいになると、オリジナルは、なにかに感染したような表情、もしくは、宇宙人的なイメージの表情になります。
Alchemy Upscaleを適用することで、普通の表情に改訂することができます。適用の有無は、用途次第です。
また、値が2.0程度以上になると、オリジナル画像は、かなり崩れてきます。Alchemy Upscaleを適用することで、人らしさは復元されますが、この値付近が、通常の画像としては、適用限界に近いようです。
付記
なお、Elementの重みは、−2.0まで設定できます。
この設定による画像への影響はかなり大きいようです。
マイナス側に設定すると、モデルのダイナミックなどの設定の影響が少なくなり、さらに、プロンプトの影響も減ってきて、たとえば、イラスト系やアニメ系、さらにインド系などの異なる人種が生成されたりします。
このようにして生成した画像を基に、Motion機能や、Pika, Runway、PixVerseなどの他の動画生成アプリのImage to Video機能で、動画を作成することができます。
それぞれ改良がどんどん進んでいるようで、2週間ぐらい前までは、Runwayが圧倒的でしたが、LeonardoAIのMotionも、最近急速に良くなってきている印象です。Pikaがちょっと足踏みしている感じもします。
面白いんですが、トークンが急速に減るのが悩みどころです。