Embeddingに触れる

2024年11月1日 13:21

案内人の加藤です🥕

今回は"Embedding"に触れてみます！

結論、EmbeddingはEasyNegativeみたいなネガティブプロンプトのキーワードをまとめたファイルです。また、Tensorartを使う上ではEmbeddingを使わずにLoRAでよいと思います！

LoRAはより出力画像の精度を高めるファイルなのに対して、Embeddingはより出力画像で出て欲しくない物を省くファイルだと言えます！

LoRAはプラス表現の学習でEmbeddingはマイナス表現の学習…みたいな物ですね！

Embeddingとは

まず、単語の意味として"Embed(埋め込む)"のing形になります。

埋め込みに関してはWebサイトへ埋め込む際によく使われるので、身近な人は身近な物だと思います！

※ Stable Diffusionでは頻繁に使われる物らしいですが、Tensor.artでは実行回数を見る限りあまり利用されていない現状にあります。ユーザは使うメリットがないと感じている事が原因だと思います。(使わなくても良いという観点ではお手軽で良い)

今まで通り、Embeddingのあるなしの画像を比較しようとしました。テーマは｢手の奇形を防ぐ｣という点でしたが、LoRAで良い手のファイルを使ったときと、Embeddingで悪い手のファイルを使った場合と、その両方を使った場合を比較しましたが、特に大差が無いという結果に。

とりあえずたくさん生成される中で、良くない手が出力された画像の手だけをまとめたファイルを作成し、それをネガティブプロンプトで使えるようにトリガーワードを指定するぐらい….

そもそもLoRAやEmbeddingはテキストで指示しにくい表現を画像で学習させるものです。画像生成が失敗したからと言って削除するのではなく、失敗画像の失敗部分を抽出しファイルを作成し、生成に活かすことが本来の用途だと考えます！

※今回は生成画像なしの記事になりましたが、Stable Diffusionにも興味があるので、そちらで触れなおしてみようかなと思います🥕

ひとまず、Tensorartを使う上でEmbeddingは利用する必要はなさそうです！