マガジンのカバー画像

Image Generation

157
運営しているクリエイター

#diffusers

Quanto と Diffusers による Diffusion Transformers のメモリ削減

Quanto と Diffusers による Diffusion Transformers のメモリ削減

以下の記事が面白かったので、簡単にまとめました。

1. はじめにここ数か月間、高解像度のText-to-Image (T2I) にTransformerベースのdiffusionバックボーンが使用されるようになりました。これらのモデルは、初期のdiffusionモデルの多くで普及していたUNetアーキテクチャではなく、diffusionプロセスの構成要素としてTransformerアーキテクチャ

もっとみる
diffusersのアダプタ まとめ

diffusersのアダプタ まとめ

以下の記事が面白かったので、かるくまとめました。

1. diffusersのアダプタ画像生成モデルをパーソナライズして、特定の被写体の画像のスタイルの画像を生成するための学習手法がいくつかあります。

これらの学習方法ごとに、「diffusers」では異なるタイプの「アダプタ」を提供しています。「アダプタ」は、そのモデルが生成する画像のスタイルや特性を調整するための追加的なコンポーネントを指しま

もっとみる
Google Colab で RPG-DiffusionMaster を試す

Google Colab で RPG-DiffusionMaster を試す

「Google Colab」で「RPG-DiffusionMaster」を試したので、まとめました。

1. RPG-DiffusionMaster「RPG-DiffusionMaster」は、マルチモーダル LLM (PRG) によって複雑かつ構成的なText-to-Imageの生成・編集でdiffusionモデルをマスターし、最先端のパフォーマンスを実現するフレームワークです。

核となる戦略

もっとみる
diffusers で LoRA を試す

diffusers で LoRA を試す

「diffusers」で「LoRA」を試したので、まとめました。

1. LoRA「LoRA」(Low-Rank Adaptation)は、AIモデルの効率的な調整やカスタマイズのための手法です。手法は、モデルの重みを直接調整するのではなく、低ランク(小さい次元)の行列を用いてモデルの一部の重みを調整することにより、モデルの振る舞いを変更します。

この手法には、多くの利点があります。

「LoR

もっとみる
diffusers で ControNet の inpaint を試す

diffusers で ControNet の inpaint を試す

「diffusers」で「ControNet」の「inpaint」を試したので、まとめました。

1. ControlNet の inpaint「inpaint」は、画像の一部をマスクして、任意の領域のみ新しい画像を生成させることができる機能です。

2. Colabでの実行「ControlNet」で「inpaint」を行う手順は、次のとおりです。

(1) パッケージのインストール。

# パッ

もっとみる
diffusers で ControlNet を試す

diffusers で ControlNet を試す

「diffusers」で「ControlNet」を試したので、まとめました。

1. ControlNet「ControlNet」は、「Stable Diffusion」モデルにおいて、新たな条件を指定することで生成される画像をコントロールする機能です。プロンプトでは指示しきれないポーズや構図の指定が可能になります。

2. ControlNetの更新履歴「diffusers」のControlNe

もっとみる
diffusers で IP-Adapter を試す

diffusers で IP-Adapter を試す

「diffusers」で「IP-Adapter」を試したので、まとめました。

前回1. IP-Adapter「IP-Adapter」は、指定した画像をプロンプトのように扱える機能です。詳かいプロンプトを記述しなくても、画像を指定するだけで類似画像を生成することができます。「Img2Img2」「ControlNet」「LCM-LoRA」など、diffusersの重要なパイプラインで利用できるように

もっとみる