- 運営しているクリエイター
#人工知能
Google Colab で Flux の ControlNet を試す
「Google Colab」で「Flux」の「ControlNet」を試したのでまとめました。
前回1. ControlNet「ControlNet」は、「Stable Diffusion」モデルにおいて、新たな条件を指定することで生成される画像をコントロールする機能です。プロンプトでは指示しきれないポーズや構図の指定が可能になります。
今回は、「InstantX」提供の「ControlNet
Quanto と Diffusers による Diffusion Transformers のメモリ削減
以下の記事が面白かったので、簡単にまとめました。
1. はじめにここ数か月間、高解像度のText-to-Image (T2I) にTransformerベースのdiffusionバックボーンが使用されるようになりました。これらのモデルは、初期のdiffusionモデルの多くで普及していたUNetアーキテクチャではなく、diffusionプロセスの構成要素としてTransformerアーキテクチャ
Google Colab で FLUX.1 を試す
「Google Colab」で「FLUX.1」を試したので、まとめました。
1. FLUX.1「FLUX.1」は、「Stable Diffusion」の開発者たちが立ち上げた「Black Forest Labs」が発表した最新の画像生成AIモデルです。
2. FLUX.1 [dev]「Google Colab」でのFLUX.1 [dev] (ガイダンス蒸留モデル) の実行手順は、次のとおりです
デルタもんLoRAの正式版を公開します。
こんにちは、BlendAI運営です。
デルタもんLoRAの正式版を公開しました。 以下からダウンロード可能です。
booth (学習データセット付き)
https://blendai.booth.pm/items/5801621
civitai (LoRAのみ)
https://civitai.com/models/492694
デルタもん公式LoRA version1.0の特徴についてご
Google Colab で デルタもんLoRA を試す
「Google Colab」で「デルタもんLoRA」を試したので、まとめました。
1. デルタもんLoRA「デルタもんLoRA」が「アルファパラダイス」のキャラクター「デルタもん」のLoRAです。「アルファパラダイス」のイラスト・音声・3Dデータなどのコンテンツは、AI に関連した利用に限り、目的を問わず自由に使うことができるとのこと。
2. Colabでの実行Colabでの実行手順は、次のと
ComfyUI で Stable Cascade を試す
「ComfyUI」で「Stable Cascade」を試したので、まとめました。
1. Stable Cascade のモデル「HuggingFace」の「stabilityai/stable-cascade」からモデルをダウンロードして、「ComfyUI」の「models」フォルダに配置します。
2. Stable Cascade の実行「Stable Cascade」の実行手順は、次のとお
ComfyUI で IPAdapter + ControlNet を試す
「ComfyUI」で「IPAdapter + ControlNet」を試したので、まとめました。
1. ComfyUI_IPAdapter_plus「ComfyUI_IPAdapter_plus」は、「IPAdapter」モデルの「ComfyUI」リファレンス実装です。メモリ効率が高く、高速です。
・IPAdapter + ControlNet
「IPAdapter」と「ControlNet」
diffusersのアダプタ まとめ
以下の記事が面白かったので、かるくまとめました。
1. diffusersのアダプタ画像生成モデルをパーソナライズして、特定の被写体の画像のスタイルの画像を生成するための学習手法がいくつかあります。
これらの学習方法ごとに、「diffusers」では異なるタイプの「アダプタ」を提供しています。「アダプタ」は、そのモデルが生成する画像のスタイルや特性を調整するための追加的なコンポーネントを指しま
Google Colab で RPG-DiffusionMaster を試す
「Google Colab」で「RPG-DiffusionMaster」を試したので、まとめました。
1. RPG-DiffusionMaster「RPG-DiffusionMaster」は、マルチモーダル LLM (PRG) によって複雑かつ構成的なText-to-Imageの生成・編集でdiffusionモデルをマスターし、最先端のパフォーマンスを実現するフレームワークです。
核となる戦略
Google Colab で ComfyUI を試す
「Google Colab」で「ComfyUI」を試したので、まとめました。
1. ComfyUI「ComfyUI」は、モジュール式の「StableDiffusion」のGUIです。グラフ/ノード/フローチャートベースのインターフェイスを使用して、コーディングなしに高度な「StableDiffusionパイプライン」を設計および実行することができます。
特徴は、次のとおりです。
diffusers で LoRA を試す
「diffusers」で「LoRA」を試したので、まとめました。
1. LoRA「LoRA」(Low-Rank Adaptation)は、AIモデルの効率的な調整やカスタマイズのための手法です。手法は、モデルの重みを直接調整するのではなく、低ランク(小さい次元)の行列を用いてモデルの一部の重みを調整することにより、モデルの振る舞いを変更します。
この手法には、多くの利点があります。
「LoR