マガジンのカバー画像

Image Generation

157
運営しているクリエイター

#人工知能

Google Colab で Flux の ControlNet を試す

Google Colab で Flux の ControlNet を試す

「Google Colab」で「Flux」の「ControlNet」を試したのでまとめました。

前回1. ControlNet「ControlNet」は、「Stable Diffusion」モデルにおいて、新たな条件を指定することで生成される画像をコントロールする機能です。プロンプトでは指示しきれないポーズや構図の指定が可能になります。

今回は、「InstantX」提供の「ControlNet

もっとみる
ComfyUI で FLUX.1 の画像生成とLoRAを試す

ComfyUI で FLUX.1 の画像生成とLoRAを試す

「ComfyUI」で「FLUX.1」の画像生成とLoRAを試したのでまとめました。

1. FLUX.1「FLUX.1」は、「Stable Diffusion」の開発者たちが立ち上げた「Black Forest Labs」が発表した最新の画像生成AIモデルです。

2. Fluxの画像生成Fluxの画像生成の手順は、次のとおりです。

(1) 「Stability Matrix」で「ComfyUI

もっとみる
Google Colab で Flux のLoRAファインチューニングを試す

Google Colab で Flux のLoRAファインチューニングを試す

「Google Colab」で「Flux」のLoRAファインチューニングを試したのでまとめました。

1. AI Toolkit by Ostris今回は「AI Toolkit by Ostris」で「Flux」のLoRAファインチューニングを行いました。

2. 学習データの準備今回は、「東北ずんこ・ずんだもんプロジェクト」で提供されている「画像学習用データ」を使います。

(1) 「東北ずんこ

もっとみる
Quanto と Diffusers による Diffusion Transformers のメモリ削減

Quanto と Diffusers による Diffusion Transformers のメモリ削減

以下の記事が面白かったので、簡単にまとめました。

1. はじめにここ数か月間、高解像度のText-to-Image (T2I) にTransformerベースのdiffusionバックボーンが使用されるようになりました。これらのモデルは、初期のdiffusionモデルの多くで普及していたUNetアーキテクチャではなく、diffusionプロセスの構成要素としてTransformerアーキテクチャ

もっとみる
Google Colab で FLUX.1 を試す

Google Colab で FLUX.1 を試す

「Google Colab」で「FLUX.1」を試したので、まとめました。

1. FLUX.1「FLUX.1」は、「Stable Diffusion」の開発者たちが立ち上げた「Black Forest Labs」が発表した最新の画像生成AIモデルです。

2. FLUX.1 [dev]「Google Colab」でのFLUX.1 [dev] (ガイダンス蒸留モデル) の実行手順は、次のとおりです

もっとみる
FLUX.1 の概要

FLUX.1 の概要

「FLUX.1」の概要をまとめました。

1. FLUX.1「FLUX.1」は、「Stable Diffusion」の開発者たちが立ち上げた「Black Forest Labs」が発表した最新の画像生成AIモデルです。

2. FLUX.1 のモデル「FLUX.1」には、アクセシビリティと機能のバランスをとるために、FLUX.1 [pro]、FLUX.1 [dev]、FLUX.1 [schnell

もっとみる
デルタもんLoRAの正式版を公開します。

デルタもんLoRAの正式版を公開します。

こんにちは、BlendAI運営です。

デルタもんLoRAの正式版を公開しました。 以下からダウンロード可能です。

booth (学習データセット付き)
https://blendai.booth.pm/items/5801621

civitai (LoRAのみ)
https://civitai.com/models/492694

デルタもん公式LoRA version1.0の特徴についてご

もっとみる
Google Colab で デルタもんLoRA を試す

Google Colab で デルタもんLoRA を試す

「Google Colab」で「デルタもんLoRA」を試したので、まとめました。

1. デルタもんLoRA「デルタもんLoRA」が「アルファパラダイス」のキャラクター「デルタもん」のLoRAです。「アルファパラダイス」のイラスト・音声・3Dデータなどのコンテンツは、AI に関連した利用に限り、目的を問わず自由に使うことができるとのこと。

2. Colabでの実行Colabでの実行手順は、次のと

もっとみる
ComfyUI で Stable Cascade を試す

ComfyUI で Stable Cascade を試す

「ComfyUI」で「Stable Cascade」を試したので、まとめました。

1. Stable Cascade のモデル「HuggingFace」の「stabilityai/stable-cascade」からモデルをダウンロードして、「ComfyUI」の「models」フォルダに配置します。

2. Stable Cascade の実行「Stable Cascade」の実行手順は、次のとお

もっとみる
ComfyUI で IPAdapter + ControlNet を試す

ComfyUI で IPAdapter + ControlNet を試す

「ComfyUI」で「IPAdapter + ControlNet」を試したので、まとめました。

1. ComfyUI_IPAdapter_plus「ComfyUI_IPAdapter_plus」は、「IPAdapter」モデルの「ComfyUI」リファレンス実装です。メモリ効率が高く、高速です。

・IPAdapter + ControlNet
「IPAdapter」と「ControlNet」

もっとみる
diffusersのアダプタ まとめ

diffusersのアダプタ まとめ

以下の記事が面白かったので、かるくまとめました。

1. diffusersのアダプタ画像生成モデルをパーソナライズして、特定の被写体の画像のスタイルの画像を生成するための学習手法がいくつかあります。

これらの学習方法ごとに、「diffusers」では異なるタイプの「アダプタ」を提供しています。「アダプタ」は、そのモデルが生成する画像のスタイルや特性を調整するための追加的なコンポーネントを指しま

もっとみる
Google Colab で RPG-DiffusionMaster を試す

Google Colab で RPG-DiffusionMaster を試す

「Google Colab」で「RPG-DiffusionMaster」を試したので、まとめました。

1. RPG-DiffusionMaster「RPG-DiffusionMaster」は、マルチモーダル LLM (PRG) によって複雑かつ構成的なText-to-Imageの生成・編集でdiffusionモデルをマスターし、最先端のパフォーマンスを実現するフレームワークです。

核となる戦略

もっとみる
Google Colab で ComfyUI を試す

Google Colab で ComfyUI を試す

「Google Colab」で「ComfyUI」を試したので、まとめました。

1. ComfyUI「ComfyUI」は、モジュール式の「StableDiffusion」のGUIです。グラフ/ノード/フローチャートベースのインターフェイスを使用して、コーディングなしに高度な「StableDiffusionパイプライン」を設計および実行することができます。

特徴は、次のとおりです。

diffusers で LoRA を試す

diffusers で LoRA を試す

「diffusers」で「LoRA」を試したので、まとめました。

1. LoRA「LoRA」(Low-Rank Adaptation)は、AIモデルの効率的な調整やカスタマイズのための手法です。手法は、モデルの重みを直接調整するのではなく、低ランク(小さい次元)の行列を用いてモデルの一部の重みを調整することにより、モデルの振る舞いを変更します。

この手法には、多くの利点があります。

「LoR

もっとみる