マガジンのカバー画像

【画像生成AI】SDXL と Flux.1 の気づき

36
Stable Diffusiion XL と Flux.1 を使う上でのテクニックと気づいたことをまとめました
運営しているクリエイター

記事一覧

キーワードで何でも検知!? Florence-2 の画像認識はこんなに便利!

はじめにこんにちは、きまま / Easygoing です。 今回は、高性能な 画像認識 AI の Florence-2 の活用法を考えます。 お題:黒猫と魔女今回のお題は黒猫と魔女です。 ファンタジーの世界で。使い魔の黒猫と一緒に暮らす魔女さんを描いてみます。 イラストの軟調と硬調とは?イラストは、その雰囲気によって軟調と硬調の2つに分けることができます。 軟調(soft tone) 柔らかく穏やかなタッチ コントラストが低く、明暗の差が少ない 優しい印象や、

最強の自動プロンプトはどれ? TIPO・Cliption・Florence-2 を徹底比較!

はじめにこんにちは、きまま / Easygoing です。 今回も前回に引き続き、画像生成のプロンプトを自動で作る方法を考えます。 キーワード VS 画像前回、自動でプロンプトを作るには、キーワードと画像を使う2種類の方法があることをご紹介しました。 前回は高性能で万能な ChatGPT を使いましたが、今回はローカルで使える LLM と VLM を探してみます。 キーワードからプロンプトを作るキーワードからプロンプトを作る場合、使用するのは LLM(大規模言語モデル

画像生成のプロンプトを楽して作る! まずは ChatGPT で試してみよう

はじめにこんにちは、きまま / Easygoing です。 今日は、ChatGPT を使って画像生成 AI のプロンプトを作る方法を紹介します。 今回の記事は、画像を生成するときにプロンプトをどのように書けば良いか悩んでいる、初心者向けの内容になります。 お題:人なつこいインコ今回のお題は、人なつこいインコです。 かわいいインコが、人と触れ合う場面を描いてみます。 自動でプロンプトを作る方法は2つ画像生成AI で自動でプロンプトを作る方法は、大きく分けて次の2つがあ

Adobe Firefly / SDXL / Flux.1 画像生成 AI の1年を振り返る

はじめにこんにちは、きまま / Easygoing です。 今回は、この1年の振り返り記事を書いてみようと思います。 はじめての振り返り記事前回の記事で、有難いことに昔のイラストを見てみたいというコメントを頂きました。 私は普段から新しい技術はいろいろ試していますが、今まで過去を振り返って考えることはあまりありませんでした。 画像生成 AI はこの一年で劇的に進化しましたし、利用者である私も試行錯誤しながら新しい使い方を探しています。 今回の記事は AI の進化とい

画質の評価は難しい! WaveSpeed と Dynamic Caching の高速化を探る!

はじめにこんにちは、きまま / Easygoing です。 今回は、前回に引き続き、WaveSpeed について検証します。 今回も、かなり技術的な内容に寄った記事になりますが、よろしくお付き合いください。 画像生成は最初が大事!WaveSpeed は、画像生成を劇的に高速化する技術です。 前回、WaveSpeed の効果を検証しているとき、特に start の値を変えるとイラストが大きく変わることに気がつきました。 画像生成は、ノイズ画像から少しずつノイズを除去し

Flux.1 が爆速に? WaveSpeed で高速生成! 画質はどうなる?

はじめにこんにちは、きまま / Easygoing です。 今回は、画像生成の高速化技術、WaveSpeed を検証します。 WaveSpeed って何?WaveSpeed は、2025.1.8 に公開された 画像生成を劇的に高速化 する技術です。 WaveSpeed は ComfyUI のカスタムノードの形で提供されていて、ComfyUI でのみ利用することができます。 画像生成AI の Flux.1 / SD 3.5 / SDXL で利用できるほか、動画生成AI

【画像生成AI】 AIにアイディアをもらう! プロンプトを自動で生成する方法

はじめにこんにちは、きまま / Easygoing です。 上のイメージ画像は、はいぱーさんかく さんが公開されている AI マンガ創作支援アプリ、「Manga Editor DESU!」を使ってレイアウトしたものです。 このアプリは、多彩な機能を 無料 で利用することができます! このアプリの使い方は、また改めてご紹介したいと思います。 今回は 画像生成AI で、自動でプロンプトを生成する方法を考えます。 お題:スーパーカーのコンセプトアート今回のお題はスーパーカ

【画像生成AI】 Flux.1 の圧縮形式を徹底比較! その違いは構図力!

謹賀新年あけましておめでとうございます! 今年もよろしくお願いします! お題:初詣さて、今回のお題は初詣です。 正月休みも終わりですが、新年初めての投稿なのでこのお題でいってみます! モデルの圧縮は画質に影響する?前回は、テキストエンコーダーをアップグレードして、イラストのクオリティーを上げる方法を調べました。 今回は、画像を生成する本体のトランスフォーマー部分で、圧縮形式が画質にどのように影響するのか検証します。 実際の比較まずは、実際のイラストを比較してみます。

そのイラストは高画質? 実際の数値で比べよう! Flan-T5xxl と CLIP-L を徹底比較!

はじめにこんにちは、きまま / Easygoing です。 今日は、イラストを見比べる方法について考えます。 お題:ウィンタースポーツ今回のお題はウィンタースポーツです。 スキー場で仲間とともに楽しく過ごす様子を、イラストに描いてみます。 Image Difference Checkerまず、画像の違いについて客観的に評価するために、新しく Webページを作りました。 今回作成したページはこちらです。 このページでは、2枚の画像を入力すると次の結果を出力します。

【画像生成AI】 Negative Prompt は必要か? AI の創造性を解き放つ!

はじめにこんにちは、きまま / Easygoing です。 今日は 画像生成AI の Negative Prompt について考えます。 お題:夜のスナップショット今回のお題は、夜のスナップショットです。 町を歩いている時に、ふとした瞬間に見かけた表情を切り取ってみます。 AI はプロンプトをどう再現する?私たちは、AI で生成したい画像のイメージしながら プロンプトを入力しています。 赤:目的の画像 緑:Conditioning(プロンプトを入れると生成される画

【SDXL】 アニメオタクは辞書で賢くなる? 最新の noob_v_pencil-XL の系譜

はじめにこんにちは、きまま / Easygoing です。 今回は Stable Diffusion XL のプロンプトの理解について考えます。 お題:遊園地のイルミネーションさて、今回のお題は遊園地のイルミネーションです。 キラキラの LED とは少し違った、少し大人なシャンパンゴールドの灯りを再現してみます。 テキストエンコーダーは辞書前回、テキストエンコーダーが入力したプロンプトを理解する辞書の働きをすることを紹介しました。 新しい 画像生成AI の Flux

【画像生成AI】 CLIP と T5xxl って何? テキストエンコーダーでイラストがこんなに綺麗になる!

はじめにこんにちは、きまま / Easygoing です。 今日は 画像生成AI のテキストエンコーダーについて考えます。 テキストエンコーダーは辞書AI は、私たち入力したテキストを、機械が分かる形に変えて理解しています。 この翻訳をするのがテキストエンコーダーで、その働きは 人間語を機械語に翻訳する辞書 にあたります。 画像生成AI でテキストエンコーダーを変更すると、画質はどのように変わるのでしょうか? 実際の画像を比較!それでは、新しい 画像生成AI の F

Flux.1 を快適に使おう! Stable Diffusion webUI Forge と ComfyUI で GGUF 形式を利用する方法

はじめにこんにちは、きまま / Easygoing です。 今回は、Flux.1 を快適に動かすことができる GGUF 形式について紹介します。 Flux.1 のモデルは容量が大きい前回紹介したように、新しい画像生成AI の Flux.1 は、モデルの容量が大きいので、FP16 / FP8 形式で使うには VRAM 16GB が必要でした。 最近になって普及した GGUF 形式 は、量子化圧縮を行うことでメモリの使用量を大きく減らすことができるようになりました。 今回

【画像生成AI】 Flux.1 / SD 3.5 / AuraFlow を快適に使いたい! VRAM は 16GB 必要なの?

はじめにこんにちは、きまま / Easygoing です。 今回は 画像生成AI を使うときにベストな GPU を探します! 参考になるサイト!まずはじめに、画像生成AI で利用する GPU を比較するとき、とても参考になるサイトをご紹介します。 Tim Dettmers's Blog(英語) このブログでは、米国のAI研究所のスタッフが、AI の計算に必要なハードウェアについて詳細に解説しています。 まずは一覧のグラフ!まず最初に、先ほどのサイトから GPU の性