記事一覧
そのイラストは高画質? 実際の数値で比べよう! Flan-T5xxl と CLIP-L を徹底比較!
はじめにこんにちは、きまま / Easygoing です。
今日は、イラストを見比べる方法について考えます。
お題:ウィンタースポーツ今回のお題はウィンタースポーツです。
スキー場で仲間とともに楽しく過ごす様子を、イラストに描いてみます。
Image Difference Checkerまず、画像の違いについて客観的に評価するために、新しく Webページを作りました。
今回作成したページ
画質の評価は難しい! WaveSpeed と Dynamic Caching の高速化を探る!
はじめにこんにちは、きまま / Easygoing です。
今回は、前回に引き続き、WaveSpeed について検証します。
今回も、かなり技術的な内容に寄った記事になりますが、よろしくお付き合いください。
画像生成は最初が大事!WaveSpeed は、画像生成を劇的に高速化する技術です。
前回、WaveSpeed の効果を検証しているとき、特に start の値を変えるとイラストが大きく
Flux.1 が爆速に? WaveSpeed で高速生成! 画質はどうなる?
はじめにこんにちは、きまま / Easygoing です。
今回は、画像生成の高速化技術、WaveSpeed を検証します。
WaveSpeed って何?WaveSpeed は、2025.1.8 に公開された 画像生成を劇的に高速化 する技術です。
WaveSpeed は ComfyUI のカスタムノードの形で提供されていて、ComfyUI でのみ利用することができます。
画像生成AI の
テキストでオブジェクトを新しい環境に配置できるフレームワーク「OminiControl」を試してみる
「OminiControl」とはOminiControlは、Diffusion Transformerモデル(FLUXのようなやつ)に対応した強力な汎用コントロールフレームワークとして最近話題になっていました!
主題の制御に優れており、入力画像内の特定のオブジェクトを指定するだけで、テキストプロンプトを用いてそのオブジェクトをまったく新しい環境に配置することができるとのこと。
空間的な制御能力にも
建築ビジュアル CG AI 活用法⑰ 360°画像生成AI① AUTOMATIC1111/ComfyUI
こんにちは。STUDIO55技術統括の入江です。
画像生成AIによる 360°パノラマ画像 の作成は、建築ビジュアルのCG制作において、スカイボックス や 環境データ として活用でき、制作の幅を広げます。既存のHDR画像を入手するだけでなく、独自の環境データを作成することで、より柔軟で多様な表現が可能になります。
本日は、Stable Diffusion を活用した360度パノラマ画像の生成につ
建築ビジュアル CG AI 活用法⑱ 360°画像生成AI② Skybox AI
こんにちは。STUDIO55技術統括の入江です。
AI の活用法の中でも、360度パノラマ による画像生成は、環境表現としてさまざまなジャンルで活用が期待できるワークフローです。
エンターテイメント・ゲームの体験型コンテンツ、広告・マーケティング、アート等、その利用幅は広く、特に建築ビジュアルの表現に際しては、CG制作における背景、環境光ライティングとして期待ができるものとなります。
前回は、S
CLIP Text Deprojectorを使って画像生成してみる ~学習データを増やす~ (最終回)
前回の更新から半年ほど経ちましたが、このシリーズは今回で最終回としたいと思います。
このところ、モデルの性能に大きな改善が見られないことと、すでに使っているモデルが古くなってしまっていることから、このプロジェクトを継続する意味があまりなくなっていると思われるためです。
そこで、今回は、前回提案したモデルアーキテクチャのまま、学習データを増やして性能評価をして、最終モデルとすることにしました。
【ComfyUI】商用利用可能なFLUX.1[dev]並のモデル登場!OpenFLUX.1を評価してみた
画像生成AIの進化は止まりません。新たに登場した「OpenFLUX.1」は、すでに高評価を得ているFLUX.1-schnellモデルをベースに、「蒸留」を取り除いたことで、さらに高い柔軟性を持ったオープンソースのツールです。従来のモデルが持つ課題を克服しつつ、微調整(ファインチューニング)が可能な設計で、より高品質な画像をわずか数ステップで生成できます。
この記事では、OpenFLUX.1がどの
複雑なデザインの同じキャラを複雑なポーズや構図の中に生成する方法【ほぼ日AI生成Tips #8】 #nijijourney
もうちょっと作り込んだデザインのキャラをシリーズ画像の登場人物として生成したい!!!
イメージを形にすべく研究を行いました。
同キャラ生成の課題同キャラを生成していく場合の課題になってくるのは、複雑なポーズや構図になるほど、キャラクターの描写は薄くせざるを得ません生成時のプロンプトは長くなるほどAIが読みこんでくれるかは運になってきます。
読み込むプロンプトの単語数の限界
プロンプトは長け
【今旬の画像生成AIの比較】特徴と使用感の所感【Midjourney,FLUX-1,StableDiffusion,SeaArt,DALL-E3】
画像生成AIはどれを選べばいいかわからない?
この記事では、主要な画像生成AIの特徴と使い心地について、実際に使ってみた経験と偏見も交えながら比較してみようとおもいます。
あらかじめ言っておきます。
月額払うなら私はMidjourney・Niji journey派です。
MidJourney(ミッドジャーニー)
特徴: アート風や幻想的な画像作りが得意です。クリエイティブな仕事をする人におす
立体視出来るステレオ動画をComfyUIで生成する(mp4変換フロー):Xreal Air用
今回は表題通り、生成したAI動画をxreal airで立体視で見ることが出来るステレオ動画に変換する方法になります。
基本は、前回記事で取り上げたDepth anything2とNegitoolsを使用した方法を使います。
試しに、以前生成したAI動画をステレオ動画化してみたいと思います。
プロパティで、FPS、フレーム数を予め確認しておきます。
この動画だと、10FPSで60フレームでした
そうだ!AI画像生成をちゃんと勉強しよう💡15章:ControlNet その5
ControlNet「Segmentation」「Shuffle」「Tile」
※勉強するのはStable Diffusion、SeaArt系になります。
コントロールネットについては残すところあと3つになりました。
その残りの、「Segmentation」「Shuffle」「Tile」を学んでいきたいと思います。
今日で終わったらいいな~😙
本日も変わらず等身大の私ですよろしくお願いしま