Image Generation｜thomas

2024年12月28日 17:14

そのイラストは高画質？　実際の数値で比べよう！　Flan-T5xxl と CLIP-L を徹底比較！

はじめにこんにちは、きまま / Easygoing です。

今日は、イラストを見比べる方法について考えます。

お題：ウィンタースポーツ今回のお題はウィンタースポーツです。

スキー場で仲間とともに楽しく過ごす様子を、イラストに描いてみます。

Image Difference Checkerまず、画像の違いについて客観的に評価するために、新しく Webページを作りました。

今回作成したページ

もっとみる

きまま / Easygoing

2025年1月24日 17:38

画質の評価は難しい！　WaveSpeed と Dynamic Caching の高速化を探る！

はじめにこんにちは、きまま / Easygoing です。

今回は、前回に引き続き、WaveSpeed について検証します。

今回も、かなり技術的な内容に寄った記事になりますが、よろしくお付き合いください。

画像生成は最初が大事！WaveSpeed は、画像生成を劇的に高速化する技術です。

前回、WaveSpeed の効果を検証しているとき、特に start の値を変えるとイラストが大きく

もっとみる

きまま / Easygoing

2025年1月18日 10:59

Flux.1 が爆速に？　WaveSpeed で高速生成！　画質はどうなる？

はじめにこんにちは、きまま / Easygoing です。

今回は、画像生成の高速化技術、WaveSpeed を検証します。

WaveSpeed って何？WaveSpeed は、2025.1.8 に公開された画像生成を劇的に高速化する技術です。

WaveSpeed は ComfyUI のカスタムノードの形で提供されていて、ComfyUI でのみ利用することができます。

画像生成AI の

もっとみる

SUTO

2024年11月28日 11:24

テキストでオブジェクトを新しい環境に配置できるフレームワーク「OminiControl」を試してみる

「OminiControl」とはOminiControlは、Diffusion Transformerモデル（FLUXのようなやつ）に対応した強力な汎用コントロールフレームワークとして最近話題になっていました！
主題の制御に優れており、入力画像内の特定のオブジェクトを指定するだけで、テキストプロンプトを用いてそのオブジェクトをまったく新しい環境に配置することができるとのこと。
空間的な制御能力にも

もっとみる

One More Vision

2024年11月18日 08:00

建築ビジュアル CG AI 活用法⑰ 360°画像生成AI① AUTOMATIC1111/ComfyUI

こんにちは。STUDIO55技術統括の入江です。
画像生成AIによる 360°パノラマ画像の作成は、建築ビジュアルのCG制作において、スカイボックスや環境データとして活用でき、制作の幅を広げます。既存のHDR画像を入手するだけでなく、独自の環境データを作成することで、より柔軟で多様な表現が可能になります。

本日は、Stable Diffusion を活用した360度パノラマ画像の生成につ

もっとみる

One More Vision

2024年11月25日 08:00

建築ビジュアル CG AI 活用法⑱ 360°画像生成AI② Skybox AI

こんにちは。STUDIO55技術統括の入江です。
AI の活用法の中でも、360度パノラマによる画像生成は、環境表現としてさまざまなジャンルで活用が期待できるワークフローです。
エンターテイメント・ゲームの体験型コンテンツ、広告・マーケティング、アート等、その利用幅は広く、特に建築ビジュアルの表現に際しては、CG制作における背景、環境光ライティングとして期待ができるものとなります。

前回は、S

もっとみる

npaka

2024年11月22日 07:41

FLUX.1 Tools の概要

以下の記事が面白かったので、簡単にまとめました。

1. FLUX.1 Tools「FLUX.1 Tools」は、Text-to-Imageのベースモデル「FLUX.1」に制御と操作性を追加し、実際の画像と生成された画像の変更と再作成を可能にするように設計されたモデルスイートです。リリース時には、FLUX.1 [dev] シリーズのオープンアクセスモデルとして提供される4つの機能で構成されています

もっとみる

七師

2024年11月20日 00:08

CLIP Text Deprojectorを使って画像生成してみる　～学習データを増やす～　（最終回）

前回の更新から半年ほど経ちましたが、このシリーズは今回で最終回としたいと思います。

このところ、モデルの性能に大きな改善が見られないことと、すでに使っているモデルが古くなってしまっていることから、このプロジェクトを継続する意味があまりなくなっていると思われるためです。

そこで、今回は、前回提案したモデルアーキテクチャのまま、学習データを増やして性能評価をして、最終モデルとすることにしました。

もっとみる

IT navi

2024年11月13日 00:30

オンライン画像生成AIのSeaArt AIの使い方

今回は、オンラインで簡単に様々な画像生成AIモデルを無料で使用できるSeaArt AIについて紹介します。

SeaArt AIは日本語入力に対応しており、基本的な画像生成以外にも、動画生成、フェイススワップ、背景変更など多彩な機能を提供しています。

１．SeaArt AIの概要SeaArt AIはシンガポールのSTAR CLUSTER PTE. LTD.という会社が運営するオンライン画像生成A

もっとみる

アイドリ | AI-Driven Lab

2024年10月4日 11:04

【ComfyUI】商用利用可能なFLUX.1[dev]並のモデル登場！OpenFLUX.1を評価してみた

画像生成AIの進化は止まりません。新たに登場した「OpenFLUX.1」は、すでに高評価を得ているFLUX.1-schnellモデルをベースに、「蒸留」を取り除いたことで、さらに高い柔軟性を持ったオープンソースのツールです。従来のモデルが持つ課題を克服しつつ、微調整（ファインチューニング）が可能な設計で、より高品質な画像をわずか数ステップで生成できます。

この記事では、OpenFLUX.1がどの

もっとみる

糸巻れん@AIクリエイター

2024年9月27日 23:25

複雑なデザインの同じキャラを複雑なポーズや構図の中に生成する方法【ほぼ日AI生成Tips #8】 #nijijourney

もうちょっと作り込んだデザインのキャラをシリーズ画像の登場人物として生成したい！！！

イメージを形にすべく研究を行いました。

同キャラ生成の課題同キャラを生成していく場合の課題になってくるのは、複雑なポーズや構図になるほど、キャラクターの描写は薄くせざるを得ません生成時のプロンプトは長くなるほどAIが読みこんでくれるかは運になってきます。

読み込むプロンプトの単語数の限界

プロンプトは長け

もっとみる

糸巻れん@AIクリエイター

2024年9月26日 23:26

【今旬の画像生成AIの比較】特徴と使用感の所感【Midjourney,FLUX-1,StableDiffusion,SeaArt,DALL-E3】

画像生成AIはどれを選べばいいかわからない？
この記事では、主要な画像生成AIの特徴と使い心地について、実際に使ってみた経験と偏見も交えながら比較してみようとおもいます。

あらかじめ言っておきます。
月額払うなら私はMidjourney・Niji journey派です。

MidJourney（ミッドジャーニー）

特徴: アート風や幻想的な画像作りが得意です。クリエイティブな仕事をする人におす

もっとみる

shiba*2

2024年7月21日 09:33

立体視出来るステレオ動画をComfyUIで生成する(mp4変換フロー):Xreal Air用

今回は表題通り、生成したAI動画をxreal airで立体視で見ることが出来るステレオ動画に変換する方法になります。

基本は、前回記事で取り上げたDepth anything2とNegitoolsを使用した方法を使います。

試しに、以前生成したAI動画をステレオ動画化してみたいと思います。
プロパティで、FPS、フレーム数を予め確認しておきます。

この動画だと、10FPSで60フレームでした

もっとみる

AI勉強中！okachanzzz

2024年8月16日 20:16

そうだ！AI画像生成をちゃんと勉強しよう💡15章：ControlNet その5

ControlNet「Segmentation」「Shuffle」「Tile」

※勉強するのはStable Diffusion、SeaArt系になります。

コントロールネットについては残すところあと３つになりました。
その残りの、「Segmentation」「Shuffle」「Tile」を学んでいきたいと思います。
今日で終わったらいいな～😙

本日も変わらず等身大の私ですよろしくお願いしま

もっとみる

Image Generation

フォローしませんか？

記事一覧