マガジンのカバー画像

建築設計における生成AI活用の試み

47
建築設計分野における生成AI(Generative AI)の活用によって、革新的なデザインの創出や自動化・効率化、そして持続可能な建築の実現を目指しています。
運営しているクリエイター

記事一覧

Replicate API経由で Google Imagen 3 を利用し、画像生成する(商用利用可能)

生成AIプラットフォームの Replicateで、Google の画像生成モデル Imagen 3(ImageFX)がAPI経由で利用できるようになり、Google Labs には明記されていない商用利用が可能と記されています。 また、Imagen 3 は Google と協力して保守を行う公式モデルとなっており、課金は生成時間単位ではなく、$0.05/画像で固定されているとのこと。 そこで、Dify で作成している 複数モデル対応画像生成アプリに Imagen 3 を追

FLUX.1 ToolsのRedux機能で、2枚の建築画像をリミックス

前回は、「FLUX.1 Tools」の 「FLUX.1 Redux」の例として、元画像の主要な要素を維持したままバリエーション画像を複数枚生成しました。 今回は、ComfyUI のブログにある Redux 機能のワークフローサンプルのように、2枚の画像をリミックスして新たな画像を生成してみます。 2枚の画像を Redux 機能によってリミックスし、新たに生成された画像です。この例では、FluxGuidance を5.0に設定しています。 また、FluxGuidance

FLUX.1 Toolsで、建築画像の修正や再生成を試してみる

2024年11月21日、Black Forest Labs が生成された画像の修正や再生成を可能にする拡張AIモデル群「FLUX.1 Tools」をリリースしました。 このツール群は、テキストから画像を生成する基本モデル「FLUX.1」に、より細やかな制御と操作性を追加することを目的として開発され、研究者向けのオープンアクセスモデル「FLUX.1 [dev]」とプロフェッショナル向けの「FLUX.1 [pro]」の双方で利用できます。 現在、「FLUX.1 Tools」で

Recraftのモックアップ機能で、画像生成した建築パースにテクスチャーを貼り付けてみる

少し前、建築画像の生成をテストした Recraft V3 ですが、自由度が高く使いやすいUIを備えており、長文のプロンプト(日本語対応)による高速かつ高精度な画像生成が可能で、SVG形式のベクターグラフィックス生成・出力にも対応するなど、プロトタイプデザインや高度なデザインワークを実現する画像生成AIサービスとなっています。 Recraft には、製品やデザインのモックアップを簡単に作成できる機能があり、この機能を利用することで、Tシャツやマグカップなど、製品の形状に合わせ

MidjourneyのRetexture機能でプロポーザル提案書のイメージパースを作成してみる

以前、高機能なペイントソフト「Krita」と画像生成AI用プラグイン「krita-ai-diffusion」を使用して、プロポーザル提案書用のイメージパースを作成できないか試していました。 そうこうしているうちに、10月24日、Midjourneyから新機能「Retexture」のテスト版がリリースされました。「Retexture」は既存画像にスタイルを適用し、輪郭やアングルを維持したまま、見た目や質感を変更することができる機能です。 そこで、Midjourney v6.

Recraft V3で建築画像を生成してみる

Recraft V3は英国のRecraft社が10月30日に発表した画像生成モデルで、Midjourney v6.1 やFLUX 1.1 [pro]をしのぐELOスコア(イロ レーティング)を記録して話題となりました。 また、Recraft V3 はプロンプトに日本語が使えたり、生成画像に様々なスタイルを適用できるなど、高品質で多機能な画像生成モデルで、自由度が高くて使いやすいUIを備えているところも魅力です。 で、相変わらずですが、Recraft v3で、FLUX.1

FLUX 1.1 [pro] のUltra/Rawモードで建築画像を生成してみる

11月初旬、ドイツのBlack Forest Labsが、FLUX 1.1 [pro] に高速かつ高解像度の画像生成が可能な Ultraモードと、人物の多様性やより自然な写真表現を実現した Rawモードを追加しました。 FLUXシリーズは、これまで FLUX.1 [dev]、FLUX1.1 [pro] で建築画像を生成しましたが、Replicateで「FLUX 1.1 [pro] Ultra」のAPIが利用可能になったので、FLUX.1 [dev]、Igeogeam 2.0

複数モデル対応画像生成アプリをアップデート+SD 3.5/Recraft追加

Difyが0.10にアップデートされて、以前作成した複数モデル対応画像生成アプリに不具合が出るようになっていたので、可能な限り修正するとともに、新たな画像生成モデルとして「Stable Diffusion 3.5 Large」「Recraft」を追加することにしました。 生成画像のインライン表示 不具合が出ていたのは、前回 v0.9.2 対応として変更した、各画像生成AIの生成画像アップロード先URLから、「HTTPリクエスト」ブロックで画像をGETして「回答」ブロックに

Stable Diffusion 3.5 Largeで建築画像を生成してみる

10月22日、Stability AI から Stable Diffusion 3.5 を公開されました。Stable Diffusion 3よりも プロンプト準拠性と生成画像の画質が高くなっているとのこと。どんな建築画像を生成してくれるのか気になるところですよね。 で、相変わらずですが、Stable Diffusion 3.5 Large モデルで、FLUX.1 [dev]、Igeogeam 2.0、ImageFx、FLUX1.1 [pro] 、Midjourney v6

複数モデル対応画像生成アプリをDify v0.9.2に対応させる

Saas版 Dify が v0.9.2 に更新され、新機能の実装や既存機能の強化が行われると同時に、コンテンツセキュリティポリシー(CSP)もサポートされるようになりました。 そのせいか、以前 作成した複数モデルを切替えながら画像生成ができる、自分専用のWebアプリで、生成結果の画像がインライン表示されなくなってしまいました。 このアプリでは、各画像生成AIよって生成された画像のURLを、「回答」ブロックに直接 Markdown 記法で「![代替テキスト](画像のURL)

画像生成AI対決!建築画像生成16番勝負(2024.10.1版)

これまで同じプロンプトを使用して、様々な画像生成モデル(「FLUX1.1 [pro]」「Ideogram 2.0」「Midjoruney v6.1」「Imagen 3」)で建築画像を生成してきましたが、新たに「Stable Diffusion 3 Turbo」「Firefly Image 3」「DELL-E 3」を加え、16種類のプロンプトで比較してみました。 上段の「FLUX1.1 [pro]」「Ideogram 2.0」「Midjoruney v6.1」「Imagen

FLUX1.1[pro]で建築画像を生成してみる

10月2日、Black Forest Labs から最新の画像生成モデル FLUX1.1 [pro] とベータ版の BFL API の一般提供が開始されたので、以前の FLUX.1 [dev]、Igeogeam 2.0、ImageFxと同じプロンプトで建築画像を生成させてみます。 FLUX1.1 [pro] は、Black Forest Labs と提携している fal.ai 経由で使用しています。また、fal.aiでは、FLUX.1 [dev] の2倍の生成速度を実現する

Midjourney v6.1で建築画像を生成してみる

前回は、FLUX1.1 [pro]で建築画像を生成しましたが、やはり、Midjourney v6.1 と比較してみないとね、ということで、FLUX.1 [dev]、Igeogeam 2.0、ImageFx、FLUX1.1 [pro] と同じプロンプトで建築画像を生成させてみます。 内観 Realistic high-resolution image of a luxury car showroom in Tokyo. The large, floor-to-ceiling

LLMと画像生成AIを組み合わせ、デザインコンセプトを4象限マトリクスで整理・検討する

設計の初期段階でデザインの方向性を決めたり、ステークホルダー間でイメージを共有するため、デザインコンセプトを縦横2軸の4象限のマトリクスで整理・検討することがありますが、それを、GPT-4oと画像生成AIを組み合わせて、Difyのワークフローによって自動化することを考えます。 例えば、オフィスのインテリアイメージのコンセプトとして、下図のようにX軸をカジュアル(-1.0)~フォーマル(1.0)、Y軸を木質(-1.0)~無機質(1.0)に設定し、それぞれの数値でコンセプトの強