空間AI白書 - 活用編その3
こんにちは。
NOI STUDIO の 布井 です。
NOI STUDIOでは、宮下さんと共に、建築分野での画像生成AI活用に関する研究をすすめてきました。大手の企業さまからお声かけ頂き、実務案件での活用提案も進めています。このあたりで一度、建築設計の文脈での活用に関する知見を一度まとめておこうと筆を執りました。特にstable diffusionに活用した内容になっています。
宮下さんによる空間AI白書と併せてご覧ください。
前提知識
画像生成とは
画像生成は、人工知能(AI)技術を用いて、新しい画像を生成するプロセスです。この分野では、機械学習アルゴリズムが大量の画像データからパターンを学習し、これを基にして新しい画像を作り出します。画像生成AIを使うことができるサービスは多々ありますが、機能の拡張性からstable diffusionを活用した事例をメインに紹介していきます。元画像はmidjourneyで生成してます。
stable diffusionの特徴
stable diffusionと他の画像生成AIを比較すると、その大きな違いはControlNetという技術の使いやすさにあります。ControlNetは、画像生成プロセスを制御するための技術です。生成される画像をより詳細に制御できるようになります。
ControlNetの種類
ControlNetには様々な種類が存在し、異なる機能と特性を持っています。これらの機能を組み合わせることで、AIを使ったさまざまな検討が可能になります。今回紹介する事例の中で主に活用したものを紹介します。
Inpainting: 画像の欠損部分を補完する技術です。ControlNetではInpaintという名前です。機能を適応させたい部分をマスクで指定し、画像を再構成します。不完全な部分を修復したり、新しい要素を追加することができます。
Canny: エッジ検出アルゴリズムであり、画像内の輪郭やエッジを強調することができます。全体の構図や配置を元画像から引き継ぎます。
Depth: 画像内の物体間の距離感を再現します。これにより、3Dのような効果やリアルな深度感のある画像が生成できます。Cannyのように境界線のデータを引き継がないので、ボリューム感のみ引き継ぐことができます。
Lineart: 画像を線画のスタイルで生成する機能です。スケッチやイラストなどで主に活用されます。Cannyよりも細かい線を抽出できることから、元画像の構図などをより正確に引き継ぎたいときに使います。
MLSD: 画像の直線情報のみを抽出します。おおまかな構図のみを引き継ぐ時に使います。
SoftEdge: 画像のエッジや境界線を柔らかくすることで、より自然な外観を持つ画像を生成する機能です。硬いエッジのない滑らかな外観を実現するのに役立ちます。MLSDとSoftedgeは、抽出した線情報以外の部分を自由に再生成しやすい特性があるため、バリエーションを出したい場面で有効です。
追加学習とは
追加学習(Fine-tuning)は、AIモデルの性能を向上させるための手法です。既にある程度訓練されたモデルを、特定のタスクやデータセットに適応させるために、さらなる学習を行います。これにより、特定のオブジェクトや建物、雰囲気(テイスト)などを再現できるようになります。
アイデア編
斜線制限を考慮して建築物をつくる
法的要件を画像範囲に読み替えることができれば、画像生成に法的要件を取り込むことができます。敷地画像に斜線制限を加味したマスク画像を作り、Inpaintとプロンプトで建築物の案出しを行えます。
外構をデザインする
Inpaintの機能を使うことで、外構をデザインすることも可能です。その際、他のControlNetの機能を組み合わせれば、おおまかな形状を指示することもできます。
窓のカタチを考える
Inpaint機能では、部分の要素を検討することも可能です。このままだと外の絵が変わってしまいますが、ガラス部分だけ透過させて背景画像を重ねるなどすれば解決できます。
季節や時間を変える
周辺環境の変化を手軽にシミュレーションできるのも画像生成の強みです。DepthやMLSD、softedgeなどのControlNetを活用することで、おおむねの概形を保ったまま季節の変更ができます。
素材を学習して配置する
家具の画像を集めて学習することで、画像の中に配置することもできます。技術制約上 ( ※Inpaintと組み合わせると、周辺の画像も変化してしまう、など ) まだまだ精度は甘いですが、だいぶクオリティが上がってきているように感じます。
3Dモデルを水彩画風パースにする
シンプルな3Dモデルから、テイストの変更を行います。ControlNetのCannyとDepthを組み合わせました。
3Dモデルをフォトリアルにする
フォトリアルにする際は、そのままテイストを変更しても現実味がなかったので、まずInpaintで周辺を生成しました。その後、ControlNetのLineartとDepth、プロンプトを組み合わせてフォトリアルにしています。
立面図を着色する
Fine tuningの一つである「Lora学習」を用い、テイストの変更を行いました。学習させることで、同じテイストで複数の図面やパースを作成できます。ControlNet + プロンプトだけでは微妙なズレが生じる場合がありますよね。
実践編
オフィスをリノベーションする
建築知識の画像生成AI特集記事で、一部監修を担当しました。
その中で、画像生成における複数の手法を組み合わせ、オフィスリノベーションを行っています。詳しい内容については、また別の記事で詳しく解説します。
ご案内
マガジンになっているので、是非他の記事もご覧ください。
画像生成AI活用に関するコンサルティングや、ワークショップも多く承っています。お気軽にご相談ください。
ご連絡はこちらまで
https://noi.takagishuta.com/
https://twitter.com/sho_noi
執筆協力
宮下巧大
SAMURAI ARCHITECTS
NOI STUIDO:梅津憂剛 、村山滉大