建築ビジュアル CG AI 活用法⑱ 360°画像生成AI② Skybox AI
こんにちは。STUDIO55技術統括の入江です。
AI の活用法の中でも、360度パノラマ による画像生成は、環境表現としてさまざまなジャンルで活用が期待できるワークフローです。
エンターテイメント・ゲームの体験型コンテンツ、広告・マーケティング、アート等、その利用幅は広く、特に建築ビジュアルの表現に際しては、CG制作における背景、環境光ライティングとして期待ができるものとなります。
前回は、Stable Diffusion を用い、建築ビジュアル向けの 360°パノラマ画像の生成 を検証しました。
今回は、360°画像生成に特化した『Skybox AI』を使った内容を共有します。
また、前回の SD(Stable Diffusion)で生成した 360° 画像 と、今回の Skybox AI で生成した画像を活用した CG制作での検証 も合わせてお伝えします。
🔶Skybox AI
360°画像生成に特化したAIツールとして注目されているのが『Skybox AI』です。これは、Blockade Labs が2023年3月に提供を開始したツールで、スカイボックスや環境マップの作成を目的としています。
Skybox AI は、テキストプロンプトからリアルタイムで 360°パノラマ画像 を生成する機能を備えており、ゲーム開発や VR/AR コンテンツ制作 において高い実用性を発揮します。
*
サイト では、主に ゲーム ファンタジー系 のサンプルが目立ちます。
この内容を見る限り、
「どこまでリアルな建築画像が生成できるのか」
「建築ビジュアルとはジャンルが異なるのではないか」
といった感想を持つ場合があるかと思います。
■建築向け生成テスト
Skybox AI を活用した、"建築パノラマ系の画像生成" のテストを、いくつかご紹介します。
・内観用VR画像
・外観用VR画像
検証の結果、Stable Diffusion を使用した際に問題となった「継ぎ目」や「エクイレクタングラー図法」の課題は一切見られず、専用ツールならではの高品質な 360°パノラマ画像 が生成されます。
さらに特筆すべきは、"日本風な街並み" が生成できることです。多くのAIツールでは学習データに日本の風景が含まれておらず、例えば、プロンプトで "東京" や "日本" と指定しても、他のアジア圏の雰囲気が混ざることが多く、理想的な 日本風の街並み を再現するのは困難です。
AUTOMATIC1111(stable-diffusion-webui) を使った "日本風の都心" のイメージ生成画像と、Skybox AI を使った生成画像の比較をご覧ください。
このように、再現性と品質の差は一目瞭然です。
現在は、ComfyUI Flux を使用することで、Skybox AI に匹敵する 日本風の街並み を生成することは、一応は可能になりました。
ComfyUI Flux の生成例も挙げておきます。
問題は、Flux モデル (dev) は基本的に非商用利用のために提供されており、ビジュアル制作におけるビジネス上の使用に制限があるという事です。
その観点からも、Skybox AI は幅広く安定した使用が可能なものであるということが言えます。
🌟ダウンロード項目
Skybox AI の ダウンロード機能 には、特筆すべき特徴があり、その内容から このプラットフォームの目的が明確に伝わってきます。
生成したパノラマ画像のダウンロード形式には、9種類 のデータと 計11種類 の表現方法が備えられています。
パノラマ画像 の大別として、Equirectangular(エクイレクタンギュラー) と Cube Map(キューブマップ)があるのは、使用するCGソフトによって使い分けができることを意味します。例えば、UE5 と UNITY での使い分けなどがそうです。
キューブマップ の項目には、Default(デフォルト)と、 Roblox(ロブロックス)があります。
Roblox は、メタバース の代表的なプラットフォームです。Roblox Studio 内で3D環境に使用するスカイボックスには、キューブマップ形式 が一般的に利用されています。
Roblox は 今では教育面でも注目されており、プログラミングやゲームデザインを学ぶためのツールとして、学校や教育機関でも使用され始めています。そのような目的のキューブマップ項目を設けていることからも、かなり幅広い層への使用を示唆するものです。
また、特に驚いたのは、HDR形式 と EXR形式 を提供している点です。
一般的に、ウェブ上での画像生成は負荷軽減のため解像度が抑えられることが多いのですが、Skybox AI では容量の大きい HDR や EXR がダウンロード可能です。そのことによって、AIで生成した画像を直接CG制作のデータとして利用することが可能です。
このように、AI で生成したデータを用途別で利用することを考慮した ダウンロード ラインナップ は、Skybox AI が単なる画像生成AIにとどまらず、その先の活用シーンを見据えたプラットフォームであることを示しており、Skybox AI の プログラミング メンバー が 制作プロセスを深く理解し、生成画像の実用性を重視していることが伺えます。おそらく、CG制作のクリエイティブ経験者がチームに加わっていることは間違いないでしょう。
3D Mesh ダウンロード
今年(2024年)前半、Blockade Labs は実験的に生成画像を 3Dメッシュ としてダウンロードできる機能を提供していました。
このサービスは、当初 Technowizard 会員限定 で先行公開されていました。大変注目されるダウンロード機能であることから、直接問い合わせて確認を行ってもきましたが、現在では、この機能が正式にリリースされていますので、簡単にご紹介します。
*
3D Mesh ボタン から ダウンロードの設定画面が起動します。
Low、Midium、High、Epic の 4つの モデルクォリティを選択し、Depth scale の調整スライダーで奥行の調整を行います。
ダウンロード形式は、GLB です。
デフォルトの Midium でダウンロードした GLB データ を Blenderで読み込んだ映像です。
スフィア(球体)形状にデプスが付けられた立体的な環境モデルデータとなっています。画像マッピングではなく、あくまでモデル使用で環境表現を行う際に有効なものとなります。
3Dメッシュ として街並みを直接モデル化するのではなく、2D画像を3D化する際に使用される Depth Map 技術 を応用し、それを環境データのメッシュ化に活用しています。
2D画像の立体化は、当初は After Effects(AE)などの動画編集ソフトのプラグインで使われていた手法ですが、近年では AI 技術 の進化により、これらの手動処理が自動化され、より高度かつ精密な 3D立体化 が可能となりました。AI は画像の奥行き情報を解析して完全な3Dデータを生成するため、制作の効率と精度が飛躍的に向上しています。
AE の技術的歴史を踏まえると、AI による進化は、これまでのニーズに応える自然な発展といえます。中でも Skybox AI は、従来の制作者の要求を深く理解した設計となっており、その利便性と実用性が際立っています。
💳料金プラン
Skybox AI では、生成したコンテンツのダウンロードはすべて有料対象となっています。無料プランでは 月に15回の生成ポイント が付与され、その範囲内でテストは可能ですが、ダウンロードは利用できません。
メンバーシップ(料金プラン) 表 はこちらです。
🔷CG制作 環境光(HDR)テスト
では、前回の ATUOMATIC1111 を使用したパノラマ画像と、今回の Skybox AI で生成した画像を比較し、それぞれのCG制作における使用感について共有します。
🔸ATUOMATIC1111 生成パノラマ画像の編集
ATUOMATIC1111 のテストでは、『360 panorama [sd1.5]』 LoRa を利用して生成した、こちらの パノラマ画像 を使います。
1️⃣ 解像度を上げる
先ずは、画像解像度を上げます。パノラマ画像は、通常の画像よりも高解像度が求められるため重要です。
👉 Extras を使って 直接アップスケールさせる方法もありますが、ここでは通常の生成画像のスケールをベースにしたワークフローとして紹介します。
Topaz Gigpixel AI
アップスケールには Topaz Gigapixel AI を使います。
Topaz Gigapixel AI は、2018年に Topaz Labs 社 がリリースしたものです。
AIアルゴリズムを使用して写真品質の細部を鮮明に保ちながら、解像度を最大6倍まで引き上げることができます。
その当時、AIを利用したツールは非常に珍しかったため、Topaz Gigapixel AIを「神ツール」として社内共有しました。
このツールのおかげで、ビジュアル制作におけるワークフローが大幅に改善され、その貢献度は計り知れません。
現在、Topaz AI の製品群 には、以下のようなツールがあります。
Topaz Gigapixel AI: 低解像度の画像を高解像度にアップスケールするツールです。AIアルゴリズムを使用して、細部を鮮明に保ちながら、解像度を最大6倍まで引き上げることができます。
Topaz Denoise AI: 写真やビデオのノイズを除去し、詳細を保持するためのツールです。低照度や高ISOで撮影された画像でも、高品質に仕上げることができます。
Topaz Sharpen AI: 画像のブレやぼやけを補正し、シャープな画像にするためのツールです。被写体の動きやカメラの揺れによるブレを補正する機能もあります。
Topaz Video AI: ビデオ用のAIベースのツールで、ノイズ除去、アップスケーリング、フレーム補間など、映像の品質を向上させるために使用されます。
Topaz Gigapixel AI で 画像を最大の 6倍 にアップスケールします。元画像が 1024×512 なので、6倍の 6144 × 3072 の解像度になります。
👉 Topaz は非常に優れたアップスケーラーですが、スタンドアロンの有料ツールです。一方で、Photoshop のニューラルフィルター「スーパーズーム」では、最大16倍の解像度拡大が可能です。現在では無料のツールも数多く登場しているため、これらはあくまで参考としてください。
2️⃣ HDR形式へ変換
SD 保存 の画像基本形式の PNG を HDR 形式 へ変換します。
変換方法は、Photoshop で変換する方法もありますが、先ずは簡単な方法として、Web上で変換するやり方から紹介します。
Web変換
Convertio(コンバーティオ)は、さまざまなファイル形式の変換をオンラインで提供するウェブサービスです。ユーザーはウェブブラウザを使用して、簡単にファイルの形式を変換することができます。
変換処理はすべてクラウド上で行われるため、ユーザーのデバイスに高い処理能力を求めません。インターネットに接続さえしていれば、どのデバイスからでも利用できます。
操作は簡単で、HDR変換用の画面下に並んだ項目から該当するものを選択し、後はファイルをドラッグ&ドロップするだけで、直感的に変換を開始できます。
Convertio で 変換する前と後の画像を並べて表示したのが、下の画像です。
HDR変換した画像(右側)は、それなりにレンジを広げているように見えます。
左 : Gigapixel AI で6倍アップスケールのPNG画像 (27.0 MB)
右 : Convertio でHDR変換した画像 (66.7 MB)
容量が大きくなるので 保存先を決めておくのが賢明です。
Photoshop変換
Photoshop で変換する基本操作です。
Photoshop にアップスケールした画像を読み込みます。
イメージ > モード > 32 bit/チャンネル に変更。
ファイル > 別名で保存 をクリック。
Radiance(ラディアンス) 拡張子で保存。
これで、HDR 形式 として保存ができます。
Photoshop では、メタデータの保持や、HDR の特性(たとえば、ハイライトとシャドウの細部)を細かく調整する機能がありますので、今の作業フローに加えて、更に応用活用することが可能です。
*
Photoshop で変換した場合と、Convertio で Web変換した場合の違いに関しては、基本的には Convertio は手軽という点で優れており、よりプロファッショナルに変換作業で手を加えたい場合などには、Photoshop でカラープロファイル(sRGB、AdobeRGB、ProPhotoRGBなど)から管理するのが良いでしょう。
Convertio は、あくまで一般的なカラープロファイルに基づいた変換を行いますので、そのような点をある程度理解した上で、使用の選択をすると良いでしょう。
🔹SD A-1111 生成パノラマ画像 テスト
Convertio で HDR変換した画像を使って、V-Rayドームライト でスカイボックスの設定を行います。
CG検証で使用する DCC は 3dsMax です。
SUV車のCGモデルデータを配置します。
レンダリング画像がこちらです。
車体へ反射した環境光がこちら。
AUTOMATIC1111 で生成したパノラマは 画像細部に破綻が見られるものの、環境光として使用するには十分なクオリティであることが確認できます。無料で利用できる点も魅力で、実用性があります。
🔸Skybox AI 生成パノラマ画像 テスト
Skybox AI の生成画像は、直接 HDR 形式 でダウンロードしたデータを そのまま使用することができます。
車体の環境光。
Skybox AI の生成画像は破綻が見られず、そのままスカイボックスとして使用可能な高いクオリティを備えています。また、建築用の環境光マップとしても十分に活用できる実用性があります。
Skybox AI は、360°生成画像に優れたツールですが、有料サービスであるため、用途に応じて Stable Diffusion などの無料ツールで代用できるかを見極めることも重要です。さらに、今後リリースされる360°パノラマ生成用 LoRA の進化も期待されるため、コストパフォーマンスを含めた選択を検討するとよいでしょう。
Blender 使用例
Blender ユーザーも多いことを踏まえ、Blender で Skybox AI の HDR を活用した事例もご紹介しておきます。
車のモデルデータは、Sketchfab で Free 提供されている、(FREE) Porsche 911 Carrera 4S を使用します。
📑HDRとEXRの違い
最後に、HDR形式 と EXR形式 の違いについて触れておきます。
CG制作に携わる方の中でも、この点を意外と認識していないケースが少なくありません。フォーマットの特性を正しく理解することは、用途に応じた適切な活用につながるため、特にプロの制作現場では重要です。
HDR画像をダウンロードする際は、ネット上などでHDR形式とEXR形式のどちらかを選べるケースが多くあります。Skybox AIでも、同様に両形式のダウンロードが可能です。
HDR と EXR は、どちらも高ダイナミックレンジ画像を扱うためのファイル形式ですが、いくつか違いがあります。
HDR
主に環境マップやライトマップなどで使用される形式で、色情報を圧縮して保存します。RGBE(Red, Green, Blue, Exponent)の4チャンネルで色と輝度を表現したものです。
比較的軽量で、主にゲームや リアルタイム レンダリング、3D ソフトウェアでのライティング用 に利用されます。
EXR
ILM(Industrial Light & Magic)によって開発された、映画やビジュアルエフェクトのためのフォーマット で、非常に高い精度と柔軟性を持つ形式です。
16ビットや32ビットの浮動小数点形式で色情報を保存し、複数のレイヤー、チャンネル、アルファチャンネル、メタデータの保存が可能です。
主にポストプロダクション、映画、ビジュアルエフェクト、アニメーションで使用されます。
簡潔に言うと、次のようになります。
EXR
よりプロファッショナルな使用目的に使用される形式。
HDR
リアルタイムレンダリングや簡単な環境ライティングに適した形式。
情報量の違いから(解像度にもよりますが) EXR は HDR と比較して、データ容量としても桁が違うものになってきます。
建築CG でそこまで扱うことはありませんので、軽めなHDRで設定するのが通常 とだけ覚えておきましょう。
*
CG制作に欠かせないライティングの一環として、AI生成画像を活用したHDRライティング方法について解説しました。
少しでも参考になれば幸いです。
ビジュアル表現が求められる VR に関する内容は、今後さらに重要性を増す分野です。また機会を見てお話しをします。