
建築ビジュアル CG AI 活用法㉔ AI3Dモデル生成④ 『Hunyuan3D vs Trellis』 3D生成比較

こんにちは。STUDIO55技術統括の入江です。
昨年末から今年にかけて、3D生成AIの技術は急速に進化しました。これまで Rodin(ロダン)をはじめとする 各種 3D生成AI を "実験検証" しながら、その仕組みや特徴を解説してきました。
今回は テンセント(Tencent)がリリースした話題の『Hunyuan3D(フンユアン 3D)』について 同様の検証を基にお伝えします。
Community-Driven 使用の AI として『Trellis』も取り上げ、その違いを比較してお見せします。
⭐Hunyuan3D
Hunyuan3D(フンユアン 3D) は、2024 年 11 月 に バージョン1.0 が公開され、その後、今年(2025年)の 1 月 21 日に バージョン2.0 がリリースされました。
I am truly honored to announce that our 3D open source project has entered its 2.0 version, presenting revolutionary effects that rival those of commercial products. https://t.co/YM3GVb9BQM https://t.co/IexQULxv2U pic.twitter.com/8kJAgyCac2
— Hunyuan (@TXhunyuan) January 21, 2025
最新の バージョン2.0 では、形状生成モデル「Hunyuan3D-DiT」とテクスチャ生成モデル「Hunyuan3D-Paint」の2つの主要なコンポーネントで構成されており、これにより高解像度で鮮やかなテクスチャを持つ3Dアセットの生成が可能とされています。

=Hunyuan3Dの使用について=
『Hunyuan3D』の使用方法は、大きく分けて 3つ。Hunyuan3D-Studio、Hugging Face、その他オープンソース があります。
・Hunyuan3D-Studio
Webベースの制作プラットフォーム『Hunyuan3D-Studio』は、公式サイトにあたり、"製品レベルで実用できるようにまとめたもの" になります。

ログインにはGoogleアカウントは使用できません。代わりに、WeChat または QQ.com のアカウントが必須となります。そのため、日本人にとっては 気軽な利用はしづらいかもしれません。

・Hugging Face公開版
Hugging Faceの Hunyuan3D は、主に開発者や技術者向けのリソースであり、ローカル環境で Hunyuan3D 2.0 の機能をテスト・実行するためのコードやドキュメントが含まれています。

Hugging Face / Hunyuan3D-2
・その他の方法
Hunyuan3D は、オープンソースで公開されている3D生成AI です。このため、研究者などがさまざまな方法で活用することができるといった特徴があります。
例えば、PyTorch を用いたローカル環境の実行。Gradio で ホスティング、Blenderのアドオン 利用、さらには ComfyUI との統合 など、多彩な活用法が存在します。
その急速な普及を視野に入れた体制は、テンセントの影響力の大きさ を示す印象があります。
🏢Tencent(テンセント)
テンセント は 中国版 GAFA(Google, Apple, Facebook, Amazon)に相当する「BAT」(Baidu, Alibaba, Tencent)の一角を担い、特にゲーム・SNS・AI分野で世界的に影響力を持つ企業です。ゲーム業界への投資も積極的で、多くの海外企業を買収・出資しています。
以前、紹介した『Hailuo AI(MiniMax)』も テンセントが出資していることをお伝えしました。
先日登場した「DeepSeek」は、NVIDIAの株価が急落するほどの衝撃をもたらし、中国発のAIモデルが世界市場で存在感を強めていることを改めて示しました。


こうした動きの中で、中国国内の他のAI企業も影響を受けており、今年1月29日には、アリババ が DeepSeekの「R1」モデルに対抗する形で最新のAIモデル「Qwen(通義千問)2.5Max」を発表。アリババはこのモデルが、DeepSeekの「V3」モデル や OpenAIの「GPT-4o」、メタの「Llama-3.1-405B」を上回る性能を持つと主張しています。

さらに、TikTok を運営する バイトダンス も自社のAIモデルを強化する動きを見せるなど、中国の大手テクノロジー企業によるAI開発競争は一層激化しています。
中国発のテクノロジーは、今後ますます世界の注目を集める存在です。
🪄3Dモデル生成 検証
生成結果は、誰でも気軽に利用できる Hugging Face の「Hunyuan3D」で紹介します。また、使用観点から同じく Hugging Face公開の「Trellis」と比較しながらお伝えします。
👉『Trellis』は清華大学、中国科学技術大学、Microsoft Research が共同開発した 最新技術(SLAT)の 3D生成AIモデル です。
💥Hunyuan3D vs Trellis💥
毎度お馴染みとなりました(笑) "私の愛犬くん" のAI画像をベースに 3Dモデルを生成し、それを通した 性能比較 を、1つの 目安 として共有します。

上のAI生成の画像を使い、Hunyuan3D-2 での3Dモデル生成が以下の画面です。

① 画像生成3Dモデルのクォリティ
単純に、Trellis との見た目のクォリティ比較です。

一連のプラットフォームでも並べておきます。
同じ画像からの3Dモデル生成で、ここまでの見た目に違いが出てきます。

② データスケール と ピボット位置
Hunyuan3D-2 のモデルの生成サイズは、Rodin(ロダン)や Meshy(メッシー) と同サイズで、大きめのスケール で生成されます。
ピボット位置はアセット中心です。

③ メッシュ コンディション(頂点・面・エッジ)
メッシュのコンディション比較です。

④ データ容量(glb)
・Trellis : 1.61 MB
・Hunyuan 3D-2 : 2.29 MB
全体的な メッシュ コンディション や データ容量 は Trellis が軽量な値を示しますが、メッシュ密度の観点から考慮すれば、おおよそ同等レベルの見解です。
⑤ マテリアル状態
マテリアルの生成の状態については、マップカラーの分布で部分的にカラーがはみ出してしまうケースが、他の AI でもあります。
Hunyuan 3D-2 のテクスチャ生成モデル「Hunyuan3D-Paint」では、愛犬くん のモデルデータの頭部位置や足元に青色が混ざってしまっています。


UVマップでは、この位置です。

マップを手動で修正してもかまいませんが、"時短" の観点からすると、あまり歓迎できないかもしれません。
👀画像の奥行判定
検証項目の「奥行判定」の精度確認です。
以前の検証 でも触れましたが、3Dモデル生成AIの課題の一つに、画像から3Dモデルを生成する際の "画像の奥行き判定の精度" があります。
この点は、特に建築ビジュアルのアセットとしての活用視点が強いように思われるかもしれません。しかし、モデル生成AIの初期技術レベルを考えると、どこまで正確に "立体化" できるかは重要な指標となります。
これまで同様、「一枚板テーブル」と「衛星」の画像を使った、「奥行判定」をテストしました。
●一枚板テーブル モデル
・Hunyuan3D-2

脚がめちゃくちゃになってます。

・Trellis

画像の奥行を捉えており、"テーブル" として判断されています。


2つのモデルを並べます。


テーブル面も、Hunyuan 3D-2 では やや画像のパースに引っ張られている影響が見られます。

●衛星 モデル
続いて「衛星」画像の「奥行判定」テストです。
・Hunyuan3D-2
画像の奥行判定の弱さが顕著に伺える結果です。

奥行判定の精度
パラボラは、かなり工業的な鉄製のハンドルのようなアレンジが施されています。

"パラボラ" のモデル精度
・Trellis
画像とは異なる形状ではあるものの、奥行き判定の精度がうかがえます。特に、パラボラ形状をここまで再現できている点は、高い成果といえるでしょう。


生成結果の 2つのモデルを並べた画像です。

各モデル の良いとこ取りをしたらいいかもしれません(笑)

●ベッド モデル
前回の 比較検証 でもお伝えした ベッド等の「ファブリック系 3Dモデル生成」のテストです。
当初のCGに見られた課題同様、AIが生成する3Dモデルにもファブリック系への弱点が見受けられます。工業系のディテールとは異なり、柔らかさを伴うファブリック素材のモデルは、特にディテールの再現にも差が出ます。

ここでも画像の奥行き判定に問題が見られ、モデルの破綻やシーツの青色化など、いくつかの課題が確認できます。また、元写真の濃茶色のベッドフレームが「影」など別の要素と誤認され、大部分が除外されている可能性も考えられます。

横から見たベッドモデル
途中からベッドベースがなくなる
別のベッド画像でもテストしてみました。
今度はすべてが白系のベッドで、できるだけ簡単そうな形状を選びましたが、今度は ヘッドボード ごとなくなってしまいました💦

同じ画像で生成した 3Dモデルの比較 です。

その他の3Dモデル生成AIの中でも、特に Trellis は「画像の奥行判定」に強い印象があります。SLAT 技術 によるものなのか、単体の画像から ここまで正確に立体モデルを生成する技術は トップクラス です。
「画像の奥行き判定」に関して、プラットフォームは大きく2つのカテゴリに分かれます。現状では、奥行き判定が得意なプラットフォームは稀で、Rodin(ロダン)と Trellis(トレリス)に限られることが確認されます。
ただし、「画像の奥行き判定」が苦手だからといって、この種のアセットモデル(ここでは「ベッド」)がまったく生成できないわけではありません。
Hunyuan 3D-2 でも、"コツ(仕様)" があります。
💡Hunyuan 3D-2 のコツ💡
次に、その一例をお見せします。
「奥行き(パース)」には、大きく「二点透視」と「一点透視」の2種類があります。Hunyuan 3D-2 では、二点透視 の画像では形状の把握が難しいものの、一点透視 の画像では比較的精度の高い処理が可能であることが確認できます。



先ほどまでの生成がウソのように、きれいな ベッド モデル を生成しています。画像の奥行も正しく捉えられ、ベッドの アップホルスタード ヘッドボード、更には 足元の "ストレージ ベンチ" まで、きれいにモデル生成されています。
このようなプラットフォームの "コツ(仕様)" を理解した上で、どのような画像が適切であるか等を理解しておくと、最短でもっとも最良の結果を得ることができますので、参考にしてください。
📃Trellis : SLAT(Structured LATents)
Trellis に搭載される SLAT(Structured LATents)技術 は、3Dオブジェクトの表面に焦点を当て、効率的かつ高品質な3Dアセットの生成を可能にする革新的な手法です。
具体的には、物体の表面と交差するアクティブなボクセル上に局所的な潜在変数を定義し、これにより放射場(Radiance Fields)、3Dガウス、メッシュなど、さまざまな出力形式へのデコードが可能となります。
追記すると、Trellis は 更にSLATに特化した「Rectified Flow Transformers」という技術を導入し、50万種類以上のオブジェクトを含む大規模なデータセットでトレーニングされています。これにより、テキストや画像を条件にした高品質な3Dアセットの生成を実現します。
この SLAT を活用して、同じオブジェクトのバリエーションを簡単に作成することが可能で、ローカル編集機能により、ジオメトリやテクスチャを調整しながら品質を維持し、さまざまなクリエイティブや技術的なニーズに対応した複数のバージョンを生成できます。
⭐その他の生成例
その他のアイテムで試した内容を載せておきます。クォリティやディテールの一例として参考にしてください。
・パーソナルソファ

・ソファ

・ハイチェア

・テーブルランプ

・什器

・フィギュア

📝 Hugging Face公開 Hunyuan3D について
Hugging Face 公開版は、1日に使用できるGPUクォータが非常に限られており、一度生成するとすぐには再利用できません。

You have exceeded your GPU quota(150s requested vs. 131s left)
Create a free account to get more daily usage quota.
GPU クォータを超えました (要求された 150 秒に対して残り 131 秒)
1 日の使用クォータを増やすには、無料アカウントを作成してください。
そのため、ローカル環境でのプログラミングによる構築方法も示されていますが、3DCG制作者にとっては、Blenderアドオン として利用するのが最も直接的な方法です。

ただ、いずれも専門的な設定が必要であるため、「自分でホストしたくない場合は、すぐに使用できるようにHunyuan3Dにアクセスすることを忘れないでください。」と公式サイトへの案内があります。
Don't forget to visit Hunyuan3D for quick use, if you don't want to host yourself.
🔔Blender Addon
Blender アドオン について補足します。
ブレンダー用 の アドオン は、GitHub の「Tencent/Hunyuan3D-2」からダウンロードできます。

ただし、ローカル環境でAPIサーバーをホストする必要があるため、api_server.py を 0.0.0.0:8080 で起動する Python プログラム をコマンド実行します。
python api_server.py --host 0.0.0.0 --port 8080
img_b64_str=$(base64 -i assets/demo.png)
curl -X POST "http://localhost:8080/generate" \
-H "Content-Type: application/json" \
-d '{
"image": "'"$img_b64_str"'",
}' \
-o test2.glb
シェルで api_server.py を起動し、Blender アドオン『Hunyuan3D-2』を使用した作業画面のキャプチャがこちらです。

このように、サーバーを自分でプログラム起動し、Blenderアドオンと併用して使用します。
慣れない場合は面倒かもしれませんが、興味のある方は、GitHub の 「APIサーバー」の説明 をベースに試してみて下さい。
*
前評判の高いAIでも、生成内容には得意・不得意があり、どのような形で生成すると「最適な結果が出せるか」といった "コツ" があることが伺えます。
お伝えした内容以外にも、各プラットフォームには それぞれに "仕様" がありますので、それぞれに適した使用目的や得意分野を含めて、事前に検証確認することをオススメします。