HunyuanVideoの環境構築が簡単にできる「EasyHunyuanVideo」のレビュー

2025年1月7日 23:40

動画生成AIのレビュー記事です。
今回はZuntanさんがリリースしたEasyHunyuanVideoをご紹介します。

■プロフィール
自サークル「AI愛create」でAIコンテンツの販売・生成をしています。
クラウドソーシングなどで個人や他サークル様からの生成依頼を多数受注。
実際に生成した画像や経験したお仕事から有益となる情報を発信しています。
詳細はこちら（🔞コンテンツが含まれます）
➡️lit.link

メンバーシップ（月額500円）に加入して頂くと、300円以下の有料記事が読み放題です。

EasyHunyuanVideoとは？

HunyuanVideoはTencentからリリースされた動画生成ツールです。

100億パラメータを持つオープンソースモデルから動画を生成することができ、ローカルの動画生成ツールとして現在非常に注目されています。

このHunyuanVideoの環境構築を簡単に行えるのが、Zuntanさんという方がリリースしたEasyHunyuanVideoです。

HunyuanVideo を簡単に試せる EasyHunyuanVideo

FastVideo＆SageAttention＆TeaCacheで高速＆低 VRAM 生成
日本語プロンプト英訳や LLM＆TIPO 補完、自動＆手動モザイク、アプスケ、フレーム補完、MMAudio 音声などに対応

サンプルは RTX 3060 12GB
VRAM 6GB でも一応動作https://t.co/SJ4X0nNKo8 pic.twitter.com/Wm6Qy8cos1
— Zuntan (@Zuntan03) January 7, 2025

HunyuanVideoを使うのに必要なパッケージがまとまっているもので、モデルやLoRA、拡張機能などをバッチファイルでインストールできます。

アップスケールや動画化、音声生成などもできる環境が整っているので、今からHunyuanVideoいじりたいって人はEasyHunyuanVideoが簡単かもしれません。

※動作環境について

最低VRAM12GBあれば動くようです。6GBでも動くという記載もありました。
ストレージに関しては100GB程度必要とのことです。

追記：VRAMの条件を満たしていてもRAM（メモリ）が64GB必要とのことなので、ここが足りないとkijai版（後述）は動かないかもしれません。

EasyHunyuanVideoのインストール

普通にGithubで解説しているのでこっち見て分かる人はそちらを参考にしてください。
https://github.com/Zuntan03/EasyHunyuanVideo

一応使ってみた感想含めて簡単に解説していきます。

まずGithubのリンクからバッチファイルを右クリックでダウンロードしてください。

https://github.com/Zuntan03/EasyHunyuanVideo

任意のフォルダに入れてから管理者として実行します。
例）C:\EasyHunyuan
※終わるまで結構時間がかかります。

次にEasyHunyuanVideoフォルダ内にあるvs_buildtools.exeを実行します。

C:\EasyHunyuan\EasyHunyuanVideo\vs_buildtools.exe

インストーラーが起動するので「C++によるデスクトップ開発」にチェックを入れてインストールしてください。

次に「C:\EasyHunyuan\EasyHunyuanVideo」内にある「cuda_12.6.3_windows_network.exe」を実行します。

基本は全てそのまま進めて問題ありません。

最後に「C:\EasyHunyuan」内にあるDownload.batを実行します。

必要なモデルデータやLoRAなどがダウンロードされるのでしばらく待ちます。

これが終わると大体フォルダ内が70GBくらいになります。
あとworkflow実行時に別途必要なモデルをダウンロードするためそれで大体100GBくらい行くみたいです。

・サンプルのダウンロード

特定の機能を使ったワークフロー（画像）や動画サンプルが落とせます。
「C:\EasyHunyuan\Sample」内のDownloadSample.batを実行してください。

なお、公開直後はバッチファイルに不具合があったようです。
うまく実行できなかった方は、githubからバッチファイルだけダウンロードしてください。
https://github.com/Zuntan03/EasyHunyuanVideo/blob/main/Sample/DownloadSample.bat

EasyHunyuanVideoの使い方

「C:\EasyHunyuan」内にあるComfyUi.batを実行すると自動的にComfyUIが立ち上がります。

フォルダアイコンから使用するワークフローを選んで実行できます。
基本の動画生成はKijai.jsonかNative.jsonです。

Kijai版とNative版について

Kijai版は一般的なHunyuanVideoを生成するためのワークフロー、Native版は先日VRAM8GBで動くと発表があった方のワークフローを使っているようです。

Kijai版
https://github.com/kijai/ComfyUI-HunyuanVideoWrapper

Native版
https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Kijai版は高速化+省VRAM生成が可能でVRAM12GBで動くようですが、サイズや長さなどのパラーメータを下げても私の環境（VRAM16GB）だとOOMエラーで動かせませんでした。
Githubにいろいろ動かなかった場合の対処方法が書いてあるのでこちらを試してみてください。
https://github.com/Zuntan03/EasyHunyuanVideo?tab=readme-ov-file#vram-%E4%B8%8D%E8%B6%B3-cudaoutofmemory-%E5%AF%BE%E7%AD%96

どうやっても動かない場合はNative版の方が無難だと思います。
この記事もNative版で解説します。

とりあえずNative版のワークフローを読み込んで、そのまま実行できるか試してみてください。
デフォルトだとこんな動画を生成できます。

ノードの設定

ノードを設定すると動画の内容やクオリティなどを調整できます。

Load Diffusion Model

使用するモデルを選択できるノードです。
FastVideoの方が1分半くらい生成速度が早めでした。
ただクオリティは気持ちCfgDistillの方が良い気がします。

Unet Loader (GGUF)

unetモデルを使いたい場合は、ノードをこちらにつなげれば使えます。
上記2つよりクオリティは良い印象でした。

・モデル比較
左からCfgDistill（327秒）・FastVideo（221秒）・GGUF（357秒）

ImpactWildcardEncode/Right Click [View Lora Info..]

ImpactWildcardEncodeにプロンプトやLoRA、トリガーワードなど入力します。

Right Click [View Lora Info..]は、選択中のLoRAデータの情報を確認できるものです。
右クリック→View LoRA infoでトリガーワードなど情報が見られます。
ただ私はinfo情報が表示されず、どうやったら取得できるかもちょっとわかりませんでした。
ここで確認できる方はそれをそのままImpactWildcardEncodeに入力して使えます。

もしここで確認できない方はちょっと手間ですが、「C:\EasyHunyuan\Download\loras」内にあるバッチファイルをテキストで開けば、CivitaiのURLを確認できます。

デフォルトで使用されているLoRAはこちらです。

・トガヒミコ

・This Is Fine。coffeeを飲む動作の方。元ネタはこちら。

自分で探す場合は、フィルターをかけると探しやすいです。

EmptyHunyuanLatentVideo

ここで動画サイズや長さを指定できます。
デフォルトはVRAM6GB用になっているみたいなので、スペックに合わせて値をあげて見てください。

これでキューを実行すれば任意に調整した状態で動画生成ができます。

生成した動画はoutputフォルダに保存されます。

C:\EasyHunyuan\Output

アップスケールする方法

フォルダアイコンから50_Upscale.jsonを取り込みます。

WebPで出力された画像を取り込み、アルゴリズムやスケールサイズを指定して実行するとアップスケールできます。

WebP→動画化

フォルダアイコンから60_Interpolate.jsonを取り込みます。

アップスケールしたWebPなどを取り込んで実行するとmp4などの動画ファイルに変換できます。

音声の生成

フォルダアイコンから70_MMAudio.jsonを取り込みます。

動画を取り込み、動画に合わせて生成したい音声をプロンプトとして入力します。
とりあえずデフォルトのプロンプトを試したい方はLLMのノードをオンにして実行してみてください。

そうするとこんな感じの音声がつけられます。

基本の使い方は以上です。

EasyHunyuanVideoを使ってみた感想

全く0から始める人にはいいかも

ComfyUIを全く触ったことがなく、LoRAやモデルについてもあまり分かっていないという方には便利なツールだと思います。

限定的ではありますが、複数キャラLoRAやシチュエーションなどを事前にダウンロードしてくれますし、便利そうな拡張機能も組み込んでくれているからです。

ハードウェアと複数のソフトウェアがセットになったような状態で使えるので、初めての方には使いやすいかなと感じました。

容量が大きい

いろいろな拡張機能やLoRAデータをダウンロードしてくれるのはメリットでもありますが、デメリットでもあります。
人によって使わないデータもあるからです。
必要最低限のものだけインストールして、拡張するものはユーザー側が選べたらもっと便利な気がしました。
容量の圧迫が気になる方や使用しないものが多すぎる場合は、自分で環境構築するのをおすすめします。

勉強になる

容量大きいのはちょっとネックですが、一回触ってみるとどのノードで何を指定しているのか、どうやってワークフローを組んでいるのか、何のデータを使っているのかなど学びが得られます。

私はWebPのアップスケールとか動画化とか別のツールを使っていたので、ComfyUIでできることを知りませんでした。

一度使ってみると自分の知らない知識が得られる可能性があるので、もし自分が知らない機能などがある場合は、とりあえず触ってみるのはありだと思います。

あとリリースしたばかりでいろいろ調整中みたいなので、今後はもっと使いやすくなるかもしれません。

以上EasyHunyuanVideoについてご紹介しました。

当サークルではこのようなAIに関するさまざまな情報を発信しています。
メンバーシップに加入して頂くと一部の有料記事は読み放題です。
AI技術の向上、マネタイズ方法などに興味がある方は、ぜひご検討ください。

もしこの記事が少しでも役に立った場合は、いいねやフォローして頂けると励みになります。
最後まで読んでいただき、ありがとうございました。

いいなと思ったら応援しよう！

よろしければサポートお願いします！いただいたサポートはクリエイターとしての活動費に使わせていただきます！