「Hallo2」とは?特徴とセットアップを紹介!【無料で高品質リップシンク】
Hallo2の概要
Hallo2は、入力された音声と人物画像を同期させるオープンソースプロジェクトです。
実際のアウトプットは、以下のイメージです。
Hallo2の強みは、大まかに以下の3つになると思います。
これらの強みを実現するために以下のような実装をしていると記載されています。
DeepL直張りのため、原文興味ある方は以下のリンクから!
Hallo2のセットアップ
公式のREADMEから抜粋ですが、実行までのコマンドを紹介したいと思います。
公式ではLinux環境前提のため、それ以外の方は以下の記事が参考になるかと思います!
Google Colab
Docker
Clone & Conda環境の作成
conda環境での実行が公式では推奨されています。
git clone https://github.com/fudan-generative-vision/hallo2.git
conda create -n hallo python=3.10
conda activate hallo
pytorchとその他pkgのインストール
pip install torch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
ffmpegのインストール
# linux環境の場合
apt-get install ffmpeg
事前学習モデルをダウンロード
git lfs install
git clone https://huggingface.co/fudan-generative-ai/hallo2 pretrained_models
interfaceの立ち上げ
python scripts/inference_long.py --config ./configs/inference/long.yaml
configファイルからsource_image, driving_audio, save_pathなどのパラメーターをいじれるみたい。
参考
この記事が気に入ったらサポートをしてみませんか?