見出し画像

テキストから忠実度の高いマルチビュー画像を作成できる「MV-Adapter」を試してみる

MV-Adapterとは

MV-Adapterは、T2Iモデルとその派生モデルをマルチビュージェネレーターに適合させる、多目的のプラグ&プレイなアダプタとのこと。
SDXLをベースにDreamShape、LCM、ControlNetなどを活用してテキストまたは画像からマルチビュー画像を生成できます。
ComfyUIからもできそうでしたが、一旦デモを試してみたいと思います!

🌐プロジェクト ページ類

💪早速試してみる

デモ画面

Hugging Faceのデモはマルチビュー画像6枚を生成してくれるというものでした。それではまずは赤い髪の猫耳の女の子を作ってもらおうと思います。

Red haired girl with cat ears

できたのがこちら!

かわいい🐱ちゃんと猫耳も生えてます!
動画で撮ってみましたが、切り替えても破綻が少なく本当に忠実度が高い。

他にも色々試してみたいと思います!

ふわふわ雲くま
フルーツドラゴン
お菓子の兵隊
シャボン玉うさぎ
ふくろう
ポストフクロウ
秋の装いの女性

👀まとめ

プロンプトの理解度が高く、視点ごとの画像をここまでリアルに表現できるのは本当に素晴らしいと感じました。
細かい調整は少し難しい印象もありますが、手軽に試せて素早く結果が得られる点が魅力的ですね。
特に「効率性」や「使いやすさ」といった面で、MV-Adapterの良さが際立っていると思います。
キャラクターメイキングの参考にもぴったりですね!
今日はここまで〜!

いいなと思ったら応援しよう!