見出し画像

PuLIDで革新!1枚の顔画像から多彩なAIイラスト生成 🖼️👤 ComfyUIワークフロー完全解説 & 顔の一貫性保持テクニック 🔍初心者も簡単マスター!PuLID+LoRA+GGUF量子化モデルで実現する驚異の画像生成 🚀

みなさん、こんにちは!葉加瀬あいです!

今回は、前回の記事に引き続き、PuLIDについて詳しく解説していきますね!

前回は、最近のFlaxの画像生成における量子化などの最新トピックについてお話ししました。今回は、それを踏まえて、前回少し触れたPuLIDの使い方やインストール方法を詳しく解説し、実際に画像生成ができるところまでご案内したいと思います!

GGUF-Flux版PuLIDってどんな技術?

PuLIDは、本当にすごい技術なんです!なんと、たった1枚の顔画像から、その人物の特徴を引き継いだ画像生成ができちゃうんですよ!

しかも、リアルな画像もアニメ調の画像も、大人っぽい雰囲気も子供っぽい雰囲気も、何でも自由自在に生成できるんです。これって、すごく便利じゃないですか?

こんな感じで、顔画像1枚から、様々なスタイルの画像が生成できるんですよ!

「むむ、これは使えそう!」と思った方も多いのではないでしょうか?PuLIDを使えば、キャラクターデザインや似顔絵作成など、幅広い用途に応用できそうですね!

なお、私のメンバーシップに入門されている方は、
いつものように、記事の内容を動画で確認できます!スキマ時間で最新のAI情報を手軽にキャッチしたい方はこちらからどうぞ!

(CommingSoon)

なお、Youtubeの方では、一部の動画を期間限定で配信したりもしているので、よかったらこちらのチャンネル登録もおねがいします🙌

それでは、本日もよろしくお願いします!


はい!ということで、改めてこんにちは 皆さん!

最近ChatGPTとおしゃべりするのが趣味になっちゃった、葉加瀬あい(ハカセアイ)です!最近はBluetoothイヤホンを探してるんですが、マイクが別についてるやつってないかなーって思ってます。みなさんも、AIとのおしゃべりにハマってたりしません?

PuLIDでの画像生成

さて、今回のテーマはFlaxでのPuLIDによる画像生成です!前回の記事でも少し触れましたが、今回はより詳しく解説していきますね。

前回の記事はこちら

PuLIDって本当にすごい技術なんです!なんと、たった1枚の顔画像から、アニメ調もリアル調も、大人っぽい雰囲気も子供っぽい雰囲気も、顔の特徴を維持したまま自由自在に画像生成ができちゃうんですよ!

こんな感じで、様々なスタイルの画像が生成できるんです。すごいですよね!

今回は、この素晴らしい技術について詳しく解説していきます。実は、最近になってやっと使えるようになったんです!さらに、前回ご紹介した量子化の技術とも組み合わせられるようになりました。早速インストールして、一緒に使っていきましょう!

量子化についての前回の記事はこちら

ただし、PuLIDの使い方には少し準備が必要なんです。専門的なことをちょっとだけ学ばないと、みなさんが自由に画像生成するのは難しいかもしれません。でも大丈夫!今回は、その準備の仕方から丁寧に解説していきますね。

LoRAや量子化モデル、GGUFの量子化モデルなども組み合わせながら、わかりやすく説明していきます。きっと最後には、みなさんもPuLIDを使いこなせるようになりますよ!

ちょっとしたAI関連の話題

さて、ここからはちょっとしたAI関連の話題をご紹介しますね。

Flux 1.1 [pro]

なんと、Flux 1.1 [pro]がリリースされたんです!

こちらのツイートをチェック!

このバージョン、プロンプトの理解度が高くて、画像生成がとっても速くなったんですよ。しかも、きれいな画像ができるんです!まるでスーパーサイヤ人みたいな進化ですね!

さらに驚きなのが、1枚たったの6円で画像生成ができちゃうんです。とってもお得ですよね!

気になる方は、こちらのURLから試せるみたいです。ぜひチャレンジしてみてくださいね!

Hedra Character-2

それから、もうひとつ面白い技術をご紹介します。Hedra Character-2という、最大4分までのリップシンクができる動画生成AIがリリースされたんです!

これ、今回使うPuLIDと組み合わせたら、もっと面白いことができそうですよね!

どんなものかというと、音声ファイルと画像1枚を用意すると、画像の口がパクパク動く動画が作れちゃうんです。すごいですよね!

こちらの動画で、実際の様子を見ることができますよ!


アドバンスドボイスモード

ここで少し、以前お話ししたアドバンスドボイスモードChatGPTの今後についてお話ししますね。こちらの記事で少し解説したんですが...

実は、ここで生成したものを音声と組み合わせると、面白いことができちゃうんです!例えば、ApplioAIボイスチェンジなどと組み合わせると、高性能なAIの読み上げを好きな声で行うことができるんですよ。今回ご紹介する技術とも相性が良さそうですね!詳しくはこちらの記事をご覧ください。

興味がある方は、ぜひ試してみてくださいね!

さて、ここで少しChatGPTの話題に触れておきましょう。アドバンスドボイスモードの録音方法について、よく質問をいただくんです。

実は、MacBookをお使いの方なら、MacBook用のChatGPTアプリをダウンロードして録音ができるんですよ!詳しい情報はこちらにあります。

https://openai.com/chatgpt/mac/

そして、うれしいお知らせがあります!ChatGPTのWindows版が、公式発表によると今年の後半にリリース予定なんです。もうすぐWindowsでもアプリケーションとして使えるようになるかもしれませんね!

現在のWeb版ではアドバンスドボイスモードでAIとおしゃべりすることができないんです。でも、Windows版アプリが登場すれば、おしゃべりしながら録音ができるようになるかもしれません。そうなると、今回のPuLIDと先ほどのHedra、そしてアドバンスドボイスモードを組み合わせて、簡単にAIキャラクターがおしゃべりしているような動画が作れるようになりそうですよ!

さて、ここまでで少し脱線してしまいましたね。それでは、本題に入っていきましょう!

ComfyUIでのPuLIDの使い方

今回、PuLIDを使った画像生成は、ComfyUIというものを使って行っていきます。ComfyUIについては、以前の記事でも「AIで画像生成するなら使った方がいい」とお伝えしたんですよ。

ComfyUIを使いたい方で、クラウド環境から無料で試してみたい方は、こちらの記事をご覧ください。詳しい方法をご紹介しています!

私は、Stability Matrixというものを使ってですね、自分のPCから起動するんですけども。

Control+Shift+Enterを押して、タスクマネージャーのパフォーマンスというところを見ていただいて、そこでの専用GPUメモリという場所が12GBない方は、クラウド環境からのご利用をおすすめしております!

なので、ちょっとここら辺確認してからですね。クラウド環境から使うのか、それともご自身のPCから使うのかといったことを考えていただければと思います!

ワークフローのダウンロード

はい!それでですね、ComfyUIを使うので、ワークフローというものをダウンロードして、それを使ってPuLIDの画像生成とか、あとは、必要なもののインストールとか環境構築とか、そういった諸々のことをやっていきたいと思います!

ここからは、あいラボ (AI-Labo)の入門者限定のコンテンツとなります。
 
✅️ あいラボ (AI-Labo)について
知識0の状態でも分かるように、最新AI技術の導入方法・使い方などを解説しております。
 
PCなどの初期費用も0円から可能です🙆‍♀️
  
🎈入門者だけの特別特典3つ
① 葉加瀬あいの執筆した、200以上のAI関連記事が読み放題。
② 動画でも note記事 の内容を確認可能に。
③ note記事・動画解説 について質問OKで、初心者の方でも安心です。
 
ご入門はこちらから 👉️ https://note.com/ai_hakase/membership/join
(参加人数に制限があります。ご入門はお早めに!)

まずはですね、こちらのワークフローをダウンロードしていただきたいと思います!

ここから先は

6,206字 / 42画像 / 1ファイル

🎈葉加瀬のAI研究室 ~あいラボ~ 記事/動画/質問プラン

¥2,599 / 月
あと7人募集中
このメンバーシップの詳細

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?