見出し画像

日刊 画像生成AI (2022年10月26日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開され、日々とても早いスピードで変化しています。

"広がるアイデア"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


開発


StableDiffsuiionが利用できるサービスの1つ、「getimg.ai」にtext2maskが追加

部分修正する際は普通ペンやツールでマスクを作って、プロンプトを入力してそこだけ置き換えるのが主流ですが、text2maskを使えばプロンプトでマスクを作ることができます。webui by automatic1111にも実装されていますがこの度、stablediffusionが使える有名な海外のサービスの1つ、getimg.aiにその機能が搭載されました。この機能が搭載されてるSDwebサービスはまだないのでいいですね、ていうかここ最近これ系サービスの競争がすごい。

https://www.reddit.com/r/StableDiffusion/comments/ye1j9q/ive_added_a_prototype_of_textual_inpainting_to/


DreamBooth by Cantrell

Stability AIのプロダクト担当副社長, PhotoshopのStableDiffusionが使えるプラグイン開発をされていたCantrell氏がいくつかのバグ修正、利便性、およびユーティリティを備えた DreamBooth リポジトリのフォークを作成しています。今 Nvidia A100でテスト中とのこと。


StableDiffusionで生成した画像アセットを利用して、(キャラクター以外)リズムゲームを作成している方がいます。

すごい、Midjourneyの素材で作られているゲームは公開されてバズったりしていましたが、StableDiffusionだともうこのままリリースできそうでいいですね、Midjourneyだとどうしてもそれ感が出てしまうので。
テキストからゲームを生成できるようになって、画像素材も同時にこうやって生成できるようになったら本当に楽しそう。


ゼルダ姫のHypernetworkが公開

BOTW のゼルダのスクリーンショットでHypernetwork学習をした方がおり、ptファイルを公開されています。違いは以下の画像に添付しました。

https://www.reddit.com/r/StableDiffusion/comments/ydg4d9/i_made_a_princess_zelda_hypernetwork_link_in/


Windowsで、ShivamShriraoリポジトリ(DreamBooth)をローカルで使用する


表現


元絵を分割してimg2imgして作るアートが流行っています

AIに読み込ませる参考画像を9等分して、それぞれでimg2imgをして生成するアートがこの日海外では流行っているようです。

https://www.reddit.com/r/StableDiffusion/comments/ydz2jz/someone_showed_me_a_similar_picture_generated/
https://www.reddit.com/r/StableDiffusion/comments/ye8isq/this_is_the_place_from_my_dreams/
https://www.reddit.com/r/StableDiffusion/comments/ye2ub5/its_about_time/


NovelAIで複数キャラを顔を崩さず出力する方法

高杉さん曰く、こちらのプロンプトでいけるようです。猫の絵文字を大量に使って大量に猫を出力するのをかりみやさんがやられていたので、絵文字はいいのかもしれません。

masterpiece, best quality some girls, 美味しいヤミー❗️✨🤟😁👍感謝❗️🙌✨感謝❗️🙌✨❗️🍖😋🍴✨🙏✨🙏✨ 🙏✨ 🙏✨🙏✨🙏✨ ハッピー🌟スマイル❗️👉😁👈


研究


一昨日登場した新しいDreamBoothの検証続々

新しいDreamBoothとはこちらこちら。モデルを破壊せず、数百の概念も学習できる上、1時間程度で学習できるというすごいDreamBoothが公開されて話題になりました。初めての方に向けて話すとDreamBoothは少ない枚数で新しい概念を学習させ、モデル全体に影響を与えるもの。

この人は1500stepくらいの学習がちょうど良かったなぁとのこと。

リーサ・リサージュ・ヤスミンさんも複数概念学習できるノートブックを作られていました。ShvamShriraoさんのdiffusers改造独自機能実装があるんですね


Spiderverse Diffusion + Robo Diffusion + Arcane Diffusionの結合

チェックポイントをマージする実験をされている方がいたのでメモ。roboはほぼ消えてるけど、いい出力ですね

https://www.reddit.com/r/StableDiffusion/comments/yds564/create_your_own_unique_characters_by_combining/


StableDiffusionで手を作る方法

手書きからおそらくimg2imgを繰り返して手を綺麗にしている事例。ただ解剖学的に明らかにおかしかったりするのでこの辺りは難しいですね、個人的には元写真として手の写真を使うか、3Dモデルの手を使うかでimg2imgするのが現状としては一番クオリティが高いと思っています。


思想・ムーブメント


StabilityAIのローンチイベントの公式動画アップロード, 内容をスレッドでツイート

StabillityAIのローンチイベントに関しては以前解説しましたが、公式アカウントで動画をアップ、内容についてスレッドで紹介されているのでまだ見ていない方はこちらをチェックするのもいいかと思います。

以前の解説はこちら


Myuk - フェイクファーワルツ (Music Video)

Midjourneyの背景(852話さんが生成)を使ったミュージックビデオが公開されました。素敵な作品なのでぜひ!


AIから考える面白いのメカニズム


この日の気になるツイート


勉強


Qosmoさん、深津さん、水野さんの勉強会アーカイブ

生成AIはビジネス・デザイン・アートをどう変えるのか?のセミナーに参加していたんですがレポートが公開されたようです。大変面白くて勉強になったので興味ある方は是非。


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます