見出し画像

日刊 画像生成AI (2022年11月2日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開され、日々とても早いスピードで変化しています。

"新しい風"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


開発


GoogleのAIに関する発表会 「AI@」

AIにおけるGoogleの最新情報(ロボティクス、言語処理、健康、クリエイティビティ)を話すとのことで、初のAIイベントを予定していたGoogle。この日の夜に開催されました。記録映像はこちら。

画像生成AIの話でいうと、ついにかなり限定的ではありますがGoogleの画像生成AI「Imagen」が「AI Test Kitchen」アプリで利用可能にするとのことです。SDを触ってしまっているので、制限が厳しすぎるように感じてしまう。

他のイベントの詳細については以下のサイトや、bioshokさんがざっくりまとめられていたので載せておきます。


Runway Interpolation追加

さまざまなAIツールを次々と搭載し続けて話題になっているRunwayに補間機能が追加。二枚の画像を入力すると間の映像を補間してくれます。


Krea.aiからAI によって生成された640万の画像を探索

生成画像検索サイトKrea.aiの6423777枚のデータを使い、こちらのサービスでインフォグラフィックを作成しているようです。サービス自体はビジュアライゼーションファームの「Nomic AI」。面白い、Latent空間を旅してるみたい。

仕組みとしては関係の近い画像は近くにマッピングされている。例えばElon musk、Jeff Bezos、Mark Zuckerburgは近くにいる。

試してみた。ここはムンクっぽい画像がいるゾーン
ココアはジョーカー画像がいるゾーン


NovelAIが画像エディタにレイヤー機能を搭載

NovelAIが様々なアップデートを行われていました。 詳しくは以下ツイートのリプ欄か、こちらにどうぞ。 https://novelai.net/updates

あと、Anlasは全部使い切らないといけないらしいです。ひぃ


Poolsuite Diffusionが公開


Elden Ring Diffusionがv3にアップデート

『エルデンリング』のゲーム・アートでトレーニングされたモデルがv3にアップデート。img2imgがうまくいくようになったそうです。「elden ring style」で利用できます。

https://www.reddit.com/gallery/yjnak3


MightyappのSuhailさんが手を治すモデルに投資

顔を修正するAIのように、手を修正するAIに投資することを考えており、これを研究・制作することに興味があれば、DMしてねをとのこと。


Emad氏、非常に大きいAPIアップデートをもうすぐ公開予定

近々、非常に大きなAPIのアップデートが予定されています。

ついに話していたfine-tuningできるサービスとして、API公開とかかな..?
過去にEmadさんがインタビューで何度か言ってた気がする。
SDは無料で配るけど、高度なfine-tuningを誰でもできるようにするけどそれは有料なAPIだった気がするので、多分それですね


表現


Waifu Diffusionも極めたらクオリティすごい..

NovelAIにかなり近いレベルの高度な表現が作れるの知らなかった
とても素敵な作品だったのでメモ


Lofiガールリアル化, ディズニー化

https://www.reddit.com/r/StableDiffusion/comments/yjy7aw/realistic_lofi_girl/
https://www.reddit.com/r/StableDiffusion/comments/yjyw9p/modern_disney_lofi_girl/


「ウォーリーを探せ!」を学習したモデルで生成した画像


『僕の彼女はAI作画』, ポプテピピック シーズン7 11月

現状の画像生成AIならではの失敗を使ったネタが流行っています


研究


HyperNetworks学習実験(潤羽るしあ)


プロンプトは絵文字もいけるよという検証


DreamBoothの開発者の1人から、「sksは使わないで」

sksはライフル銃の名前らしく、現在RunwayMLのSDモデルの
DreamBoothで銃が表示される傾向にあるらしい。なるほど..

https://www.reddit.com/r/StableDiffusion/comments/yju5ks/from_one_of_the_original_dreambooth_authors_stop/

Kohyaさんが使えるワードを調べられていたのでメモ


思想・ムーブメント


Invasive Diffusion(侵襲的拡散)。あるイラストレーターがAIモデルになった理由

Hollie Mengertというイラストレーターさんが朝起きたら自分のDreamBoothモデルが作成されて投稿されていたこと。そしてそれを作った側、機械工学系の学生 Ogbogu Kaluの意見について記載されています。どうやらこの点は海外でも揉めているようです。

Hollie Mengert「彼らがこのツールを作ったとき、彼らは私のことを、芸術に取り組み、物事を磨こうとする人ではなく、むしろブランドか何かのように考えていたような気がしますし、私がイラストを描くあるものは、私の人生と私が経験したことの反映なのです。だって、そんな風に考えている人だったら、やっていないと思うんです。」

Ogbogu Kaluは、トレーニングや使用は合法で、裁判でもフェアユースと判断される可能性が高く、スタイルに著作権はないと考えているようです。被写体やスタイルを忠実に再現することはできても、元の画像そのものはStable Diffusionモデルには保存されません。


ジェネレーティブ AI の台頭は、90 年代初頭の CGI の台頭に匹敵する


将来は、アーティストの作品を買うのではなく、「彼らの」作品のオリジナル作品を作る、あるいは彼らのものの見方を再現するソフトウェアを買うことになるだろう。- ブライアン・イーノ


Midjourneyで作成した無料コミック「THE LESSON」

5週間かけて作られたそうです。かなりクオリティ高い。


Evolving AI Art


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら



サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます