日刊 画像生成AI (2022年11月9日)
ジェネレーティブAI界は、今とても早いスピードで進化し続けています。
そんな中、毎日時間なくて全然情報追えない..!って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。
過去の投稿はこちら
開発
いきなりこの日のは楽しいのから..
Hagging Faceがお店をオープン!
Multilingual Stable Diffusion
50の異なる言語に対応したStableDiffusionが公開されたようです。
以下のリンクからデモページにアクセスできます。
NovelAI の教科書『元素同典 不完全科学の魔導書』
Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1
中国語と英語のバイリンガル。 20Mのフィルタリングされた中国語の画像とテキストのペアでトレーニングされたStable Diffusioon。
StableDiffusion に対応したAI生成画像の判別システム
ReAct: 言語モデルにおける推論と行動の相乗効果
NMKD SD GUIが1.7.1にアップデート
Windowsで使える有名なStable Diffusion実装の1つ、NMKD SD GUIが1.7.1にアップデート。主にVAEの選択、プロンプトのwildcard、より簡単なDreamBoothのトレーニング、他様々なアップデートが施されたようです。
ダウンロードはこちら
さらに詳細はこちら
DreamBooth Isometric modelが公開
アイソメトリックな風景を出力できるDreamBoothモデルが公開されました。
samdoesartsモデルが公開
Sam Yangさんのモデルが公開。現存のアーティストの方のモデルなので使用の際は独創性のあるものを作ること、あと厳重に注意して利用することが望まれると思います。他の概念を合成して創造的なものを作りましょう。
(って言ってもなんかモデル作るの作家さんから時間をかけて作ってきた独自の画風が大人数の方が複製できる環境が簡単にできてしまう訳で、この状態は現在の自分の感覚だととても良く思われないと思うので..、感覚とか考え方を何かしらの方法で全員アップデートするのか、作る側、使う側のルール作りが必要そう)
https://huggingface.co/artymcfly/samdoesarts/tree/main
James Webb Space Telescope モデルが公開
研究
DiffusersベースでStable Diffusionをfine tuningする
Stable DIffusionのVAEの性能検証, メモ
なんかさんのSDのVAEの性能の実験。改めて64x64のこのクオリティからここまでできるのすごいなぁって思う
思想・ムーブメント
Microsoft、GitHub、OpenAIが訴訟されている問題について、弁護士に話聞いてみた
AI が人間の知性を複製するものだと想像することは、想像力を制限することです。
Runwayのインハウス クリエイティブ チームの創設メンバーインタビュー
私のロボットの妻。人間とAIの関係の未来
NovelAIの注目度が日本がトップに
RLHFによるモード崩壊の謎
(RLHFとは、人間のフィードバックを反映させた強化学習のことです)
CarperがSDをRLHFでfine-tuningしているから、リサーチアシスタントを募集してる
音楽の生成がどれだけ困難か人々は過小評価している
データがそもそも不足しており、やるには既存のプラットフォームから海賊版データを作らなければならないが、それをやり始めると多くの人や法務の方々がやってきてしまう点。また、画像とテキストはオープンソース界隈が主導だけど、音楽に関してはまだアカデミアのものであるなどが書かれてる
勉強
AssemblyAIのAI用語解説一覧
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。
画像生成AIの実験, 最新情報のまとめはこちら
過去の号はこちら
次の号はこちら