第三回生成AIなんでもLT会感想

とりにく

2024年3月18日 22:32

まず最初に当日の発表資料公開をば。説明しきれなかったこといっぱいあるなぁ。

資料URL

アプリ&ソース配布

stable-diffusion-webui-forgeビルド関連

陰影LoRA（コピー機LoRA）

線画→疑似3D画像CN学習

その後の研究進捗（現在進行形）

許可とれた。全世界、月須和さんがすごいからみて pic.twitter.com/f2jmS5Aynf
— とりにく (@tori29umai) March 14, 2024

つまり月須和さんがすごい

各発表感想

お家で簡単GPUサーバー　ProxmoxでGPU環境をぶっこわす

だだっこぱんだ(@ddPn08)さんによる、なんとも過激なタイトルですがProxmoxの紹介でした。
発表だけでは把握できないことがあったので、こちらの補足資料が助かりました。色々勉強しなきゃな・・・

latent surfing

teftef(@hanyingcl)さんによる、GANとDiffusionモデルについてのお話でした。
私はそもそもGAN？pix2pix？？なにそれおいしいの？？？な状態でこの世界に参入したので、GANの話について伺えるのは貴重で興味深かったです。

動画生成AIによるシミュレーション動画は物理法則を満たしているのか

だだ茶豆さんによる、Soraの物理法則検証についてのお話でした。
物理屋さんのお話なので理解できるかなと不安だったたのですが、素人向けに最初に軽い解説をしてくれたのでありがたかったです。
動画生成系も触りたいなぁ。

ノンプログラマーがAiを駆使してControlNetモデルを作成するまでの格闘

YUiCHI(@YUiCHI_Bi)さんによるControlNet開発者にとっては涙なしに聞けない研究の軌跡でした。わかる・・・！！！！本当にCN開発やっている人少なくて苦しいよね！！！わかる！！！！！（個人的に思い入れナンバーワン発表）
自分も純エンジニアではない（主観として）のでめちゃくちゃ共感しました。建築分野での活用、できたら絶対楽しいですね。

層に着目したLLMの口調の学習について

sergicalsixさんによるLLM学習についてのお話でした。
LLMの語尾について自分は形態素解析で文末の語尾を変換するアプローチを考えていたんですが、考えてみれば学習させちゃうのも全然ありなんですよね。
うーー！LLMも触らないとなぁ。

ComfyUIをフル活用して画像生成AIサービスを作ってる話

teppei.fujisawaさんによるアパレル業界での活用例でした。
あーーーーそういえばComfyUIって手ありましたね。自分、ノードベースが苦手でうっかり自作アプリのバックエンド起用の選択肢からComfyUIを外していたんですが全然ありやんけ！ということに気付いた発表でした。
喰わず嫌いよくないね・・・。

AIアップスケーラーの創造性と一貫性

ShionさんによるAIアップスケーラーについてのお話でした。
自分はアップスケーラーについてはReal-ESRGANで止まっていたので、それ以外の話が聞けて面白かったです。
この分野ももっと勉強したら面白いもの作れそうですね！

以上、AI素人のとりにく目線による感想でした！！！！！！