第三回生成AIなんでもLT会感想
まず最初に当日の発表資料公開をば。説明しきれなかったこといっぱいあるなぁ。
資料URL
アプリ&ソース配布
stable-diffusion-webui-forgeビルド関連
陰影LoRA(コピー機LoRA)
線画→疑似3D画像CN学習
その後の研究進捗(現在進行形)
つまり月須和さんがすごい
各発表感想
お家で簡単GPUサーバー ProxmoxでGPU環境をぶっこわす
だだっこぱんだ(@ddPn08)さんによる、なんとも過激なタイトルですがProxmoxの紹介でした。
発表だけでは把握できないことがあったので、こちらの補足資料が助かりました。色々勉強しなきゃな・・・
latent surfing
teftef(@hanyingcl)さんによる、GANとDiffusionモデルについてのお話でした。
私はそもそもGAN?pix2pix??なにそれおいしいの???な状態でこの世界に参入したので、GANの話について伺えるのは貴重で興味深かったです。
動画生成AIによるシミュレーション動画は物理法則を満たしているのか
だだ茶豆さんによる、Soraの物理法則検証についてのお話でした。
物理屋さんのお話なので理解できるかなと不安だったたのですが、素人向けに最初に軽い解説をしてくれたのでありがたかったです。
動画生成系も触りたいなぁ。
ノンプログラマーがAiを駆使してControlNetモデルを作成するまでの格闘
YUiCHI(@YUiCHI_Bi)さんによるControlNet開発者にとっては涙なしに聞けない研究の軌跡でした。わかる・・・!!!!本当にCN開発やっている人少なくて苦しいよね!!!わかる!!!!!(個人的に思い入れナンバーワン発表)
自分も純エンジニアではない(主観として)のでめちゃくちゃ共感しました。建築分野での活用、できたら絶対楽しいですね。
層に着目したLLMの口調の学習について
sergicalsixさんによるLLM学習についてのお話でした。
LLMの語尾について自分は形態素解析で文末の語尾を変換するアプローチを考えていたんですが、考えてみれば学習させちゃうのも全然ありなんですよね。
うーー!LLMも触らないとなぁ。
ComfyUIをフル活用して画像生成AIサービスを作ってる話
teppei.fujisawaさんによるアパレル業界での活用例でした。
あーーーーそういえばComfyUIって手ありましたね。自分、ノードベースが苦手でうっかり自作アプリのバックエンド起用の選択肢からComfyUIを外していたんですが全然ありやんけ!ということに気付いた発表でした。
喰わず嫌いよくないね・・・。
AIアップスケーラーの創造性と一貫性
ShionさんによるAIアップスケーラーについてのお話でした。
自分はアップスケーラーについてはReal-ESRGANで止まっていたので、それ以外の話が聞けて面白かったです。
この分野ももっと勉強したら面白いもの作れそうですね!
以上、AI素人のとりにく目線による感想でした!!!!!!