沢山あってよく分からないStableDiffusionと派生画像生成AIの種類とその歴史について(FORGE,Novel AI,Flux.1,SDXL,Runway MLなどなど)
StableDiffusionの派生が沢山ありすぎて、画像生成AIの種類が何がなんだか私も良く分からないので一度整理しようと、軽い気持ちでまとめようと思ったら、わずか数年で想像以上に凄い量が出てそうですね。。。wikipediaなども多少参考にしていますが、何か間違えて書いていたら教えてくださいw
これが始まり
StableDiffusionオープンソースの誕生
まずStableDiffusionはStability AI社が「AIの民主化」「技術の普及と発展」などを目的として、新しいAIの世界を作るため、2022年8月22日、オープンソースとして提供を始めました。それがStableDiffusion、画像生成AIが大きく広がる最初の一歩です。そして目的の通り、画像生成AIが一気に広がり始めました。。
※Stability AI社は他にもStable AudioやStable Videoなどさまざまな開発をしています。
本家と派生オープンソースのStableDiffusionの時系列
オープンソースでは、Flux.1、ReForge などが最近のアプリになります。
本家利用なら、StableDiffusion3.5が最新です。
オープンソースは、コミュニティが盛んで、常に技術が成長しています。
※私は特に問題も無いため、まだForgeを使ってます💦
2022年のStableDiffusion派生系
AutoMatic1111が出た2022年、すぐにStableDiffusionの派生として登場したのは、NovelAIでした。またStableDiffusionのオープンソース化にも関わり、2022年から動画生成AIで有名なRunwayMLがStableDiffusionを利用するようになりました。
2023年のStableDiffusion派生系
LeonardoAIが登場しますが、2023年には後のCanvaに買収されてしまいます。
2024年のStableDiffusion派生系
2024年は、新しい誕生が無くても、他の派生系のバージョンアップなども継続して改善しているため、今まで出てきていた、それぞれのツールで数々の変化が生まれています。
また、Stability AI社から3.5系でいくつか新しいバージョンが出ています。
まとめ
もう少し深堀したかったのですが「あっ。StableDiffusionの派生か」と思えば、始めてでも、取り扱いするにも理解が早いかと思います。
他にもありそうですが。。。
そのうち、OpenAIなど派生じゃない個別の画像生成AIも調べてみたいですね。それと動画生成もいろいろと乱立してきているので、気になるところです!