画像生成aiの最新状況
はじめに
midjourneyからstablediffusionと、華々しい登場により一気に盛り上がった画像生成AI。
最近は着実なクオリティーアップと痒いところに手が届くバージョンアップを繰り返している印象だが、技術的にはどこら辺まで来たのか?一度整理したい。
midjourney
画像生成AIと言えばこれというくらい有名な画像生成AI。
アニメ系に特化したniji-jorneyもバリエーションを持ち、アニメからリアル系まで幅広く対応している。
更には近年web版も便利になり、これまではdiscordでしか使えなかった中で便利に生成できるようになった。
2024/11現在の最新版は
midjourney v6.1
niji-jorney v6
stablediffusion
midjourneyと並ぶ生成AIの普及に大きな影響を及ぼした。なにしろ初期は無料で使え、今でも年間収益100万ドル以内の企業は無料。オープンソースの為たくさんの有志が便利に使えるツールを生み出し現在に至る。
産み出されたツール類
・Stablediffusion Web UI
・Comfy UI
・Stablediffusion WebUI Forge
・Stablity matrix
更にはstablediffusionから生まれた下記技術により、更なる発展が行われ、midjourneyでも同様の機能が組み込まれるまでに生成AIの進歩を促進した。またstable video diffusionなどの動画生成、3Dモデル生成など幅広く手掛けている。
また、さまざまな有料ツールもこの機能を用いて画像生成を行っている。
主な機能
・controlnetによるポーズ指定
・ADetailerによる追加修正
・高画質化
・Rembgによる背景削除
・Reactor(Face swap)による顔の入替
最新バージョン
stablediffusion 3.5
adobe firefly
映像、画像制作といえば知らない人がいないあのadobeも生成AIに取り組んでいる。photoshopやillustrater、premiereなど各種ツールと組み合わせて使え、特に権利関係についてリソースを元に学習していることを強みとして打ち出している。
またもともとのツールとの組み合わせも強みとしており、クオリティは2.3歩及ばないものの生成AI界隈では確かなポジションを獲得している。
特にAIでのベクターデータ作成、premiereでの動画自動延長などならではの機能も豊富。
DALL-E3
chatGPTの開発会社が生み出した画像生成AI。特徴的なのがchatGPTでやりとりしながら作成する制作フローが特徴。
chatgptで使え、生成されるイラストは独特の雰囲気を持っており、絵的にも癖がある。
個人的にはクオリティはmidjourneyに遅れをとっているかとは思うが、UIやエフェクト、実写などであればかなりのクオリティを出せている印象。
また、microsoft bing generaterでは無料で生成可能。
Google imagen
Google Geminiで使える画像生成AI。画像生成AIでは一歩遅れていたGoogleだが猛烈に追い上げている印象。
canva (leonardo.ai) ドリームラボ
https://prtimes.jp/main/html/rd/p/000000034.000066101.html
canvaがleonardo.aiを買収し、独自のphoenix基盤を用いた画像生成AIを用いたサービスを始めることを2024/10/23に発表したようだ。楽しみ。
flux.1
stablediffusion3リリース後に離れたチーム、「black forest labs」によって開発された、テキストや画像を生成することができるAIサービス。
stablediffusionをベースとしオープンソースとして公開していて、stablediffusion web UIなどのツールでも利用可能。
stablediffusionを超えてmidjourneyに近づいた!と言われている。
確かにクオリティ良くなってきたよね。何よりオープンソースというのは庶民の味方!
Recraft AI
2022年にロンドンで開発された画像生成AIツール。
特にベクターデータのAIで高い評価をうけている。画像も生成出来るようだ。後程検証予定。