幅5,000ピクセル以上の生成画像が標準的な解像度(商業デザイン業務の場合)/4Kサイズの画像を1分程度で生成できるMystic v2.5 (beta)/Blog - 2025/01/27
先週、デザイン業務における画像生成AI活用に関する意見交換会があり、生成画像の解像度についてまとめましたので、一部を簡単にメモしておきます。
画像生成AIの技術進化に伴い、生成できる画像の高解像度化が進んでいます。Mystic v2.5 (beta)は、4Kサイズで生成することができます。
アップスケールではなく、標準設定が「2K および4K」になっています。
16:9:5,504 x 3,072 ピクセル(4K 生成)
1:1:4,096 x 4,096ピクセル(4K 生成)
「4Kで生成できる!」となれば、1年前なら話題になったかもしれませんが、現在は優れたUpscalerが多いので幅5,000ピクセル程度の生成画像は当たり前になっています。
私は、Topaz Labsの「Gigapixel 8」が最も利用するCreative Upscalerです。以前は、Magnific AIでしたがローカルで処理できる(つまりお金がかからない)Gigapixelに乗り換えています。
※Gigapixelはクラウドでも処理できますが、クレジットが必要になります。
以下の画像をご覧ください。
右側が生成AIモデルでCreative Upscaleしたものです(左側のオリジナルはMidjourney v6.1)。髪の毛のディテールが大幅に向上していることが確認できると思います。
Gigapixelの最新バージョン8から生成AIが利用可能になっています。
Creative Upscalerが普及して生成画像の高解像度化が容易になりましたが、ワンクリックで4Kの画像が1分弱で生成できる「Mystic v2.5 beta」はかなり優秀です。コンシューマーの大半のユーザーはオーバースペックだと思いますが…
今年の後半には、このレベルの4K生成モデルがどの画像生成AIにも実装される可能性があります(もちろんクレジット消費は大きくなりお金がかかります)。
プロフェッショナル用途では、Creative Upscalerが必須となっていますが、デザイン制作会社などで最も導入されているのが「Magnific AI」です。
Mystic v2.5 betaは、このMagnific AIの1つの機能として提供されています。4K生成可能なv2.5が使用できるのは、今のところMagnific AIだけです。
※Freepikで使用できるMysticはバージョン2なので4Kで生成できません(2Kまで)。
最大の問題はハルシネーション
生成画像の品質は格段に向上していますが、ハルシネーションは必ず発生します。これは現在でも変わりません。今後も劇的に改善される見込みはなさそうです。
現在、最も使用頻度の高い画像生成AIモデルは「Adobe Firefly」ですが、目的は画像生成ではなく、生成画像で発生したハルシネーションの修正です。
要するに、Adobe Photoshopの生成塗りつぶしや生成拡張(Fireflyの機能)、既存の画像処理テクニックを駆使して、Midjourneyなどの生成画像のハルシネーションを修正する膨大な作業をこなす必要があるわけです。
生成画像が写真に近づいても、このハルシネーションが発生するかぎり、「それっぽいイメージ」でしかありません。
生成された画像の中の「嘘」を発見するのは容易です(人物の顔のクローズアップなどは目視で区別できなくなっていますが…)。
ただ、Photoshopの達人がハルシネーションを修正した画像は、私でも写真と区別できません。つまり、画像処理・レタッチのプロフェッショナルが仕上げた生成画像は「それっぽいイメージ」ではなくなります。
現在、画像生成AIを上手に使いこなしているデザイン制作会社の共通点は、社内に美術解剖学などの知識を持っている「Photoshopの達人」がいることです。
2025年も画像生成AIの技術進化が止まらないと思いますが、やはりハイブリッドワークが最強です。
グラフィックデザインなどに画像生成AIを実践導入したいなら、「Photoshopの達人」を確保する必要があります。
数年後、デザイン特化のAIエージェントが利用可能になって、「Photoshopの達人」が不要になることも考えられますが…
時間はかなりかかりそうです。
更新日:2025年1月27日(月)/公開日:2025年1月27日(月)