見出し画像

無料の生成AI画像って、拡大できないでしょ?いやそれもAIで

昨日Microsoft Bingで描いてもらった画像、1024×1024ピクセル。
Webならそれなりに使い道ありそうですけど、300dpiだと86.7mm×86.7mm。ハガキにが精一杯やな、というピクセル数です。

Microsoft Bing

これをAdobe Expressで4000×4000ピクセルに拡大してみました。Jpegのノイズを避けるため、PNGです。

Adobe Expressで4000x4000pxに拡大

目元を拡大してみます。1200×900px。

Adobe Expressで4000x4000pxに拡大

では、同社PhotoShopではどうか。「ノイズを軽減」を50%に設定。

PhotoShopで4000x4000pxに拡大

目元を拡大してみます。1200×900px。
「ノイズの軽減」は、効いていなくもない感じではあります。

PhotoShopで4000x4000pxに拡大

まあ、そんなもんでしょう、と思っていたら、「画像を拡大するAI」があるという。

倍数で拡大率を指定するので、1024×1024pxの画像を4096x4096pxに拡大してみました。こちらもPNG。

KakudaiACで4096x4096pxに拡大

目元を拡大してみます。1200×900px。
完璧とは申せずとも、ここまで来たか。

KakudaiACで4096x4096pxに拡大

ノイズが気になったので、これをPhotoShopの「Camera Rawフィルタ」で、手動でノイズを軽減してみました。

Camera Rawフィルタでノイズ軽減

「そらみろ、この程度だろう?」と思いますか?
まあちょっと待ってください。まだ2024年。「令和1桁」です。
そもそも生成AI、有料版なら既に、もっと解像度の高い(データ量の多い)生成画像が作れます。

さて、Stable Diffusion、Adobe FireFry、Microsoft Bing Image Creatorに色々「美人画」を描いてもらいましたが、それぞれ「ゴールは似ていても、各社各様の事情がある」という印象を受けました。

Stable Diffusionは、一度描いたポートレートに出てきた人が、再度出てこないことがありました。もしかしたら画像の著作権者か本人が、異議申し立てをしたのかもしれない。
Adobe FireFryは「日本人」をプロンプトに入れても、何となく違和感のある人物が出てきたりしました。これは東洋人でないとわかりにくいだろうな。なぜそうなるのかというと、もしかしたら「素材の絶対量がまだまだ足りない」のではないか?Adobe FireFlyは「著作権切れのコンテンツ」と「Adobe Stock」を利用している(そうな)。Adobe Stockに採用されるのって、なかなか厳しいです。撮影者使用許諾を得て、かつ、品質だけでなくIP侵害もチェックして、その審査をパスした画像だけを登録しています。実際に登録してみたので、それが言えます。
Microsoft Bing Image Creatorは、既にMSがOpenAIに出資していますし、さらにAIに力を入れようというファイティングポーズを見せているようです。そして、こと私のテストにおいては、生成された画像のクオリティも侮れない感じでした(相対的に)。

Microsoftの商売って、昔から強烈でした。OS(PC-DOS)で覇権を握り、Windowsでオフィススイーツ(office)とブラウザの「必殺爆安攻撃」で圧勝、今はクラウド市場をAWSと分け合うAzureがあり、AIでは真っ先にOpen AIに出資。

で、彼らのゴールは何か?

Adobeは、Adobe Expressが示すように「クリエイティブ全部を、AIでちゅるっと作れるようにして、企業の発注者(クリエイターでなくてよい)の要望に応じてWebからポスターからショート動画まで「何でも簡単に出せますよ」というのを作って、月額制の利用料ビジネスをやりたいのではないか?つまり、Adobe CCを「AIバージョン」にアップデートしないと、このジャンルでの商売に負けてしまう=Adobeそのものが、ほぼ「そのジャンル」で稼いでいる会社なので、失敗は許されないのではないでしょうか。生成AIの素材選択の慎重さにも、そのあたりが影響しているのかもしれない。「躓くわけにはいかない」ので、回り道をしてでも着実に歩みを進めたいのではないでしょうか。

Microsoftも似たような感じなのでしょうが、こちらは「企業内、企業間プレゼンツールを含めて、AIでちゅるっと作れるようにして、PowerPointとか企画書とか簡単に出せますよ」というのを作って、月額制の利用料ビジネスをやりたいのではないか?つまり、Microsoft 365(かつてはMicrosoft office)を「AIバージョン」にアップデートしないと、このジャンルでの商売に負けてしまうという危機感があるのではないでしょうか?

GoogleやMetaにもそれぞれ何らかの考えはあるでしょう。

で、それはさておき(って、ここまでの長い話は何やったん?)、あとで振り返ってみて「令和1桁の生成AIってこんな感じだったよね~」「これ以上のクオリティ出すには並々ならぬ努力を要したよね」、みたいな話になるのかな、と思っている次第です。

サポートをいただければとても嬉しく思います。 写真を撮ったり、書き物をしたり、そういう活動に活かします。