見出し画像

アップスケーラーもここまで来たかと思わせる"GigaGAN"から派生した「AuraSR」

"GigaGAN"と「AuraSR」について

アップスケーラーには度々お世話になっています。
なんだかんだなくてはならない技術ですよね。そんなときに見つけたAuraSRについてまとめてみました。

GIgaGANはAdobeが2023年の8月ごろ発表した、テキストを画像に変換するために使用される大規模なAIモデルです。GIgaGANには10億のパラメータがあり、他の人気モデルよりも高速かつ高品質の画像を生成可能。
具体的にはStyleGANの36 倍のスケールが可能で 超高解像度画像をわずか 3.66 秒で生成できます。

このAuraSRはそのGigaGAN論文から派生した6億個のパラメータを備えたアップサンプリングモデル。
特徴としてスキップレイヤーエキサイトと補助再構築損失による高速収束と安定性向上、1kから4kのアップサンプラーのコードを含み、モデルは完全にオープンソース。画像を4倍に拡大して詳細を追加したり、繰り返し拡大したりすることもできるようです。

🌐プロジェクトページ類

GigaGANについてはこちら↓

早速試してみる

さて何の画像の解像度を高くしてみるかな、、、

それではなんとなく生成したこちらの画像を使用してみたいと思います。

この灯台をはっきりさせたい

奥の灯台はちょっとぼやけていますね。こちらを切り取って入れてみます。

ほいっとな
できた

生成はすぐ終わります。でも、スライドで見比べないとイマイチ分かりづらそうだったので動画を撮りました。

ちゃんとアップスケールでしっかりくっきり生成できていますね。
他の画像でも試してみたいと思います!

色々試してみた

まとめ

アップスケーラーは小さく生成したものをクオリティ高く解像度を上げられるので、いろんな場面で活躍しそうです。
しかもこれは生成速度もだいぶ早いのでイライラすることもなく使えるのでありがたい。
とにかく便利な世の中になってきていますね!!
今回はここまで〜〜〜

いいなと思ったら応援しよう!