※ 画像生成AI業界進化早すぎて追いつけない.. って声をよく聞いたので最新情報を毎日マガジンでまとめています。 (2022.9.4)
※ 深津さんより早く、めっちゃ検証して事例まとめて分かりやすく伝えたつもりだったけど深津さんの発信力強すぎて埋もれちゃった..。あと深津さんのワクワクさせる文章力がすごい (2022.8.22)
はじめに
Stable Diffusion本格始動…!!
DreamStudio β(オンライン版 stable diffusion)いよいよ開始されましたね!
https://beta.dreamstudio.ai/
ずっと海外のsnsサービスで最新情報張ってたので、公開された瞬間利用し始めてコツコツ検証してnoteまとめていたのですが..さらっとabubuさんに早めに出されてしまい悔しい..
海外でLeakされたWeight使って早めに使えないか、google colabでひたすら検討したのですが..失敗に終わり、朝を迎えました。悔しい。
Stable Diffusionは正式公開は明日です。(おそらくでしたが、確実っぽいです。VRAM10GBくらいで利用可能です。これはどんどん圧縮されて多分一般化されます。)
(開発してる人が毎日カウントダウンしてる。)
一応、StableDiffusionとは
はっきりまず言います…とにかくやばいです。
分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと…
クオリティがかなり高い。
制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。
生成が早い。
設定なしで使えば正直体感DALLE2より早いです。6秒..くらい?
安い。
3円くらいだと思います。
DALL・E2は1生成17円。Midjourneyは月4000円。
オープンソース
これからいろんなサービスにこのAIが搭載されます。
他AIではかけられている学習データのフィルターがない。
各国の代表者や、有名人、ポルノがデータに含まれています。
PC上で使用できる。( = その場合無料)
いや、これは..
です。
もうこの人が言ってるみたいに、もうGoogleとかのサーチエンジンよりも、画像生成しちゃったほうがいいよねって時代になります。
おそらく。
では本題。
Stable DiffusionのDiscordに入れたので、過去に製作されていた創造物をざらっと眺めてみました。
そこで、これは基礎表現としてみんな知っておいた方がいいなという基礎的なPromptのみまとめます。以下です。どうぞ。
1) 人物
生成画像 & Prompt
個人的に実験
2) アニメキャラ
生成画像 & Prompt
他ネットユーザーの挑戦
これ見るだけでもやばいってなりますよね、このディテール。
3) クリーチャー、ロボ
生成画像 & Prompt
個人的に実験
4) 風景
生成画像 & Prompt
個人的に実験
5) 建築
生成画像 & Prompt
6) モノ, プロダクト, 背景素材
生成画像 & Prompt
個人的に実験
7) AIアートならでは表現
生成画像 & Prompt
応用) 生成した後の話
著作権はあるの?利用していいの?
Stable Diffusionで生成した画像は、CC0 1.0 Universal Public Domain Dedication(https://creativecommons.org/publicdomain)に値します。
CC0とは、すっごい簡単にいうと権利放棄で、商用利用OKです。
ただ例外が2つあり、「著作者人格権」が存在するということを理解し、
CC0ではない著作物が、CC0のコンテンツに含まれている場合は危ない。ということを理解しましょう。
画質上げたい → アップスケーラー
ESRGan
0-10倍まで引き伸ばせます。顔の補正も可能です。
割と界隈の人みんな使ってる感。
僕はこればっかり使ってます。おすすめです。👍
SuperRes Diffusion
これは使ったことがないですが、DreamStudioの解説ページに書かれてたので一応貼っておきます。
ClipDrop
2倍〜4倍(プロのみ)のサイズアップが可能です。
UIがシンプル。
SwinIR
これが一番利用されてて、すごく綺麗になります。これもおすすめです👍
最後に
これから、まだ公開されてない、MicrosoftのNuwa Infinity、MetaのMake-A-Scene(スケッチインプットができる。)、GoogleのImagen、Partiあたりも公開されるでしょう。そして、これからも他のもどんどんいっぱい…
しかも今爆発的ヒットしてるmidjounreyはまだβ版です。DALL・Eも2です。どんな未来が待っているのか..
人間がクリエイティブ作業といいつつ、めちゃめちゃ時間をかけていた既存の創造物の真似事はもうしばらくしたらほんと無くなるんじゃないかと、とてもワクワクしています。これからはよりクリエイティブなことに集中できると思います。
まだしばらくキュレーションができないAIにはクリエイティブの仕事は終わらせることができません。クリエイターの、細かい調整とディレクションが必要です。そこにはpromptを巧みに使う人たちが大勢現れると思います。
脳から想像したイメージを直接抜き出せたり、画像からかなり正確にpromptを生成するものが出ない限り、promptエンジニアは必要ではないでしょうか。
そこで僕は本気で、スーパープロンプトエンジニアになろうとしています。@yamkaz と言います。