見出し画像

画像生成AIの"Stable Diffusion"を試してみました

最近話題の画像生成AIの"Stable Diffusion"を試してみました。最初はGPU"RTX3070"搭載のubuntuマシンにインストールしようかとも思ったのですが、はまりそうな気がしたので、まずは手っ取り早く Google Colaboratory上にインストールしました( Gigazineの記事 が一番わかりやすかったです )。環境設定さえできれば1分もあれば、テキストの表現から、下記のような絵を1分ぐらいで生成します。

まずは空想の世界でガンダムをスーパーマン風にしてニューヨークの街中に立たせました
1.Mix of GUNDAM and Superman, 18meter hight, is walking at 5th Avenue in New York

次に、お花畑の中の猫の目の女の子をピカソ風に書いてもらいました
2.concept idea of a kawaii girl with cat eye, beautiful kimono-style costume, beautiful face, flower garden, painting style like Picasso

その次に、語順を変えて、ピカソ風を強調して書いてもらうようにしました
3.Picasso style, concept idea of a kawaii girl with cat eyes, china dress costume, flower garden

最期は、ピカソ風をダリ風にするとどうなるかを試しました
4.Dali style, concept idea of a kawaii girl with cat eyes, china dress costume, flower garden

ちなみに、上記の絵ですが、毎回この水準の絵ができるというより、最初にいい感じになる指示文のベースを5~10回くらいトライして見つけて、その後、同じパタンを繰り返すの中で、これならまぁまぁかなというのが5回に1回ぐらい出現するという感じです(ここでいう回数は指示した言葉に依存すると思います)。

この記事が気に入ったらサポートをしてみませんか?