AIイラスト環境をつくろう(お試し編)
はじめに
そろそろAIイラストの話題が落ち着いてきた頃でしょうか。
初めは様々な意見が飛び交っていましたが、AIイラストも徐々に受け入れられ、身近な存在になってきたと個人的には感じます。
自分は趣味で個人制作ゲーを作っている身であり、イラストはゲーム制作と(ほぼ)切り離せない存在です。人にもよるでしょうが、自分はイラストに掛ける時間はなるべく減らしたいというスタンスです。
しかしAIイラスト生成といってもそんな簡単に環境は作れない…。
だけど手っ取り早くAIイラストの環境を作ってみたい! というのが本記事の趣旨です。
この記事は以下の特徴の人間が書いています。似たような方には参考になるかもしれません。
身も蓋もない言い方をすれば、「グラボ無いPCしか持ってないけどAIイラスト作りてえ!」という横着者の試みです。
サービスを選ぶ
AIを利用した画像生成サービスはググると色々ありますが、自由度が低かったりして(決まったポーズしか生成できない、など)、自分のやりたいことを実現するのは意外と難しかったりします。
なので、基本的にはグラフィックボードを搭載したPCを使って、自宅にAI生成環境を構築できるのがベターではあるのですが、そう簡単にホイホイと設備を導入できるものではありません。
ならば設備を買わずに環境をつくればよい。
というわけでGPUに特化したクラウドサービスを探しました。
ありました。
費用の話はさておいて、無料期間が設けられているのは非常に助かります。
大手サービスではAWSなどありますが、ちょっとお試しでやるには手続きが面倒そうだったので選択肢から外しました。
私は「AIイラスト生成ってどんなもんだろ?」とお試しがやりたいだけだったので、本サービスはとてもマッチしていました。
では早速環境づくりに入りましょう。
環境を作る
環境構築手順は公式の記事に載っています(丸投げ)。
丁寧に手順が書かれていますので、詰まるポイントは少ないと思います。
ただし、インストールはCLI(コマンド)であるため、普段CLIを使わない方には少々ハードルが高いかもしれません。
※ググるとけっこう詰まっていた方も多いそうですが、自分の場合はそうでもありませんでした。 たまたま情報が新しかったのかな?(2023/10/8時点)
GPU周りの環境を整えるのはけっこう難易度が高いのですが、予め整った状態で環境を提供してくれるのは非常にありがたいですね。
そんなわけでサービス登録や黙々とコマンドを打つことなど小一時間。
無事Stable Diffusion Web UIが立ち上がりました。
Web UI という名前の通り、ブラウザで立ち上がるアプリケーションです。
ここから思い通りの画像を生成するまでの道のりは長いのですが、これだけの短時間で環境を作れてしまうのは驚きですね。
【補足】
サービスの注意点にも書かれていますが、インスタンスの再起動や時間経過などでIPアドレスが変わってしまうことがあるそうです。
インスタンスを再起動した時は、必ずIPアドレスを確認してからログインしましょう。
画像を生成する
環境ができたので、さっそくAIイラストを生成してみましょう。
画像生成の手段としては概ね、
既存のモデルを使用する
自分で書いた絵を学習させる
以上の2パターンあります。
後者の場合はハードルが高いので、まずは既存のモデルを使って画像生成を試みます。今回はこの界隈ではかなりメジャーな「Anything v5」を使用しました。
生成する画像ですが、適当なキャラクターを作るのも味気ないので、自作ゲームのキャラクターを出力してみたいと思います。
↓自分で作ったゲーム
どうやって自分のキャラクターを作るのか、という話ですがStable Diffusionには既存のイラストを読み込んでテキスト(プロンプト)を出力する機能「Interrogate」があります。
試しに主人公の画像を読み込ませると、以下のようなテキストが出力されました(なんか長くね?)。
1girl, bangs, bare arms, bare shoulders, black footwear, blush, boots, closed mouth, collarbone, dress, full body, green eyes, hairband, long hair, looking at viewer, silver hair, simple background, sleeveless, solo, standing, very long hair, white background, white dress
このようにして、ある程度特徴を捉えつつ、キャラクターの画像を生成することが出来ます。
ざっくりした流れをまとめると、以下のようになります。
モデルを導入する
自分の描いたイラストを読み込ませテキストを生成
生成されたテキストからイラストを生成
という事で、各キャラクターの画像を生成してみました。
イリス
結構それっぽい感じで出力されましたね。
元々のデザインがシンプルなおかげもありますが、概ね元のイメージを引き継いだ形になってます。イリスのビジュアルはAIイラスト向きなんでしょうかね。
プロンプトに「white dress」が入ってるハズなのですが、なぜか7割くらいは黒ドレスで出力されました。銀髪には黒が似合うから?
グラム
なんか某てごわいシミュレーション出身のスマブラに出演してそうな少年みたいなビジュアルになりました。
AIイラストでダークな内面を表現をしようとするのは難易度が高そうです。こうして特徴だけ抜き出すと爽やかな好青年ですが、実際に彼の内面を知らない人から見るとこのように映ったのかもしれませんね。
エルフィ
何度か画像生成をトライしたのですが、高確率でセンシティブなお姉さんにしかなりませんでした。これでも露出が少ない方をチョイスしたつもり。
胸に手を当てているポーズは元イラストが反映されています。こういった特徴をしっかり読み取ってくれる所は流石だと思いました。
オスカー
案の定、原型を留めてません。どう見ても敵サイドの将軍キャラクターです。本当にありがとうございました。
元々のビジュアルがフルアーマーなので、そのように指定すると厳つい鎧マンしか出てこないんですよね。
改めて、キャラクターデザインの難しさを思い知りました。
ユエ
原作の毒気が消えてなんか普通の美少女になってしまいました。
ナイフとか持たせたらもう少し暗殺メイドらしくなったんでしょうか。
整った容姿は表現しやすいですが、意図的に崩したデザインをするのは難しいようです。ほぼ毎回絶対領域が反映されるのは面白い現象でした。
ハイン
やだ……師匠かっこいい……。
元々闇の魔導師をイメージしたデザインだったので、AIの力を借りると普通にイケメンになってしまいました。
元々杖は1本しか持ってなかったはずですが、なんか勝手に増えてたりするのは面白いですね。
リンドリント
けっこう難しいビジュアルだと思ってましたが、意外とそれっぽいイラストが生成されました。
プロンプトに食いしん坊要素は入ってないはずなのに、なぜか片手に謎のおやつを出現させたのは非常に興味深いです。いやマジでなにこれ
使用しているモデルの関係もあるかもしれませんが、全体的に女性キャラクターは胸が盛られる傾向にあるようです。
さいごに
とりあず今回はお試しという事で画像生成にチャレンジしてみましたが、だいたい半日くらいで環境の作成からイラストの生成まで出来てしまったので、自分でも結構驚いています。
とはいえこの記事の内容はほぼお遊びなので、実際にゲーム制作へ活かすには色々とノウハウが必要だと感じています。
自分の考えとしては、AIが生成した画像をそのままゲームに使用するのではなく、あくまで作業効率化のために利用したいと思っています。
まだ環境構築を行って1日目ですので、これからも色々と試していきたいですね。次は自分の描いたイラストをAIに学習させる所にチャレンジしたいと思います。
おしまい