生成系AIを実践で使った結果や感想
技術の面についてはX(Twitter)などで、大いに議論されていますが、実際に使用している例はあまり見ません。
そこで実際に使ってみての結果や感想を書かせていただきたくおもいます。
企画書
とあるきっかけでアニメを作りたいとおもい、企画書を作成しました。
その企画書での画像に生成系AIを使用しました。
使った生成AI系ツールはミッドジャーニーです。
感想
やはり絵が描けない人でもプロンプトで出したいイメージをそのまんま出してくれるので便利です。
またあまりイメージが固まってなくても、なにかしらの形で固まっていないイメージをミッドジャーニー側が埋めてくれる感じで、新たな発見がある場合もあります。
しかも出てくる画像はプロが描いているようにクオリティが高く、比較的ゴージャスな企画書が出来るように感じます。
漫画
生成系AIを使用し、漫画を作成し、SNSで投稿しました。
使用ツールは主にDALL-E3で、Lora(同じキャラクターを作れる機能)や背景を使用するためにStable Diffusionを使用しました。
他にもBing image creatorも使用しています。
シナリオ作成のためにもAIを使用しています。
主にBingチャットがシナリオ作成に役立ちました。
感想および製作工程
最初はDALL-E3のみを使用し作成していましたが、やはり同じキャラクターを出しにくく難しかったです。
たしかにDALL-E3は同じプロンプトを入れると、同じ結果が出てきやすいです。
たとえば「medium wave hair」とプロンプトを入れると、同じような髪型の人が出てきやすいです。
ただ瞳の色や服の色などほかにもそのキャラクターを特定する要素は多く存在し、同じキャラクターを正確に出したいなら細かくプロンプトで指定する必要があります。
しかし、細かくプロンプトを書いても、たとえば「赤色」を書いたところで、赤色にも薄い赤色や濃い赤色などいろんな赤色があります。
なので結局はガチャガチャ要素が多かったです。
そこで同じキャラを出すために、Stable DiffusionでLoraを使用しました。
結果としてはLoraにより同じキャラクターを量産でき良かったです。
ただ違うキャラクターを生み出すにはそこそこ時間がかかるのと
たとえばプロンプトに「angry」と入れても、怒った表情に変わらなかったりと、あまり表情が変わらないことも多かったです。
最終的に行き着いた作り方は、主人公だけはLoraで作成し、その他のキャラクターはDALL-E3で出てきたイメージに合った1枚だけを使用する形となりました。
またいずれのキャラクター画像も白い背景にして出力します。
あとから白い背景をRemove BGというツールで透過し、Stable DiffusionやBing image creatorで作った背景を入れる形です。
音楽
使用ツールは英語の歌はSongR、日本語のSunoを使用しました。
歌詞もAIで作成し、Bingチャットで作成しました。
ただ完全にAIというわけではなく「こっちの方がおもしろそう」とおもったことはアドリブで積極的に入れました。
映像については、カフェで撮影したものを使用したり、Envato Elementsの素材を使用しました。
感想
割とすんなりできて生産性も高かったです。
Sunoがいまバズってますが、たしかにバズるだけあるクオリティの音楽を簡単に生成できてすごいとおもいます。
クオリティが高く多様な音楽が生成できるので、そのうち『Sunoで作った名もなきミュージシャンの曲』がバズるのではとおもいます。
生成系AIで投稿してみた結果
ここまで説明しておいてあれですが、
現在AIで作った漫画と音楽の投稿はやめています。
理由としては
①作るのに時間がかかる
②人気が安定しない
③ユーザーの悩みを解決するものではない
といったことが挙げられます。
①作るのに時間がかかる
これはまんまです。
ただ音楽は比較的簡単に作れます。
②人気が安定しない
任天堂という世界的に有名な会社がありますが『運を天に任せる会社』だから任天堂という名前らしいです。
エンタメは運であり、なにが当たるのかほんとに分からないみたいです。
自分も結局人気の傾向を分析しきれなかったです。
③ユーザーの悩みを解決するものではない
副業で占いをしており、そちらの占いに来ていただくためにSNSに投稿しているという意図があります。
生成系AIで作った投稿は、そこまでユーザーが「占いに行こう」という気になる投稿ではないと判断し、やめたのが1つあります。
ただ多くの再生数がとれれば問題なかったのですが、そこまでの再生数でもなかったです。
現在使用しているAIツール
今はインスタのストーリーズでお悩みを募集し、回答する際は動画で回答する投稿をしています。
投稿の素材にCreative Reality Studioという口パクでアバターを動かせるAIツールを使用しています。
ただベンチマークとしているアカウントが、同じように動画の投稿で回答をしているのを真似してやってみたのですが、ベンチマークのアカウントが投稿している動画ほどは再生数がとれていないです。
理由としてはベンチマークの投稿は、実物の顔が回答しているのに対して、こちらはアバターが回答しているからだとおもいます。
SNSのアルゴリズムとしては、やはり実物の顔の方が信用があるのかなとおもいます。
また投稿内容を考える際は、Bingチャットはずっと変わらず使っています。
ときどき欲しい回答が出てこないことがあるので、その時はグーグル検索で調べる感じです。
グーグルで検索するよりも、早く正解に行き着く可能性があるため使用している感じです。