AIイラストを使用したLINEスタンプの作り方 BIGスタンプ編
LINE 通常スタンプとBIGスタンプの違い
こんにちは、AI猫です。
前回は、通常スタンプの作り方を紹介しましたが、今回はBIGスタンプの作り方を紹介してみようと思います。
画像生成時などいくつか注意点は異なるものの、作業の流れとしては共通部分も多いため、この記事をお読みいただいて不明な部分は下記の前回記事をご覧いただければと思います。
0.ビッグスタンプの特徴
まず通常スタンプとBIGスタンプの仕様上の大きな違いとしては、
・最大サイズ: 通常スタンプ370*320に対して、BIGスタンプは396*660
・最低価格 : 通常スタンプ120円に対して、BIGスタンプは250円
の2点です。実は、それほど変わりません。
そして使用上の違いとしては
・インパクト大
・スタンプ画面でのサムネサイズは通常より少し大きい程度なので、文字を小さくすると読めない
・同様の理由でワンクリでスタンプ押してしまうWindows版LINEでは文字が小さいと読めないまま押すことになる
・スタンプを押したあとは結構細かく見えるし文字もよく見える。
・画面占有しすぎて鬱陶しい
使用上の違いのうち、文字の小ささは見てみないとわかりにくいと思うので、実例をもって説明します。
上記は二つとも自作スタンプですが、iPhoneの画面で下記のようになります。
左から、
販売画面/販売画面サムネイルタップ/トーク画面/トーク画面サムネイルタップ
見てのとおり、意味深子ちゃんの方はサムネイルでもどんなスタンプか判断できる一方、笑顔子ちゃんの方はスタンプや拡大画面は問題ないのですが、サムネイルの文字が全く読めません。タップすれば拡大画像を確認できますが、やはり非常に不便です。
また、iPhoneであればまだスタンプ送信前に一度タップする必要があり、その際拡大画像が表示されるのでましなのですが、Windows版LINEでは、クリックした瞬間スタンプが送信されるので、文字が読めないことが致命的になります。
個人的にはこのゲーム画面風のスタンプはかなり気に入っており、スタンプを使用した画面では好みなので使いたいところですが、残念ながら、最低でもこの意味深子ちゃんくらいの文字サイズはあったほうが使いやすいスタンプになりそうです。
そして最後に、AIイラスト生成での制作上の違いとしては
・背景透過の重要性が低い
・高解像度で出力したほうが良い
・396*660をフルで使おうとすると縦長すぎる。
などになります。これは生成の説明をしながら書いていきます。
1.ネタ出し
今回もネタ出しを先にしていきます。というか、すでにしてました。
眼鏡白衣、つまり鬼畜モンのスタンプです。
青ジャージに黄タオルと同じくらい鬼畜モンに違いありません。
以前は考えた際は、画像のほうがうまく出力できずネタを放置していたのですが、最近うまいこと出力できたので、作成にかかります。
2.画像生成
ここで制作上の違いの話に戻るのですが、ビッグスタンプをいくつか見てみると、「スタンプ内のキャラクターなどは画像の半分未満で、線が太く、文字も大きく、凝っている」というものが多く見受けられます。実際自分で購入して使っているものも、そういったものが多いです。
ただ、絵と連携した文字回りは、AIイラストの苦手な分野です。イラストの細かい配置はできませんし、線の太さを文字と統一感を出すのは、下書きや加筆を伴わない限りほぼ不可能でしょう。
では、どうするか。上のようなタイプのスタンプは諦めます。
そのうえで思いつくスタンプの一つは、通常スタンプと同程度の生成サイズとし、画面下半分に配置、上半分を文字スペースとして使用するタイプ。これは似たタイプも多くあり、文字をかなり大きくできるので、ビッグスタンプとして出す意味はあると思います。
ただ、作り方自体は通常スタンプとほとんど変わりません。ちょっとキャンパスサイズを変える手間が増えるだけで、生成サイズも背景除去も手順がほぼ一緒です、どうせやるなら文字部を凝りたいですが、その程度の違いになってしまいます。(こういうタイプもそのうちやるとは思いますが)
ということで、AI猫は、AI生成の強みを生かしつつ、かつBIGスタンプならではのコンセプトとして、「背景を削除しないBIGスタンプ」を主に作っています。
通常LINEスタンプは文字やピンポイントの画像のみでアピールすることが多く、画面がうるさくなるせいか、背景があるものはあまり多くありません。透過が基本です。また、通常であれば作画コストもその分かかりますので、使うときに邪魔になるものであればわざわざ背景を描くメリットはあまりありません。
ただBIGスタンプは、使用上の違いにも書きましたが、「画面占有しすぎて鬱陶しい」という特性があります。連打されたら殺意がわくくらいには鬱陶しいです。これは逆に言えば、背景があろうがなかろうがトーク画面がうるさくなるため、背景をつけるデメリットが少ないとも言えるわけです。
そして、AI生成画像は背景を描写する手間があまりありません。生成数、画像選定の手間は増えますが、背景除去工程がない分の手間は削減できます。
と書いてみると大したメリットはないのですが、デメリットもあまりないため、今回はスタンプ最大サイズをイラストで埋め尽くすことにします。
そのため、生成サイズは600*1000としました。
これは、最終サイズの396*660をフルで使用するサイズです。
最終サイズの396*660以上で、8の倍数、3:5であればいいので、例えば480*800でも540*900でもいいのですが、ここはモデルとの兼ね合いで、これくらいが破綻しなくて画質良いだろうということでこのサイズにしております。
そして、今回は自マージモデルや自作LoRAを使用しているため、ほかの方の手元での再現はできませんが、およそこんな感じのプロンプトです。
プロンプト:
1boy,ikemen,(upper body:1.2), (face focus:1.1), girlish boy,black hair,(white coat:1.2),(labcoat),(black shirt:1.1),(35yo:1.3),black eyes,(empty eyes:1.2),(low ponytail:1.3),(glasses:1.2),(1girl:-1.5),(breasts:-1.3),(sunglasses:-1.1),(full body:-1.3),faint smile,indoors,{open mouth|closed mouth},{from front|from below},
ネガティブ:
EasyNegative,text bad-hands-5,anime screencap, navel,blush,twintails, (animal ears:1.2), pointy ears, elf ears,dog ears, horse ears,cat ears,rabbit ears, cat ears,wing,nude,navel,open clothes,monochrome
簡単に言うと、白衣黒シャツで女顔ローポニテ眼鏡おっさん(35)を指定したわけです。ネガティブは結構前に別のキャラクターを使った時のものであり、ほとんど意味がないのも多く入っています。
ところで、ponytailはかなり女性出現率が高くなるプロンプトです。girlish boyも同様です。そこで女性出現率を抑えるため、NegPiPという拡張を入れて(1girl:-1.5)という強力なマイナスを使用することで、女性を出ないようにしています。超便利。NegPiPを入れずにこのプロンプトを使うと崩壊します。
また、今回はキャラクター的にほとんど表情をばらつかせる必要がないので、ワイルドカードは口の開け閉めと正面からか下からかのみを指定します。プロンプトの最後のとこですね。
そして上のプロンプトを回して、とりあえず3500枚くらい出力しました。
(…と言っても実際は一気に3500枚出力するわけではなく、10枚出してプロンプト調整して、100枚出してプロンプト調整して…の繰り返しになります。安定してきたらずっとそれで回します。)
前回のアライグマ300枚の10倍以上と結構な量にも思えますが、実はキャラクタースタンプをランダムで作成する時は2000~4000枚くらい出力することのほうが多いです。
というのも、シンプルかつrefarence onlyを使用したアライグマと違い特徴が複数あるため、女性が出たり、二人出たり、ポニテが破綻してたり、眼鏡かけてなかったり、若く見えたり年食って見えたり、白衣がおかしかったりと、条件に合わない画像が非常に多く出ます。
その多くの条件に合致するか、3500枚を目視で確認するのは非常に骨が折れることであり、人間の目では見落としがどうしても出てしまうため、明らかに違うものをはじくツールを使います。ChatGPTくんに相談したら簡単に作ってくれました。
使い方は中に書いていますが、要はTaggerでつけたテキストファイルを参照し、欲しい要素やいらない要素がついたものをより分ける補助ツールです。python入れてりゃ動きます多分。
SDのTaggerを使用し3500枚全てにタグテキストをつけたのち、このツールで例えば"1girl"を指定し実行すると、カレントフォルダの該当する画像および対応するテキストファイルがすべて下位の1girlフォルダにぶちこまれるって寸法です。
もちろんtaggerでつけられる単語しか分類に使えないことや、信頼性がtaggerのインタロゲーターと閾値頼りなので必要な画像を結構捨ててしまうなどの問題もありますが、大雑把により分けて確認の手間を減らすことのほうが大事です。
まあ3500枚もあるんだしちょっとくらい減ってもヘーキヘーキ。
ということで、1girlとmultiple viewsと2boysを除去し、残ったものの中からlow ponytailとblack-framed eyewearがついているものを選ぶと、残りは700枚になりました。
見た目の雰囲気や絵の破綻などは自分で見て選ぶしかないですが、700枚ならなんとかイケます。前回と同じく、lama cleanerで修正可能な程度のものは修正し、64枚の画像が残りました。
そこで改めてネタのほうを見てみると、そういえば「メガネクイッ」に該当する画像がないことに気づきます。
こういう時は個別生成します。おそらく眼鏡クイッは結構難しいと思いますので、500枚程度回します。
やはり望み通りのものは出ませんでしたが、一応3枚ほど使えそうな画像はとれました。
最後の1枚は予想外の拾い物です。有難し。
3.スタンプ作成・申請
そしてここから、文字を入れる作業にかかります。
できました。
これ以降は、通常スタンプと全く変わりませんので、さくっと申請してしまいます。
4.リジェクト・再申請
今回は2つくらいました。
5.2は初めてです。ある程度汎用的と思いましたが、いわれてみればダメかー…
3.15はいつもながらライン不明ですが、まあ変えればヨシ。
再申請していきます。
ついでにいくつかの画像でミスが見つかったため差し替えていきます。
5.発売
そしてあっさり翌日に通りました。
いかがでしたか?
おさらいとなりますが、BIGスタンプはAIイラストならではの特徴を生かしてみました。
今回は作業フローを示すためまとめて画像を生成しましたが、テーマによっては、下記のように一枚一枚画像を生成するのも良いと思います。
それでは皆様、良きスタンプライフを!
次の記事はあれですね、アニメーションスタンプかメッセージスタンプですかね。