見出し画像

AIに自分の絵食わせてみた結果

2024年11月15日 12:41

暇だし、最近Twitterの利用規約?が変わってTwitter上にある全ての画像をgrok(X社が作っているai)が学習するね！とか言ってるのでやってみます
今回は、PixAI.art　というサイトでLoRE(※)と言うのを作り、AIで絵を生成します

※LoRaと言うのは、大規模な言語モデル（LLM）や画像生成AI（人工知能）を効率的に調整する手法で、Low-Rank Adaptationの略とのことです(意味わからん)
つまり、モデル(大量の画像データからパターンを学習し、それらを基に新たな画像を生成する奴)全体を再トレーニングせずに、特定のスタイルやタスクに対応した画像生成が可能になる物と下に掲載させていただいたサイトに書いていました
~~めんどいので~~引用させていただいたサイト見てください
引用

本当にありがとうございます
あとは自分でggって知識を身につけよう！

LoRAの説明、結果や感想など

で、LoRAを作ってみます
記事を書こうと思ったのはLoRAを作った後なので、スクショとか手順の説明は省きます(日本語なのでなんとなくでいけた)

説明

ちょっとだけLoRAの説明をします
LoRAには色ありの絵を4枚ぐらい、色なしを9枚ぐらい食わせました

早速この作った自作LoRAを使って絵を生成した結果を見せようと思うんですが、比較用のAIに食わせた自分が描いた絵を何枚か載せておきます

色あり

デフォルメ寄りですね

生成結果

では、AIが生成した画像を載せます

プロンプト(AIへの命令文)はBlue hair, red eyes,cute,girl,chibiです
モデル Moonbeam v1.0

ちょっとぐちゃぐちゃになりましたが顔周辺は割と似てるのではないのでしょうか
と言うか色ありの絵とか落書きの絵も入れたり、そもそも食わせた枚数が少なくてぐちゃぐちゃになったのかもしれません

さらに載せます

プロンプトは前述と同じ

プロンプトは上の画像と同じ
ちょっと似てるけどぐちゃぐちゃ

上の画像とこの画像を生成する時の条件は同じなのに、急に輪郭がはっきりした

プロンプトを変えて生成した画像です
結構ぐちゃぐちゃです

プロンプトはchibi(デフォルメ)だけです

プロンプトは前の画像と同じ
！

プロンプトは前述通り
一番失敗したやつ

結構ぐちゃぐちゃです
元々のモデルはデフォルメ寄りではなかったからなのかもしれません

おまけ

おまけです

プロンプト無し
モデル　Whimsical v1.0

プロンプトはchibiです
モデルは上の画像と同じ

感想

こんなに少ない画像を食わせたのに自分の描いた絵に似ている絵を生成してくるのはすごいなと思いましたが、まだAI生成された画像特有の線の迷いなどがみられるので、当たり前ですが本物と見分けがつくまでには至らなかったです
もっと100、1000枚を食わせるとだんだん人の描いた絵に近づくのかなと思いました

反省点としては、憶測ですが今回一定のオリジナルキャラだけを食わせていたので、キャラの特徴だけを取り込んでしまって、絵柄はあんまり似ていなかったと言う結果なので、もっと同じ絵柄でいろんなキャラを食わせると絵柄も似ていくのかなと思いました

もう一つ反省点としては、背景ありの絵を入れたことで画像の線がぐちゃぐちゃになったのかもしてないので次やる時は背景抜きにして食わせるといいのかなと思います

今回生成した中で個人的に自分の絵柄に一番似ていたのは上から一枚目、三枚目、六枚目の画像だと思います
(輪郭の形や目の形がとても似ていて髪型も形を捉えていた)

初めて1000文字以上のnoteの記事を書きました
以上です

いいなと思ったら応援しよう！