大神ミオのサムネAI疑惑における「ぼくのかんがえたさいきょうのAIはんべつほうほう」と検証について。
はじめに
大神ミオのサムネ画像のAI疑惑による差し替えについて、騒動から大分時間が経っていますが、検証方法と結果について残しておこうと思います。
疑惑画像についての検証結果ですが、
AI生成物そのものでは無い。
人の手による痕跡がある。
AI生成物を参考またはトレスしている可能性は否定出来ない。
になります。
検証はいわゆる「この部分が設定資料と違う」とか「指が6本だ」の様な解釈が分かれたりミスする可能性のある部分ではなく画像の構造的についてです。
なお、私は生成AIユーザーでもなく、技術的に深掘りしている人でもないので色々拙い説明となっていることはご了承ください。
ぼくのかんがえたさいきょうのAIはんべつほうほう
まず基本的な生成AI画像の見分け方です。
初歩的な方法のため、某黒なんとかさん(旧名:瑞なんとかさん)の様にAI生成物を念入りに偽装する作成物には通用しません、真っ先に対策されてます。
脱線しますが、黒なんとかさんを知っている人は彼とHiveの戦いの記録が彼のnoteにありますので読んでみることをオススメします。
さて、検証の説明に入りますが、この方法を実行するのに純然たる生成AI画像が必要です。
Pixivを物色していたところ……
ん~、画像についてのコメントは控えさせていただきます。
ご丁寧にプロンプト付きです。
念のため、この画像は被疑画像ではなくパロディ(AI生成物である事を公表している)ですのでお間違えの無いようにお願いします。
検証方法説明のために画像を加工する必要があるため事前に作者の石刻テトさん(@teto_ai_)に許可を頂いています、どうもありがとうございます。
また、加工についてですが今回は誰でも試せる様にOS付属のツールで実行します。
私はWindowsユーザー(Windows11)ですので付属のペイントを使用しますが、概念が分かれば他のペイントツールでも同様です。
作業手順
1.まず画像をクリックして原寸大の状態で保存します。
2.ファイルをペイントで開きます。

3.カラーパレット左の二段になったパレットよりやや大きい○の下の方をクリックして色を変更します(これはキャンバスのカラーです)、今回は画像の背景部分(白)をターゲットにしますので目立つ黒にします。

4.次にツールからスポイトツールを選択し、画像背景の白色部分をクリックして色を抽出します。

5.ツールから消しゴムツールを選択し、作業がしやすいように消しゴムを最大化します。

6.最後に画像を作業しやすいように全体が入るように表示を調整し、右クリックしながら(色消しゴム)画像全体をまんべんなく拭っていきます。
注意ですが、かならず右クリック(色消しゴム)で拭ってください。
左クリックだと単なる消しゴムの為、綺麗に消えます。

絵を書き慣れている人だと「色消しゴムで背景色を抜いたらキャンバスの色が抜け出てくるだけだろ」と思うかも知れません。
私が実行した結果が以下になります。
(スポイトした場所によって結果が変わります)

本来背景色が抜け出てくるはずが輪郭だけ抜けたり、さらに意図が分からない怪しげな模様が浮かび上がってます。
この模様、AI模様とかAI紋とか呼んでも良いかもしれません。
解説
謎の模様は画像生成AIの作画方法に起因します。
よく界隈で「人はゼロ(無)から絵を描いているが生成AIはちがう」と言うのを目にしますが、ある意味正しいです。
人が絵を描く場合、白地の上に絵を描いていきますが、生成AIは白地ではなくノイズ、たとえるならテレビの砂嵐の様な物から絵を生成していきます。
元が砂嵐なのでこの絵もAIに対して「simple background」や「white background」という指示(プロンプト)を与えて背景を白塗りさせています。
生成AIの動作は中々難しいので、あえて実際の挙動とは違う表現をしますが、AIが指示に従って砂嵐を塗りつぶす際、塗りが薄くて下地の砂嵐が透けて見えてしまう箇所が出ます。
砂嵐が透けている箇所は色が違うのでスポイトした色で色消しゴムをかけると同じ色の部分しか消えません、それにより不定型な模様という形で現れます。
このように人が描く場合ほぼ単色で塗りつぶすであろう部分に砂嵐(ノイズ)の痕跡があるか?を探すのがAI生成物を見分ける簡単かつ基本的な方法です。
ちなみに上下のエフェクト部分にも大きな単色塗りつぶし箇所がありますが、そこにも砂嵐の痕跡がありますので興味がある方は試してみてください。
なおローカルで画像を保存して試す分には良いですが、保存した画像や検証後の画像を再度ネットにアップしないで下さい、許可を得ない画像送信は著作権侵害です。
(保存は違法アップロードされた著作物でない限り合法です)
気をつける必要がある点ですが、グラデーションや陰影のような意味のある色差や単なる塗り忘れや塗り方による漏れ、塗っている途中でペンの色を変えた、の様な人の作業によると推測できる痕跡と間違えないように注意してください、単純な構造の絵ばかりではありません。
また、ペイントソフト等で色の境界を抜き出す機能があればそちらの方が良いでしょう。
この画像は可逆圧縮のpngですが、非可逆圧縮のjpeg化した場合どうなるかかと言う疑問があると思います、そもそも被疑者の画像もjpegです。
どうも普通のjpeg化+縮小では除去しきれないようです。
石刻テトさんのXにあるjpegでも実施したものが以下です。
やや形が違いますが模様が出ます。

そうそう、jpegの圧縮ノイズとの見間違えにも気をつけてください。
その他
画像の使用許可の為に石刻テトさんへDMを送った際に以下の様な話を伺いました。
※注:文中()内は私の見解です。
1.クリップスタジオの様なソフトにあるノイズ除去機能ではAI生成由来のノイズ取り切れない。
(おそらく想定している機能がスキャナ取り込み時のゴミやJpegノイズ、消し忘れた下書き等の除去であり、AI生成由来のノイズは濃淡に見えるため処理されにくいと思われます)
2.一度生成した画像をノイズ除去機能ありのアップスケーラーを追加した生成AIにi2iでノイズ除去&高解像度化させる→出来上がった画像を再度生成AIに解像度を下げさせるとノイズはほぼ消える。
(色の境界を可視化した画像も見せていただきました、確かに背景白色部分にノイズはありませんでしたが、エフェクト部分にノイズと思われる部分が残っていました)
とくに2の様に複雑な手順を踏めば生成AIでもかなりノイズ除去が出来る様ですが、それでも一部に残るため根気よく探す必要があります。
問題の画像の検証
いよいよ問題の画像の検証です。
ただ、こちらの画像、作者の紅ちゃんさんのXが削除されており許可を取る手段がないため、画像を加工した物を記事に貼って解説が出来ません。
なので全て文章による解説となります。
画像の構成
以下に画像の構成を書きます。
検証に必要な情報は
ファイルフォーマットはJpeg、圧縮ノイズは見受けられない。
画像のピクセル(ドット)数はヨコ3584×タテ5376。
24bitカラー(RGB各0~255)
背景は白(RGBオール255)
主線は黒(RGBオール0)で単色、アンチエイリアス無し、ペンのサイズはおそらく2×2~3×3ドットの正方形。
塗り分けは単色、陰影もグラデーションではなく単色塗り分けで表現、塗りにはアンチエイリアスあり。
塗りがアンチエイリアス有りのためか、塗りで主線が喰われている箇所が確認出来る。
塗りによる主線の侵食単位が1ドットなので恐らく原寸。
取りあえずこんな所です。
単色塗りの為、AI紋の捜索が捗りそうです。
検証結果
早速AI紋(ノイズ痕)がないか検証します、画像引用出来ないので結果を書きますが、本来の色消しゴムに期待する効果どおり、綺麗に抜けます。
エフェクトもアンチエイリアスのある外周を除いてほぼ真っ黒になります。
エフェクトの部分もについてほぼと書いた理由ですが、上中央の#A7464Dで塗られていたエリアや左下の#FCDC49で塗られていたエリアに若干何かが残ります。
この部分の検証ですが、座標をメモして加工前の画像と見比べます。
#A7464Dで塗られているエリアの座標x2096,y212付近やx2096,y212付近、x2196,y208付近はいずれも塗りの外周部アンチエイリアスと同じ系統色で人の手による塗りむらの潰し忘れと思われます。他にもx2810,y348付近やx3128,633付近にも同様の痕跡です。
#FCDC49で塗られているエリアのx249,y4234の両脇を走る線も外周部アンチエイリアスと同系統のため、人の手による塗りむらの潰し忘れと思われます、x365,y4340付近も同様です。
AI紋の捜索が目的でしたがAI起因のノイズは見つからず、逆に人の手による痕跡がみつかったので私の検証はここまでです。
仮に生成AIが絡んでいたならばAI生成物をトレスや加工したか、AI生成物を参考に描いたかのどちらかですが、トレス元や参考物の具体的な証拠がない限り確証がありません。
あと、私自身は該当イラストの作成工程が証明出来ない無い限り、後から別のイラストを描いた場合、絵を描けることの証明にはなりますが、該当イラストが手描きである証明にはならないと思っています。
かといってトレスや参考元が判明しないのにAIがらみと決めつけるのも反対です。
画像生成方法についての考察
以下は細かい検証前に自分が考えていた「仮にどうすればあの絵を生成出来そうか」という観点や配信についての考察になります。
主線にアンチエイリアスが無い画像の生成について
まずアンチエイリアスについてですが、下記を参照してください。
要は線をなめらかに見える様に線のドット周りに中間色を配置する手法ですが、PixivでAI生成タグあり&3000×3000以上のサイズに絞って検索した画像をサンプルを抜き出してチェックしましたが、全部アンチエイリアスありです。
AI判別方法でお借りした石刻テトさんのAI生成作品もアンチエイリアスありです。
被疑イラストはアンチエイリアス無しの黒線で描かれているため、こうした絵を直接出力出来るのかは色々検索しましたが分かりませんでした、知っている方誰か教えて下さい。
今回の場合は線画の後から塗っているので某なんとかさんのようにベクター変換かけてアンチエイリアス無しでペイントソフトに取り込むとか、画像を二値化(白黒化)すれば良いわけです。
二値化については記事がありました。
そもそもトレスだったらアンチエイリアス無しの線でなぞればOKです。
画像サイズは生成AIではない根拠となり得るか
あのサイズをローカル環境の生成AIで生成しようとすると高性能グラボをつんでいてもエラーになるというのを見ましたが、拡張機能としてアップスケーラーを追加してi2iを通せばできそうです。
noteで解説記事がありました。
なるほど、i2iのイメージ元を複数枚に分割して拡大生成して再度つなぎあわせているようですが、なんかキモい事になっているのもあります。
とりあえず可能だという事で頭に入れておきます。
トレスの場合、いくらでも拡大出来るので問題ありません。
被疑者の作業配信について
私が気にしていた部分はペン入れ時のアンチエイリアスの設定です。
配信でもペン入れ時アンチエイリアスのチェックボックスがオフになっていたので配信時の環境と被疑画像に齟齬はない認識です。
あと被疑者が配信で使用していたツールをクリップスタジオと言っている人も見ましたが画面構成を確認するにMediBang Paintです。
最後に
AI生成物の見分け方についての解説と被疑画像の検証については以上です。
最後に、公式資料を見ながらとか、資料内場合はデザイナーや非公式Wiki等をチェックしないとファンアート描けないのは窮屈だなと思う反面、AIトレスだった場合、非公開の画像だとトレス元を確認するのは難しいので悪意ある人が紛れ込むと厄介だなと感じます。
ちなみに私はサムネからファンアートを拾うのは問題ないと思っており、タレント本人がAI生成物をファンアートに投稿しないで欲しいと言えばお願いは聞くべきだと思ってます。
また、AI生成物を禁止しているファンアートタグに対してAI生成物の痕跡を消した加工物を投稿するのは反対です。
相手の希望を無視してはどれだけ愛情を注いでも厄介勢と大差ありません。
〆の文が思いつきませんが、書き始めてから一週間以上文章を弄っているのでこの辺で終わりたいと思います。
この拙い文章を最後まで読んでいただきありがとうございました。