見出し画像

画像生成AIプロテクター「Glaze」の加工を無効化したらめっちゃ怒られた件

経緯

こういう記事を書いたところ、沢山のイラスト屋さんから怒られました。
それはもう日本語だけでなく英語でも韓国語でも。

バチクソ怒られてるのは以下のTweetから見ることができます。

数式は何なのか

$$
f(i,j)=\frac{∑2n=−2∑2m=−2exp(−α(n2+m2))exp(−β(f(i,j)−f(i+n,j+m))2)f(i+n,j+m)}{∑2n=−2∑2m=−2exp(−α(n2+m2))exp(−β(f(i,j)−f(i+n,j+m))2)}
$$

いわゆるノイズ除去フィルタですね。
バイラテラルフィルタという、輪郭線とか必要な線は残して平坦な部分のノイズを除去する手法です。

コレ自体はよくある手法なので、知ってる人からしたら数式を見ただけでハイハイって感じになる代物

Twitterで適当な数式だとか言われましたが、ちゃんと意味がある数式ですよー

数式にしたのは、あくまでも検証が目的であってプログラムを公開して広く利用させる意図がないからです。

本当にこれでGlazeの加工は無効化できるの?

Glaze加工した画像で学習したモデルと、Glaze外しをした画像で学習したモデルで検証しないとわかりません。
そこの検証はめんどくさいのでしてません。

ただ原理的には可能です。
Glazeの論文では摂動というノイズを画像に適用することで学習を阻害するというものですが、その摂動を除外する最も古典的かつ効果的な手法の一つがノイズ除去フィルタです。

摂動がなんぞやというと、人間が知覚できないような微小なノイズです。
例えば画像の輝度が最も理解しやすいと思います。

人間の目からしたら輝度が若干変わったからといって知覚することは困難です(よっぽどセンシティブな人ならわかるかも)。

で、この手法って敵対的サンプルという、AIを攻撃するための手法なんですね。

以下がそのイメージです。
(数式は無視していい)

Glazeの論文でも同じようなものを見ましたよね
Glazeのは上図の劣化版です。

そもそも人間に知覚可能なノイズをのっけている時点でダメですし、実験環境も非常に限定されたものですので、そりゃあそうなるかもだけど再現性なくないっスか?っていう内容。

Glazeの効果は?

はっきりいって無いと思います。
現行のAIが画像を処理する際には、私が行ったノイズ除去フィルタのようなものを何百種類も組み合わせて使われます。

私が5分程度で書いたプログラムで除去できる程度のノイズがAIの処理に勝てると思いますか?

そもそも、Glazeは初期モデルからの学習素材に対して有効な手法と説明されていますが、Stable Diffusionなど世の中に広く存在する生成系AIのモデルは既に何億枚もの画像を学習した後です。

そこにGlaze処理した画像を追加学習させたところで、AIが勝手にノイズを取っ払ってもとの画像に戻して学習してしまうだけです。

ここらへんG検定程度のAI知識があれば無駄だろうなってことは直感的にわかると思います。

なぜ今回のようなことをしたのか

「キャベツ畑」や「コウノトリ」を信じている可愛い女の子に無修正のポルノをつきつける時を想像するような下卑た快感を得るため……とか書こうと思いましたが、ちょっと違う。

病気にならない水を売ってる詐欺師に対して「いやそれただの水じゃん」って言いたくなったからというのが最も近い感情ですかね。

別にGlazeの開発者が詐欺師だとか言ってるわけじゃないですよ。感情を言語化して最も近い表現がこれだっただけです。

Glazeが「俺達がネットで集めてきた画像を学習させたAIでお前たちのイラストに学習させた画像の特徴をノイズとしてぶっかけたらAIの学習を阻害できるぜ!」

と主張しているのに対して「いやいや、その手法だとこうしたら無意味だし、そもそも現行のAIに通じるわけ無いやん」と反論したのが前回の記事です。

あくまでも技術に対して技術の反論をしただけなので、イラスト屋さんたちをいじめるような意図はなかったのですが、どうもそう捉えられたようで、、、

ひどいっスよ。死ねとかゴミとか腐敗しろとか犯罪者とか暴言を平気で言えるのは人としてどうかと思います。。。(泣)
ちなみにリプライや引リツで飛んできた暴言は全部スクショ取ってるので、私の気分次第で開示請求できるようにはしてます(謝罪があれば削除しますよー)
特に私のことを犯罪者と触れ回った方々に関しては名誉毀損ダヨネー

荒ぶるイラスト屋さんに言いたいこと

Glazeを使うことに意味がある。AI学習禁止を表明することに意味があるとされていますが、悪いことは言いませんAIとの共存ルートを模索したほうがいいです。

べつに表明するのは自由ですが、技術的に無意味です。無意味だけど信じてしまうとそれを悪用する人の餌になります。

悪用する人の立場になって考えてみると、例えばAIに学習されない処理を施すアプリとか作って、会員登録で個人情報丸っといただくとか、会員登録までしなくともアプリにイラストを入れた瞬間に、そのイラストの権利をアプリ運営に無償で譲渡させたり。。。

ちょっと考えただけで5つくらいイラスト屋さんを騙して搾取する方法を思いついたので、マジでやばいと思ったほうがいいです。

それを按じて以下のようなTweetをしたのですが、返ってきたのは暴言だけでした(悲しみの鎌足)

まあ自分の利権を脅かされる恐怖は理解できます。だからって何でもかんでも敵視しないで冷静に頭を使って考える時間を確保するのも人生において必要だと思います。

という形で本件は締めようと思います。

追記

あらら言わんこっちゃない……。
私の事を叩いていたイラストレーターさんも二次創作イラストを投稿してる人が多数でしたが、自分達で自らの首を絞めている事に早く気づいた方がいいっスよ

この記事が気に入ったらサポートをしてみませんか?