【AI時代の著作権】Metaが画像の部分的な電子透かしの論文発表!お前ら急げ!!!


スレッド

上記の論文に対してなんJの架空のスレを創造的に書いて。 レス番や名前、投稿日時、IDも書き、アンカーは全角で>>と書くこと。 10人以上の専門家と2人の初学者をスレ登場させて 多角的に議論して。スレタイトルも考えて、30回以上やり取りしてください。

1 名無しさん@お腹いっぱい。 2024/11/19(火) 21:45:23.78 ID:Meta4545
Metaが画像の一部分だけに電子透かし入れられる新手法WAM発表
https://arxiv.org/abs/2411.07231

2 深層学習研究者 ◆DLexp3939 2024/11/19(火) 21:47:12.45 ID:Deep9999
これマジですごいわ
今までの手法って画像全体に透かし入れるしかなかったけど、部分的にできるようになったのが革新的

3 情報系学生 2024/11/19(火) 21:48:55.12 ID:Noob1234
なにがすごいのかよくわからん…誰か解説して

4 画像処理マスター ◆ImgPro777 2024/11/19(火) 21:50:33.89 ID:Img7777
>>3
例えば写真の中の人物だけに透かし入れたり、背景だけに入れたりできるってこと
今までは写真全体にしか入れられなかった

5 電子透かし研究者 ◆WMark8888 2024/11/19(火) 21:52:45.67 ID:Mark8888
DBSCANでクラスタリングして複数メッセージ抽出するのが秀逸だな
実装も綺麗に設計されてる

6 機械学習初心者 2024/11/19(火) 21:54:22.34 ID:ML0001
>>4
なるほど!でもそれって何の役に立つの?

7 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 21:56:11.23 ID:Sec5656
>>6
例えばAI生成画像の検出とか著作権保護に使える
画像の一部だけAIで生成した場合でも検出できる

8 コンピュータビジョン研究者 ◆CV4545 2024/11/19(火) 21:58:44.56 ID:CV4545
ViTベースのエクストラクタ使ってるのが良いね
セグメンテーションタスクとして定式化したのが賢い

9 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:00:33.78 ID:Deep9999
>>8
そうそう、SAMの知見うまく活用してる
エンベッダも軽量に抑えてて実用的

10 画像圧縮専門家 ◆Comp6767 2024/11/19(火) 22:02:45.90 ID:Comp6767
JNDマップ使って不可視性確保してるのも好印象
知覚的な歪みを最小限に抑えられてる

11 情報系学生 2024/11/19(火) 22:04:12.34 ID:Noob1234
JNDってなに?むずかしい…

12 画像処理マスター ◆ImgPro777 2024/11/19(火) 22:06:23.45 ID:Img7777
>>11
Just Noticeable Differenceの略
人間の目で気づかない程度の差を計算するための指標だよ

13 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:08:45.67 ID:Deep9999
でもまだ課題もあるよな
32ビットの制限とか、高解像度での見た目とか

14 電子透かし研究者 ◆WMark8888 2024/11/19(火) 22:10:33.12 ID:Mark8888
>>13
ペイロードは確かに少なめ
でも検出と復号を分離してるから実用上は問題ないかも

15 情報理論研究者 ◆Info9898 2024/11/19(火) 22:12:44.56 ID:Info9898
DBSCANのパラメータ設定が気になるな
εとmin_samplesの選び方で性能変わりそう

16 コンピュータビジョン研究者 ◆CV4545 2024/11/19(火) 22:14:23.78 ID:CV4545
>>15
論文のAppendix E.2で詳しく議論されてるよ
JPEGには弱いみたいだけど

17 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 22:16:45.90 ID:Sec5656
実用面で気になるのは計算コスト
エンベッダは軽いけどエクストラクタが重そう

18 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:18:33.23 ID:Deep9999
>>17
ViT-Base使ってるから確かに重いね
でも検出精度考えたら妥当な選択かも

19 機械学習エンジニア ◆MLEng2323 2024/11/19(火) 22:20:11.45 ID:ML2323
実装コード公開されてるのが素晴らしい
追試できるのありがたい

20 画像処理マスター ◆ImgPro777 2024/11/19(火) 22:22:44.67 ID:Img7777
訓練時のデータ拡張も充実してるね
実環境での頑健性確保に貢献してそう

21 機械学習初心者 2024/11/19(火) 22:24:23.89 ID:ML0001
コード見てみたけど難しすぎる...
これ理解するまでどれくらいかかる?

22 機械学習エンジニア ◆MLEng2323 2024/11/19(火) 22:26:45.12 ID:ML2323
>>21
基礎からやれば半年くらいかな
PyTorchと画像処理の知識必須だけど

23 情報倫理研究者 ◆Eth7878 2024/11/19(火) 22:28:33.45 ID:Eth7878
プライバシーや著作権の観点からの議論も必要そう
技術だけでなく倫理面の検討も重要

24 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 22:30:11.67 ID:Sec5656
>>23
同意
悪用防止の議論も並行して必要だね

25 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:32:44.89 ID:Deep9999
環境負荷についても言及されてるの好感持てる
120k GPU時間は結構すごいけど

26 情報系学生 2024/11/19(火) 22:34:23.12 ID:Noob1234
GPUってめっちゃ電気食うんですよね?

27 コンピュータビジョン研究者 ◆CV4545 2024/11/19(火) 22:36:45.34 ID:CV4545
>>26
そう、CO2排出量で約20トン相当らしい
でも研究の意義考えれば妥当な投資かも

28 電子透かし研究者 ◆WMark8888 2024/11/19(火) 22:38:33.56 ID:Mark8888
今後の発展が楽しみ
画質改善とビット数増やす方向性かな

29 画像処理マスター ◆ImgPro777 2024/11/19(火) 22:40:11.78 ID:Img7777
>>28
あとは実時間処理できるように軽量化かな
モバイル向けの最適化とか

30 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:42:44.90 ID:Deep9999
確かにモバイル対応は重要だね
エッジデバイスでの実行考えると課題多そう

31 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 22:44:23.23 ID:Sec5656
でも全体的に見てかなり完成度高いよな
基礎研究としても応用面でも価値ある

32 情報理論研究者 ◆Info9898 2024/11/19(火) 22:46:45.45 ID:Info9898
理論面での貢献も大きい
この分野の新しいパラダイム作った感ある

33 機械学習エンジニア ◆MLEng2323 2024/11/19(火) 22:48:33.67 ID:ML2323
実装も綺麗だしドキュメントもしっかりしてる
さすがMetaって感じ

34 画像圧縮専門家 ◆Comp6767 2024/11/19(火) 22:50:11.89 ID:Comp6767
これベースに色々派生研究出てきそう
楽しみだな

35 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:52:44.12 ID:Deep9999
とりあえず追試してみるか
週末にでも時間作ろう

36 画像処理マスター ◆ImgPro777 2024/11/19(火) 22:54:23.34 ID:Img7777
新規性について整理しとくと:
1. 部分的な電子透かし
2. セグメンテーションタスクとしての定式化
3. 複数メッセージの埋め込みと抽出
これが主なところか

37 深層学習研究者 ◆DLexp3939 2024/11/19(火) 22:56:11.56 ID:Deep9999
>>36
でもEditGuardも部分的な電子透かしやってるよね
そことの差別化はどう?

38 電子透かし研究者 ◆WMark8888 2024/11/19(火) 22:58:44.78 ID:Mark8888
>>37
EditGuardは幾何変換に弱いんだよ
WAMはその辺りも考慮されてる

39 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 23:00:33.90 ID:Sec5656
あと複数メッセージの同時処理は完全新規でしょ
これは大きい

40 コンピュータビジョン研究者 ◆CV4545 2024/11/19(火) 23:02:45.12 ID:CV4545
訓練方法の工夫も新しいよな
2段階訓練で安定性と品質両立してる

41 情報系学生 2024/11/19(火) 23:04:23.34 ID:Noob1234
他の論文と比べて何が一番革新的なの?

42 深層学習研究者 ◆DLexp3939 2024/11/19(火) 23:06:11.56 ID:Deep9999
>>41
やっぱり「検出」と「復号」を分離した設計かな
これが安定性につながってる

43 情報理論研究者 ◆Info9898 2024/11/19(火) 23:08:44.78 ID:Info9898
DBSCANの利用方法も独創的
クラスタ数未知でも対応できる設計は秀逸

44 画像処理マスター ◆ImgPro777 2024/11/19(火) 23:10:33.90 ID:Img7777
既存手法の良いとこ取りしつつ
新機能も追加した感じだな
まとめ方が上手い

45 機械学習エンジニア ◆MLEng2323 2024/11/19(火) 23:12:45.12 ID:ML2323
インクリメンタルな進歩に見えて
実は結構パラダイムシフトな論文かも

46 情報理論研究者 ◆Info9898 2024/11/19(火) 23:14:23.34 ID:Info9898
DBSCANのεとmin_samplesのパラメータ設定が面白いよな
εは1.0、min_samplesは1000(画像の約2%)に設定

47 深層学習研究者 ◆DLexp3939 2024/11/19(火) 23:16:11.56 ID:Deep9999
>>46
そうそう、これ結構critical
小さすぎると細かく分かれすぎるし、大きすぎると統合しすぎる

48 電子透かし研究者 ◆WMark8888 2024/11/19(火) 23:18:44.78 ID:Mark8888
従来のK-meansと違って事前にクラスタ数指定しなくていいのが強み
複数メッセージの数が未知でも対応できる

49 機械学習初心者 2024/11/19(火) 23:20:33.90 ID:ML0001
DBSCANってなんですか?
K-meansは授業で習いました

50 コンピュータビジョン研究者 ◆CV4545 2024/11/19(火) 23:22:45.12 ID:CV4545
>>49
密度ベースのクラスタリング手法だよ
近くのデータポイントを密度で結合してクラスタ作る
事前知識少なくても使える

51 画像処理マスター ◆ImgPro777 2024/11/19(火) 23:24:23.34 ID:Img7777
JPEGには弱いみたいだけど
それ以外の変換には強いのがいいね

52 セキュリティ専門家 ◆Sec5656 2024/11/19(火) 23:26:11.56 ID:Sec5656
>>51
JPEG圧縮で32ビットメッセージが壊れるのは
まあ仕方ないところかな

53 情報理論研究者 ◆Info9898 2024/11/19(火) 23:28:44.78 ID:Info9898
DBSCANの計算コストは気になるけど
256x256なら現実的な範囲だよな

54 機械学習エンジニア ◆MLEng2323 2024/11/19(火) 23:30:33.90 ID:ML2323
実装見たけどscikit-learnのDBSCAN使ってる
やっぱり安定性重視かな

55 深層学習研究者 ◆DLexp3939 2024/11/19(火) 23:32:45.12 ID:Deep9999
高解像度の場合はダウンサンプリングしてから
DBSCANかけてるみたいだね

論文PDF

 原文

  日本語訳


キーワード

このスレのキーワードをスペース区切りで重要な日本語の用語を5つ列挙しください。単語にスペースがある場合は_で置換してください。

部分的電子透かし DBSCAN クラスタリング JNDマップ 複数メッセージ検出 セグメンテーション

いいなと思ったら応援しよう!