LLMのTraceabilityについて素人が考えてみた
はじめに
メディア研究開発センターの村瀬です。よろしくお願いします。
今回のブログはLLMやDeep Learningについて初学者の私がLLMのTraceabilityについて考えてみたという内容でお送りします。
発端
私が急にLLMのTraceabilityについて考え出したのは天啓があったから….ではなく、メディアとしてLLMが生成した物を見極める力が必要ではないかと考えためです。”LLMの生成物の判別”というキーワードで調べていくうちにLLMのTraceabilityというテーマに行き着きました。あと、田森上級研究員から面白そうなテーマだということで紹介してもらったことが発端です。しかし、LLMのTraceabilityどころかLLM初学者な私。内容を理解できるか不安ですが、なんとかChatGPT(GPT-4o)にも助けてもらいながら理解&私の言葉で咀嚼していきたいと思います。それではみなさんお付き合いください。
Traceability
さて、突然ですがLLMにおけるTraceabilityとはどのような意味になるでしょうか。まずそもそもTraceabilityという単語の意味を調べてみました。
つまり、製造物や原材料がどこからきてどのように加工されどこに流通しどこに収められるかといったことになりそうです。
例えば牛肉のTraceabilityというと、「誰が育ててどこでどのような加工をし流通をしてどこに収められるのか」といったことになります。なるほど、製造内容や流通経路を明確にし、対象となるものの変遷や処理内容を明確にし、”製造工程から販売先まで追跡を可能にする”ことだと理解しました。
LLMにおけるTraceability
ではLLMにおけるTraceabilityとはどのような意味になるか考えてみます。
LLMにおいて追跡できる対象はいくつか挙げることができるかと思います。モデルの学習プロセス、生成物の生成プロセスや生成後どこで利用されているか等が挙げられます。各追跡対象についてざっとどのような内容があるか以下にまとめてみます。
■学習プロセス
・データ
どのようなデータセットか(出所)、どのように前処理をされたか
・モデル
どのようなアーキテクチャのモデルか、どのようなパラメータか
・トレーニング
各エポックでのパフォーマンス、モデルの中間状態を残しておく
・評価
どのような評価指標で評価したか、その評価結果
■生成プロセス
・入力プロンプト
どのような入力が与えられ、前処理されたか
・モデルのバージョン
生成に使用したモデルのバージョンはどれか
・生成プロセス
生成アルゴリズムと、そのパラメータは何か
・生成データ
生成された出力はどのようなものか
■生成後
・生成データの行き先
どこで(どのように)利用されているか
色々と書きましたが、つまりモデルはどうやって学習したものか説明できますか?生成データはどうやって生成されたか説明できますか?生成物の利用先は?ってことだと素人なりに考えてみました。
LLMのTraceabilityの重要性
さて、ここまでLLMのTraceabilityについて考察をしてきましたが、なぜLLMのTraceabilityを考える必要があるのでしょうか?その重要性についてChatGPT(GPT-4o)に聞いてみました。
個人的に6. の生成コンテンツの識別に興味を持ちました。上述した生成データの行き先に関連しそうです。行き先がわかるということは生成データであると識別することができると言うことになります。
今後(もしかしたら既に)生成AIによる生産物が溢れていく中、生成AIにより生成されたコンテンツかどうかを判断できることは、より重要になっていくと日頃から思っていたのでここを少し深掘りしていこうと思います。
生成AIによる生成コンテンツを識別する手法
生成AIによる生成コンテンツを識別する手法は主に2種類の手法に分けられます。一つはモデル検出、もう一つはセマンティック検出です[1]。
■モデル検出
モデル検出にはモデルがコンテンツ生成時に電子透かし(watermark)を仕込む手法が存在します。電子透かしとは、目には見えない形の証跡を出力に埋め込むことです。モデルが生成物に証跡を埋め込むので、生成物に証跡があるかないかを判断することで、生成されたコンテンツか判断することができます。これはモデルを提供(作成)する側が行える手法で、コンテンツ生成時に電子透かしを仕込むという点で、LLMにおけるTraceabilityの項で挙げた生成プロセスのアルゴリズムとも関連づけることができます。
他には、生成物からモデル特有の特徴を探索する手法も存在します。生成物のlog-likelyhood、ニューラル特徴、またはbag-of-word特徴を利用する手法です[2, 3, 4, 5, 6]。
■セマンティック検出
セマンティック検出では生成物をテキスト分類タスクにかける手法が存在します。例えば人間が書いた文章とモデルが生成した文章の性質の違いを考慮した分類アルゴリズムである DetectGPT [7] が存在します。
モデルが生成時に電子透かしを埋め込む手法は、LLMの生成プロセスを自分で作成するという点で、個人でどうこうするには現実的ではありません。なので、生成物に寄った手法が発展をし、自分が享受しているコンテンツ(テキスト/画像/動画/音声 etc…)が生成AIにより生成されたものかどうかを判断するサービスなんかがでてきたらいいなぁと思いました。(作ってみたいという野望はあります)
まとめ
今回は素人がLLMのTraceabilityについて考えてみたという内容でお届けしました。今後どんどん生成AIが活用されていくであろう中で、生成AIから生成されたコンテンツかどうかを判断することは非常に重要だなと感じました。引き続きLLMのTraceabilityについては思考を続け、次に執筆するときには素人から一般人に進化をしたい所存です。
参考文献
[1]Origin Tracing and Detecting of LLMs, https://arxiv.org/abs/2304.14072
[2]Real or
fake? learning to discriminate machine from human generated text, https://arxiv.org/abs/1906.03351
[3]GLTR: Statistical Detection and Visualization of Generated Text, https://arxiv.org/abs/1906.04043
[4]Automatic detection of machine generated text: A Critical Survey, https://arxiv.org/abs/2011.01314
[5]Detectgpt: Zero-shot machine-generated text detection using probability curvature, https://arxiv.org/abs/2301.11305
[6]Release strategies and the social impacts of language models, https://arxiv.org/abs/1908.09203
[7]DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature, https://arxiv.org/abs/2301.11305
メディア研究開発センター 村瀬