本記事でやっていることの要約三行
本記事の狙い
生成 AI / LLM の一つの可能性を探ってみる
これを機にそれぞれの文豪について興味を持ってくれたら嬉しい
単に私がやっていて楽しいので、楽しさを伝播させたい
本記事読者へのお願い
生成 AI / LLM について
「調教」においては『青空文庫』より「新字新仮名」のものを選んで、それぞれの文豪の文体の特徴抽出をおこなっています
調教・出力ともに Anthropic の Claude 3.5 Sonnet を用いています
お題の文章は LLM にコンテクストとして渡しません。LLM 内で既に保有されている知識に負うものとします
それぞれの出力ごとに別々のスレッドを新しく立てています
「調教」という語について
文豪のチョイスについて
お題
判定ツール
判定ツールとして ユーザーローカル さんの UserLocal 生成AIチェッカーを用います。
2024/01 にリリースされたものです。
https://ai-tool.userlocal.jp/ai_classifier
素の Claude 3.5 Sonnet
まず、比較のために、素の Claude 3.5 Sonnet なら、どのような判定をくだされるか見てみましょう。
出力
判定
AI っぽさは……
40% でした!
あれ!? 思っていたより低いぞ!?
Claude 3.5 Sonnet は既に 2024/01 リリースのチェッカーの性能を素で超えてきている感じ。
ただ、それなりには疑いうる。
夏目漱石
出力
判定
AI 疑惑は……
15% でした!
素の Claude 3.5 Sonnet に対して 40% なので、言わずもがなな結果に。
もはや AI だと判ずるのは難しい。
芥川龍之介
出力
判定
AI 疑惑は……
10% でした!
漱石よりもさらに AI の疑いがないもよう。
太宰治
出力
判定
AI 疑惑は……
10% でした!
芥川と同じく。
もしかして 10% が最低値かも?
幸田露伴
出力
判定
AI 疑惑は……
20% でした!
これまた意外なことに、前回 0004 回で私が一番良いと評価した露伴が、今までで一番高め!
文体が古めかしくてチェッカーがうまく判定できていない可能性もあるかもしれない……?
泉鏡花
出力
判定
AI 疑惑は……
10% でした!
さすがにまったく AI っぽさは感じられないですよね、この泉鏡花の文章は。傷心の部下に送ってはダメだけれど。
おわりに
雑感
ということで、AI である確率についてまとめると、
という感じになりました。
チェッカーが 2024/01 段階なので、その後に出てきている Claude 3 そして Claude 3.5 の日本語力への対応ができていないということかもしれません。
ただ、人間が読んでも、パスティーシュで出力している文章を AI かどうか判ずるのは、かなり難しいんじゃないかなと思います。
企画者当人の私ですら、ワカランってなるくらいです。
はい、というわけで、文体を調教すれば、2024/06 時点の Claude 3.5 Sonnet レベルで、既に人間が書く文章と同レベルのものを出力できるようになっているということが、あらためて分かったことと思います。
今回はちょっとした番外編的な回でした!
調教手法について
なお、調教手法についての概要は以下の記事に記しています。
興味ありましたらこちらもご参照ください!
自己紹介