人間か、それとも生成AIか?
文章の指紋で判別
生成人工知能(AI)「チャットGPT」
が作成した日本語の文章と人間が
書いた文章は、犯罪捜査に使われる
統計的手法を使うと正確に見分け
られることが昨年、犯罪心理学の
A氏の研究で分かった。
その内容は、米科学誌「プロスワン」
オンライン版で発表された。
チャットGPTを使えば、日本語でも
自然な文章を作成できることから
学術論文やインターネット上での
なりすましなど、不正利用への
懸念が指摘されていた。
その懸念を払拭する研究だが、
英語での判別方法に関する論文は
あるが、日本語では始めてとなる。
具体的に述べると、
A氏は、文章を品詞分解して、
「助詞の使い方や読点<、>
の打ち方」
など、特徴を統計的に解析する、
「計量文体学」
の知見を活用し、
心理学に関する日本語の論文72本
について、チャットGPTに、
「同じタイトルと分量で論文を
書いてください」
と依頼し、比較した。
その結果、
➀隣り合う品詞の組合せ、
➁助詞の使い方、
③ 読点の打ち方、
④「また」・「この」といった
単独で意味を持たない単語
の割合、
の4つの尺度で分析すると、チャット
GPTと人間の文章には統計的に明確な
違いがあることが浮き彫りとなった。
こうした違いをAIに学習させ、
読点の打ち方に着目して論文を
判別させると93.5%、
4つの尺度すべてを総合して判別
させると100%、
見分けることができた。
例えば、チャットGPTの文章では
➀「○○が、~が・・・」という
並びが目立つ傾向があるほか、
➁助詞「は」の後に読点が打たれ
やすいこと、
③「本論文は」など「本」という
接頭語が使われやすいこと、
が分かった。
A氏は科学捜査研究所の元主任研究官
で、脅迫や誹謗中傷などの文章を書い
た人物を特定する鑑定業務に従事した
経歴を持つ。
A氏は、
「チャットGPTが作成した文章は自然
だが、人間が読んでも一見気づかない
ような<文章の指紋>をあぶり出す
ことで、ほぼ正確に人間の手による
ものか否かを見分けられる」
と話す。
不正や犯罪などの抑止に希望
質問・依頼・指示に対して、人間が
書いたような自然な文章を生み出す
ことができる生成AI「チャットGPT」。
公開から1年足らずで世界中に利用者
を広げ、日本でも社会現象になって
いる。
業務効率化をはじめ多分野での活用が
期待される一方、誤った情報の拡散や
論文・試験での不正利用、犯罪への
悪用など「もろ刃のリスク」も兼ねて
指摘されている。
チャットGPTは米ベンチャー
「オープンAI」が1昨年に公開
したサービスで、一般向けは
メールアドレスの登録など簡単な
手続きで無料で利用できる。
ユーザーが質問や指示をすると、
その意図を汲み取って適切な答えを
返す。
人間同士のような自然な対話ができる
ことから、業務効率化のため各自治体
で導入が広がる。
だが、AIの急速な進化により、人間の
文章との区別はますます困難になって
いる。
瞬時に大量に文章を生成できる技術は、
論文の不正のみならず、フィッシング
詐欺のメール文案作成など犯罪行為に
使われる可能性もある。
AIの文章を見分けるのが事実上不可能
とする見方が大勢を占めつつある中、
今回の研究成果は人とAIの間に確かな
違いがあることを示した形だ。
A氏は、
「ブログや交流サイト<SNS>
など、論文以外の文書につい
ても検討してみたい」
と話し、A氏の判別手法の幅広い
普及に期待がかかる。
公募小説賞ではどう対応?
対話型人工知能(AI)「チャットGPT」
などの生成AIを活用して書かれた
小説にどう対応すべきか?
公募の文学新人賞や小説コンテスト
の現場で議論が始まっている。
自然な文章を生み出す生成AIには
執筆のサポート役として期待する
声がある一方、学習対象とする文章
など著作権侵害への懸念も残る。
そんな中、創作の自由とリスクの
両面を見ながら、応募規定を再検討
する動きも出てきた。
「チャットGPTが急速に普及して
いる。
作品を募る前に<しっかり準備
を>という議論になった」
と話すのは、日本SF作家クラブの
研究者B氏。
同クラブとイラストや小説などの
投稿サイトを運営する会社が共催
する、
「日本SF作家クラブの小さな小説
コンテスト」
は昨年、新しい応募規約を公開した。
その規約の柱は、AIで生成した作品
を応募する場合は申告するよう求め、
投稿できる数も1作に限定すること
である。
米国のSF雑誌では昨年、チャット
GPTを使ったとみられる作品の投稿
が急増。
編集者が対応できなくなり、投稿の
受付を一時的に停止する事態に追い
込まれた。
そんなニュースも念頭に、規約を
作成したという。
実際のところ、コンテストの応募で
全684作のうちAIを利用したものは
8作だった。
B氏は
「予想よりは少ない印象。
今後も創作を楽しむ初心者が
チャレンジできる環境を届け
ていきたい」
と話す。
令和3年にAIを使った作品が初めて
入賞し話題となった、
「星新一賞」(日本経済新聞社主催)
も昨年、応募規定に生成AIに関する
項目を新たに加えた。
その項目とは、
➀利用したAIの名称を明記するよう
求める、
➁AIが生成した文章は、人間が加筆・
修正する、
③プロンプト(AIに対する指示)に
既存著作物の作家名や作品名を
入れない、
などである。
平成25年の開始からAIなど「人間
以外」の作品を受け付けてきた
先進性や開放性を維持しつつも、
「著作権侵害のリスクを排除し、
利活用の透明性などを確保する
必要があると判断した」
という。
応募規定に触れないケースも?
一方で、芥川賞受賞作も輩出して
きた「主要文芸誌」の新人賞は
生成AIの使用に関し、応募規定等
で触れていない。
「現段階の生成AIでは一定以上
の長さの小説を、受賞に値す
る水準まで仕上げるのは難し
いはず。
音楽の新楽器のように創造的に
活用されれば、面白い小説が
生まれる可能性もあり、現時点
で使用を制限する考えはない」
と、文芸誌の編集者はそう語った
上で、
「創作が手軽になった結果、運営
に支障が出るほど大量の応募作
が寄せられるようになったら、
賞のあり方を見直す必要がある」
とも明かす。
1昨年にはAI文章生成サービスを
使用した作品が対象の
「AIのベりすと文学賞」
も創設され、389作の応募が
あった。
運営に携わる、デジタルメディア
研究所によると、
「応募者の年齢は10代から70代
まで幅広い」
とのことで、利用者の裾野が広が
りつつある。
AIに詳しい東京工業大のC教授は、
「生成AIを使う場合も、質の高い
作品にするには命令を下す人間
の創意工夫が不可欠。
AIに任せきりにすれば、他の小説
の文章を丸ごと持ってきて著作権
を侵害する、という事態も起こり
得る。
使う側・受け止める側双方の姿勢、
批評眼が重要になってくるのは
間違いない」
と話す。
<生成AIに生成させた内容と分析の図>