結論としては、(まだ)そんなことできるわけない。となるのだが、それで終わらせるのは流石につまらないので考えをまとめていきたい。
「生成AIは史料を読むことができるか」
はじめに
近年、生成AI(Generative AI)の発展は著しく、特に2023年以降、その技術は飛躍的に進歩している。生成AIは、大量のデータをもとに新しいテキストや画像、音声などを自動生成する能力を持ち、多様な分野で応用され始めている。特にOpenAIが開発したChatGPTや、GoogleのBardなどのモデルは、ユーザーの指示に基づいて対話を行い、さまざまな形態の文章を生成する機能を持っている。2023年には、これらの生成AIがさらに進化し、テキストだけでなく画像や音声も同時に処理できる「マルチモーダルAI」が登場し、その応用範囲は拡大の一途をたどっている。筆者も学校教育の現場で生成AIを利用するようになった。
学術研究においても、生成AIの応用が進んでおり、特にデジタル人文学の分野では、AIが資料の読解や分析を支援する役割を担いつつある。これにより、資料の要約や翻訳、テキスト解析が大幅に効率化される一方で、生成AIにはまだ多くの課題が残されている。本稿では、生成AIが「史料を読む」ことの可能性と限界について、歴史研究における現状と将来を考察する。
読むとは何か
「読む」という行為を考える際に重要なのは、それが単にテキストを文字通り認識することに留まらない点である。歴史研究において「読む」とは、史料の表層的な意味だけでなく、その背後にある文脈、歴史的背景、さらにはテキストが他の資料とどのように関連しているかといった多層的な意味を解釈することを含む。このような解釈を含む読解を「史料読解」と呼び、単なる文字の認識とは一線を画している。
生成AIは、テキストの認識や要約において非常に高い精度を持っているが、間テクスト性の理解、すなわち異なるテキスト同士の相互関係や影響を読み解く力には限界がある。テキストの背後にある複雑な文脈を理解し、それを基に深い洞察を得ることは、現時点では人間に依存せざるを得ない領域である。
しかし、期待される解決策の一つとして、「知識グラフ」の導入が挙げられる。知識グラフは、テキストやデータの間に存在する複雑な関係性を視覚化し、生成AIがこれらのつながりを認識しやすくする手法である。知識グラフは、データの相互関連性を構造化することで、文脈や関連する情報を体系的に整理し、AIがより深いレベルで資料を理解する手助けをする 。例えば、Googleなどの企業はこの技術を活用して検索結果の精度を向上させ、関連性の高い情報を提供している。歴史研究においても、知識グラフを使用して異なる史料間の関連性を可視化することで、テキスト間の相互作用を深く理解することが可能になる。
知識グラフを用いることで、生成AIが複雑な文脈的な関係性を理解し、間テクスト性を補完する未来が期待されている。これにより、テキスト間の関連性をより明確に捉え、より豊かな史料読解が可能となるだろう。
歴史研究における読解の重要性
歴史研究においてテキストを読む際には、単に一つの資料を読むだけでなく、その資料がどのような影響を受け、また他にどのような影響を与えているのかを考慮しなければならない。特に、ある資料が他の文献や同時代のテキストとの関連性を持つ場合、その関連性を理解することが研究の進展に欠かせない。このため、研究者は対象となるテキストに加え、それを補完するために多くの関連文献や資料を読む必要がある。これは、単一のテキストを理解するためにその数倍もの資料を参照しなければならないことを意味している。
ここで、生成AIがどのように役立つかを考えると、現時点ではテキストの表面的な認識や統計的なパターン分析には優れているが、文脈的な関連性を理解するには限界があると言える。AIがテキストの間に潜む関連性や影響関係を解釈する能力を持つには、さらなる技術的な進展が必要である。
生成AIの現在の限界
生成AIは多様なタスクに応用できる一方で、いくつかの重要な制約がある。特に、比喩や引用、皮肉といった高度な言語的ニュアンスを正確に理解する能力にはまだ限界がある。古典的な文献や宗教的な経典における引用を正確に解釈することは、依然として人間のスキルに依存している。また、漢文やチベット語、満州語といった歴史的な言語を扱う場合、生成AIがその文法構造や語彙の正確な解釈に困難を抱えている。
生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮するが、漢字や古い言語のような非アルファベット言語に対しては文字認識や文脈理解が不完全である。この点は、特に歴史研究において生成AIが課題とする領域であり、今後の技術的な進展が期待される部分である。
生成AIの期待される役割
それでも、生成AIは歴史研究において補助的な役割を果たすことができる。例えば、古い資料の文字起こしやOCR(光学文字認識)の技術は、手書きの文献や古い版のテキストをデジタル化する作業を大幅に効率化する。また、テキストマイニングやN-Gram分析など、統計的手法を用いて大量の資料から共通のパターンやテーマを抽出することも可能である。これにより、研究者がより効率的に資料の分析を行える環境が整いつつある。
さらに、生成AIは、研究者が複雑なプログラミングスキルを持たなくても、資料の自動分析や要約、テキストの構造解析を可能にする。これにより、研究者はより重要な解釈や分析に集中できるようになるだろう。生成AIが史料読解の範囲を広げ、研究の効率を向上させる役割を担うことが期待されている。
結論
現時点では、生成AIは完全に史料を読むことができるわけではない。特に、テキストの背後にある歴史的文脈や関連性を解釈する「史料読解」の能力においては、人間の感性や知識が不可欠である。しかし、生成AIはテキストの要約や分析、資料の整理といった部分で強力な補助ツールとなりつつある
生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮するが、漢字や古い言語のような非アルファベット言語に対しては文字認識や文脈理解が不完全である。この点は、特に歴史研究において生成AIが課題とする領域であり、今後の技術的な進展が期待される部分である。
検証してみる。
まずはネタバラシ
以上の2500程度の文章はChatGPT-4oが作成した文章をそのまま貼り付けた。といっても、いくらかのプロンプトに工夫した上で、10分程度の対話(所謂「壁打ち」)を経たのちに書き出させたものである。そのため、わたしの意見通りに書き出されている。ちなみにやりとりは以下の通りです。
で、どうなのだろうか?ここで書かれたことは本当にできるのだろうか?
というわけで実際の史料を用いて検証してみよう。サンプルにするのは『明史記事本末』巻三十八、平鄖陽盜である。ちなみにサンプルの選定に深い理由はない。研究するために手元に揃えていたものを試しに使ってみただけである。
検証①「生成AIは、テキストの認識や要約において非常に高い精度を持っている」のは本当か。
まずは次のようなプロンプトを入れてみる。
それに対する回答が以下である。
これはどう見るべきだろうか。大きな破綻は見られないが、大雑把にしか内容は分からない。まさに要約はできていると言って良いように思える。ただし大規模言語モデルの宿命だが、平均的なものが生成されてしまっている印象もある。そのことを考えると、付随して出てくる考察めいたものも、ありきたりというかよく知られていることをただ述べているだけに過ぎないという点も納得がいく。よく言えばニュートラルな要約ができているのだろう。これは、例えばテキストデータになった大量の档案とかはさっと読ませてみて精読するかどうかの判断をするみたいな効率化は出来るではなかろうか。
正直に言えば、専門家にとってはザッと読むのとさほど変わらないような気もする。まあ下読みとして参考にするのは有益かもしれない程度である。
検証②生成AIには「間テクスト性の理解、すなわち異なるテキスト同士の相互関係や影響を読み解く力には限界がある」のは本当か。
『明史記事本末』は後の時代に編纂された編纂史料であるから、編纂するにあたり参照した史料が存在する。明代史研究の場合はまずは『明実録』から探すのが定石である。またその『明実録』も、行政記録などをまとめて記事にしたものであるので、元になる史料にアクセスできる可能性がある。今回の場合は『皇明條法事類纂』に関連する文章が掲載されているし、今回のように政策に関わる事柄なら『皇明経世文編』に各官僚が残した上奏を見ることができる。さて、ChatGPTはそれを見ることができるのだろうか。以下のプロンプトをメッセージとして送ってみた。
それに対する回答が以下である。
こちらは意外とテキストの連関性について説明が出来ているのではないかという印象がある。もちろん『明実録』などとの連関性があるのではないかという程度の可能性の指摘に止まるが、決して間違ってはいないように思える。(1と2はなぜ項目を分けたのか、理由がよく分からないが…)。
ただ専門研究者にとっては知っていて当然の内容なので、目新しさは無い。というよりももっと直接的にどんな連関性があるのかを知りたい。そういうところで楽をしたい。とはいえ、この指摘通りに史料にあたれば、原典にはあたることができる。学部生にとっては良い方法なのかもしれない。
さてテキストの連関性について可能性に止まってしまうのならば、可能性にとどまらず関連する別の史料を与えてみたらどうなるのだろうか。ここで同時期に起こった性格を異にする反乱の記事である『明史記事本末』の別箇所、巻39平藤峽盜、巻41平固原盜の本文を加えて比較させてみる。
これに対する返答はこうである。
これもまた大きな破綻は無いように見えるが、大雑把にしか内容は分からず、ニュートラルで平均的なものが生成されている印象がある。とはいえ、分析という点で言えばこれでいいのかもしれない。あくまでここから研究者がそれぞれの視点で解釈を加えていけば良いのだろう。
そうであれば次は視点も与えてしまうどうなるのかが気になってくる。そこで今度はこのようなプロンプトを入れてみる。
筆者がこの史料を読むきっかけとなった問題意識というか、視点を入れてみた。その回答が以下である。
ここまで来ると所謂ファクトチェック、すなわち生成された情報が誤ったものになっていないかの確認を、人間の目で見ていく必要が出てくる。というのも与えた視点にかなり寄ってしまっているからである。(ちなみに『問刑条例』の編纂はChat GPTがいうほど反乱の鎮圧に関わらない。ここは完全にハルシネーションである。)ここで言われていることが全て正しいのなら、それで良いのだが、あくまで筆者が立てた仮説に則っており、恣意的な読みになっている印象は否めない。これでは正確に読めているとは到底言えない。
とはいえ、ここで提示されたものを一つ一つ検証していくという形をとれば、それはそれで研究成果になるのではないだろうか。ここでも生成AIが読むというよりは、読みの効率化を手伝うツールとしての有用性が目立つように思える。
ちなみにここまでのやり取りは以下に添付したリンクで確認できる。
検証③生成AIによる「古い資料の文字起こしやOCR(光学文字認識)の技術は、手書きの文献や古い版のテキストをデジタル化する作業を大幅に効率化する」のは本当か。
ここまで生成AIで史料を読む試みをしてきたが、一つ見逃せない大きな問題がある。それはテキストデータになっていない史料はどうやって入力するのかという点である。つまりここまでやってきたやりとりを行うためには、翻刻というした準備が必要になるのである。データベースが存在するのであればそれを利用できるが、そうでなければ面倒な作業が必要となってくる。
そこで活躍するのがOCRである。写真から文字を読み取る技術であるが生成AIがもてはやされる以前からいくつか手段はあった。例えばGoogleドキュメントや Adobe Acrobatで行うことができ、もう少し身近なものだとiPhoneの写真にも標準搭載されている。
これは生成AIでも同じことが、あるいはさらに複雑なことが出来るのではなかろうか。確かめてみよう。
ここでは『皇明條法事類纂』巻十二、荊襄撫治流民例の写真を利用してみる。写真は以下のホームページからダウンロードした。
これに対しての返答は以下である。
現状では、手書きの文字の認識は難しいようだ。今回の他にも何度か試したことはあるが、失敗するか全くの出鱈目を挙げてくるかのどちらかである。やはりOCRは専用の環境を整える必要があると言えるだろう。
ただ「生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮する」とも言っている。というわけでこのプロンプトを入力。
ここで加えたのはマルティニ・マルティノによる『韃靼戦記』と呼ばれる史料の冒頭である。ラテン語の史料であるが、これを読むように指示を出します。
そして翻訳をするというので、翻訳をさせる。
筆者はラテン語は解さないが、かなり正確に書き起こされているのだと思われる。英語版と比較しても内容に大きな変化はないので、上手く出来ていると考えてよいだろう。
これを踏まえるのならば「生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮する」ことに関しては正しいと言えそうだ。
結論
現状では、生成AIが史料を読めるとは到底言えない。だが使い方次第では「研究者が史料を読む」のを手助けをするツールとして有益に使うことが十分に出来ると言える。また統計的な手法を用いるのであれば、さらに良い使い方ができるのかもしれない。
筆者の専門は近世中国史だから現状この結論が出たのであって、別の地域、別の時代を専門とする研究者には、さらに適切な使い方が既にあってかなり有益であるという結論が出るかもしれない。
いずれにせよ人工知能はあらゆる場面で使われるようになるのだから、歴史研究の中でも使い方は模索するべきだろう。これからより最適な命令も作るようになるかもしれないし、失敗したとしてもそこから得られる視点はある程度あるだろう。