【雑記】生成AIは史料を読むことができるか

2024年10月7日 19:05

結論としては、（まだ）そんなことできるわけない。となるのだが、それで終わらせるのは流石につまらないので考えをまとめていきたい。

「生成AIは史料を読むことができるか」

はじめに

近年、生成AI（Generative AI）の発展は著しく、特に2023年以降、その技術は飛躍的に進歩している。生成AIは、大量のデータをもとに新しいテキストや画像、音声などを自動生成する能力を持ち、多様な分野で応用され始めている。特にOpenAIが開発したChatGPTや、GoogleのBardなどのモデルは、ユーザーの指示に基づいて対話を行い、さまざまな形態の文章を生成する機能を持っている。2023年には、これらの生成AIがさらに進化し、テキストだけでなく画像や音声も同時に処理できる「マルチモーダルAI」が登場し、その応用範囲は拡大の一途をたどっている。筆者も学校教育の現場で生成AIを利用するようになった。

学術研究においても、生成AIの応用が進んでおり、特にデジタル人文学の分野では、AIが資料の読解や分析を支援する役割を担いつつある。これにより、資料の要約や翻訳、テキスト解析が大幅に効率化される一方で、生成AIにはまだ多くの課題が残されている。本稿では、生成AIが「史料を読む」ことの可能性と限界について、歴史研究における現状と将来を考察する。

読むとは何か

「読む」という行為を考える際に重要なのは、それが単にテキストを文字通り認識することに留まらない点である。歴史研究において「読む」とは、史料の表層的な意味だけでなく、その背後にある文脈、歴史的背景、さらにはテキストが他の資料とどのように関連しているかといった多層的な意味を解釈することを含む。このような解釈を含む読解を「史料読解」と呼び、単なる文字の認識とは一線を画している。

生成AIは、テキストの認識や要約において非常に高い精度を持っているが、間テクスト性の理解、すなわち異なるテキスト同士の相互関係や影響を読み解く力には限界がある。テキストの背後にある複雑な文脈を理解し、それを基に深い洞察を得ることは、現時点では人間に依存せざるを得ない領域である。

しかし、期待される解決策の一つとして、「知識グラフ」の導入が挙げられる。知識グラフは、テキストやデータの間に存在する複雑な関係性を視覚化し、生成AIがこれらのつながりを認識しやすくする手法である。知識グラフは、データの相互関連性を構造化することで、文脈や関連する情報を体系的に整理し、AIがより深いレベルで資料を理解する手助けをする。例えば、Googleなどの企業はこの技術を活用して検索結果の精度を向上させ、関連性の高い情報を提供している。歴史研究においても、知識グラフを使用して異なる史料間の関連性を可視化することで、テキスト間の相互作用を深く理解することが可能になる。

知識グラフを用いることで、生成AIが複雑な文脈的な関係性を理解し、間テクスト性を補完する未来が期待されている。これにより、テキスト間の関連性をより明確に捉え、より豊かな史料読解が可能となるだろう。

歴史研究における読解の重要性

歴史研究においてテキストを読む際には、単に一つの資料を読むだけでなく、その資料がどのような影響を受け、また他にどのような影響を与えているのかを考慮しなければならない。特に、ある資料が他の文献や同時代のテキストとの関連性を持つ場合、その関連性を理解することが研究の進展に欠かせない。このため、研究者は対象となるテキストに加え、それを補完するために多くの関連文献や資料を読む必要がある。これは、単一のテキストを理解するためにその数倍もの資料を参照しなければならないことを意味している。

ここで、生成AIがどのように役立つかを考えると、現時点ではテキストの表面的な認識や統計的なパターン分析には優れているが、文脈的な関連性を理解するには限界があると言える。AIがテキストの間に潜む関連性や影響関係を解釈する能力を持つには、さらなる技術的な進展が必要である。

生成AIの現在の限界

生成AIは多様なタスクに応用できる一方で、いくつかの重要な制約がある。特に、比喩や引用、皮肉といった高度な言語的ニュアンスを正確に理解する能力にはまだ限界がある。古典的な文献や宗教的な経典における引用を正確に解釈することは、依然として人間のスキルに依存している。また、漢文やチベット語、満州語といった歴史的な言語を扱う場合、生成AIがその文法構造や語彙の正確な解釈に困難を抱えている。

生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮するが、漢字や古い言語のような非アルファベット言語に対しては文字認識や文脈理解が不完全である。この点は、特に歴史研究において生成AIが課題とする領域であり、今後の技術的な進展が期待される部分である。

生成AIの期待される役割

それでも、生成AIは歴史研究において補助的な役割を果たすことができる。例えば、古い資料の文字起こしやOCR（光学文字認識）の技術は、手書きの文献や古い版のテキストをデジタル化する作業を大幅に効率化する。また、テキストマイニングやN-Gram分析など、統計的手法を用いて大量の資料から共通のパターンやテーマを抽出することも可能である。これにより、研究者がより効率的に資料の分析を行える環境が整いつつある。

さらに、生成AIは、研究者が複雑なプログラミングスキルを持たなくても、資料の自動分析や要約、テキストの構造解析を可能にする。これにより、研究者はより重要な解釈や分析に集中できるようになるだろう。生成AIが史料読解の範囲を広げ、研究の効率を向上させる役割を担うことが期待されている。

結論

現時点では、生成AIは完全に史料を読むことができるわけではない。特に、テキストの背後にある歴史的文脈や関連性を解釈する「史料読解」の能力においては、人間の感性や知識が不可欠である。しかし、生成AIはテキストの要約や分析、資料の整理といった部分で強力な補助ツールとなりつつある

検証してみる。

まずはネタバラシ

以上の2500程度の文章はChatGPT-4oが作成した文章をそのまま貼り付けた。といっても、いくらかのプロンプトに工夫した上で、10分程度の対話（所謂「壁打ち」）を経たのちに書き出させたものである。そのため、わたしの意見通りに書き出されている。ちなみにやりとりは以下の通りです。

で、どうなのだろうか？ここで書かれたことは本当にできるのだろうか？

というわけで実際の史料を用いて検証してみよう。サンプルにするのは『明史記事本末』巻三十八、平鄖陽盜である。ちなみにサンプルの選定に深い理由はない。研究するために手元に揃えていたものを試しに使ってみただけである。

検証①「生成AIは、テキストの認識や要約において非常に高い精度を持っている」のは本当か。

まずは次のようなプロンプトを入れてみる。

あなたは文献から過去を読み解く歴史学者です。
次のメッセージで『明史記事本末』と呼ばれる史料の本文を貼り付けます。
明中期ごろの民衆反乱について書かれたものですがこの史料からどのようなことが読み取れるでしょうか。複数を示した上で、その説明をしてください。
【以下に本文を入れる。】

プロンプト

それに対する回答が以下である。

提示された本文に基づいて、それぞれの記述が具体的にどの部分に由来しているか、以下に解説します。

1. 流民問題とその影響

流民の存在とそれが反乱の原因となったことに関しては、本文の冒頭部分および中盤にかけて、流民が山岳地帯に移住し、飢饉や経済的困窮によりまとまった集団を形成した状況が描かれています。

「正統二年，歲饑，民徙入不可禁。」
ここで、飢饉により民衆が山地に移り住み、政府がそれを禁じることができなかったことが記されています。
「民可撫也。而奸民好亂者，非兵不威。」
流民が統制を離れ、秩序が崩れた状況が描かれています。
「今河南歲歉民饑，入山就食，勢不可止。」
この部分も、飢饉によって流民が山間部に移住し、反乱に繋がったことを示しています。

2. 政府の対応の遅れと不十分さ

政府の対応の遅れや無策に関しては、本文中で地方の役人たちが問題を他に押し付け、反乱の兆候を放置した様子が複数回言及されています。

「三省長吏又多諉非己境，因循不治。」
この部分では、地方の役人が責任を回避し、問題の解決を遅らせたことが指摘されています。
「賊狃為故常，不肯散。」
反乱者たちが制圧されず、ますます増長していたことが示されています。

3. 反乱指導者の特徴と組織的性質

反乱指導者たちの特徴と、彼らが組織的に反乱を起こしていたことに関する描写は、劉千斤や石和尚の行動を詳細に説明している部分に由来します。

「劉千斤名通，河南西華人，有膂力。」
ここで、劉千斤の身体的な力が強調されています。
「糾合馮子龍數百人，四散剽掠。通令男聰約子龍舉事。」
反乱が組織的に行われ、劉千斤や石和尚が多数の民衆を糾合して反乱を起こしていることが記されています。
「偽署將軍元帥，以石和尚為謀主。」
石和尚が軍事的指導者として反乱を組織していたことがわかります。

4. 反乱の地理的広がりとその影響

反乱が広範囲に拡大し、荊州・襄陽地域がその中心となったことは、本文の随所で述べられています。

「荊、襄之上游為鄖陽，鄖，古麋國，春秋時為楚附庸，地多山。」
ここで、荊州・襄陽が戦略的に重要な地であることが説明されています。
「劫襄、鄧境。」
反乱が襄陽や鄧州に広がり、周辺地域に影響を与えていることが示されています。
「賊據險在萬山中，復有流民從之。」
流民が広大な山岳地帯に集まり、反乱が広範囲にわたることを示す記述です。

5. 反乱鎮圧の暴力性とその後の批判

反乱の鎮圧が苛烈であったこと、そしてその後に批判が生じたことは、項忠や白圭らによる鎮圧の記述から明らかです。

「生擒劉千斤，獻俘京師，與苗龍等四十人，皆磔於市。男子十歲以上者斬之。」
ここでは、反乱の指導者たちが処刑され、多くの人々が厳しく処罰されたことが記されています。
「時流民有自洪武以來家業延子孫，未嘗為惡者。兵入，盡草薙之，死者枕藉山谷。」
流民が無差別に処罰され、多くの犠牲者が出たことを示す部分です。
「草薙良民，枕藉山谷，戍多道死，屍棄江干。」
ここでは、項忠による過剰な暴力行為が批判されていることが述べられています。

6. 流民の安定化と官僚の役割

洪謨の政策やその後の流民の安定化に関する部分は、史料の後半で詳しく記述されています。

「洪謨著《流民》之說，文會有三事之陳。」
洪謨が流民に対する安定策を提案したことが記されています。
「宣朝廷德意，問民疾苦。諸父老皆忻然願附版籍為良民。」
ここでは、流民が最終的に安定化し、社会に組み込まれていく様子が描かれています。
「入籍者十一萬三千，願留者九萬六千餘戶。」
多くの流民が定住し、社会の一部となったことが具体的に示されています。

これらの記述は、提示された本文の特定の部分から読み取れる内容であり、それぞれが反乱の原因、経過、結果を理解する上で重要な要素を提供しています。

GPTによる回答

これはどう見るべきだろうか。大きな破綻は見られないが、大雑把にしか内容は分からない。まさに要約はできていると言って良いように思える。ただし大規模言語モデルの宿命だが、平均的なものが生成されてしまっている印象もある。そのことを考えると、付随して出てくる考察めいたものも、ありきたりというかよく知られていることをただ述べているだけに過ぎないという点も納得がいく。よく言えばニュートラルな要約ができているのだろう。これは、例えばテキストデータになった大量の档案とかはさっと読ませてみて精読するかどうかの判断をするみたいな効率化は出来るではなかろうか。

正直に言えば、専門家にとってはザッと読むのとさほど変わらないような気もする。まあ下読みとして参考にするのは有益かもしれない程度である。

検証②生成AIには「間テクスト性の理解、すなわち異なるテキスト同士の相互関係や影響を読み解く力には限界がある」のは本当か。

『明史記事本末』は後の時代に編纂された編纂史料であるから、編纂するにあたり参照した史料が存在する。明代史研究の場合はまずは『明実録』から探すのが定石である。またその『明実録』も、行政記録などをまとめて記事にしたものであるので、元になる史料にアクセスできる可能性がある。今回の場合は『皇明條法事類纂』に関連する文章が掲載されているし、今回のように政策に関わる事柄なら『皇明経世文編』に各官僚が残した上奏を見ることができる。さて、ChatGPTはそれを見ることができるのだろうか。以下のプロンプトをメッセージとして送ってみた。

『明史記事本末』は後の時代に編纂された編纂史料です。この記事を書くにあたって参照したであろうより一次性の高い史料はありますか。

プロンプト

それに対する回答が以下である。

『明史記事本末』は明朝の歴史を体系的に編纂した二次史料であり、編纂者は特定の事件や時代に関するより一次性の高い史料を参照して執筆しています。この記事に関して、参照された可能性の高い一次資料や史料には以下のようなものが考えられます。

1. 『明実録』

『明実録』は、明朝の皇帝ごとに作成された官修の編年体の記録です。皇帝の治世に関する日々の出来事が詳細に記されており、特に国家の公式な行動、政策、反乱の鎮圧に関する報告が含まれています。『憲宗実録』などは、憲宗成化年間の反乱に関する一次資料として参照された可能性が非常に高いです。この資料は、朝廷で起きた出来事や地方の報告を集約しているため、非常に信頼性が高く、『明史記事本末』の編纂時にも重要な参考資料とされていたと思われます。

2. 『明太祖実录』『明宣宗实录』などの先行実録

特に初期の流民問題や劉千斤の反乱に関する情報は、明の建国期から続く社会的な問題を描いており、成化年間に関わる前の時代の実録も参照された可能性があります。例えば、『明太祖実録』や『明宣宗实录』には、流民政策や地方での治安維持に関する記述があり、これらが劉千斤らの反乱を理解するための背景として利用された可能性が高いです。

3. 地方の地方志（州県志）や役人の日記

反乱が発生した地域で編纂された地方志や地方の役人の日記なども、より詳細な情報を提供した可能性があります。これらの地方志は、当時の具体的な地理や社会状況、反乱の様子などが記録されており、より地域に根ざした視点での記録が残されていることが多いです。例えば、『荊州志』や『襄陽志』などは、襄陽・荊州の反乱に関してより直接的な情報源となり得ます。

4. 軍事報告や勅令の記録

明代には軍事に関する報告や勅令が詳細に記録されており、これも編纂史料の基礎資料となります。特に反乱の鎮圧に関わった軍の報告書や、兵部や都御史などの官僚による上奏文が記録されている資料が参照された可能性が高いです。これらは、反乱の進行状況や鎮圧の過程に関する詳細な情報を提供します。

5. 個々の役人による回顧録や文集

官僚や武将が個人として記録した回顧録や文集も、しばしばこうした事件に関して一次的な証言や分析を提供しています。例えば、反乱鎮圧に関与した白圭や項忠などが残した報告書や文集が存在すれば、それが『明史記事本末』の編纂に利用された可能性があります。

6. 地方の檄文や布告

地方での反乱が発生した際に出された檄文（反乱者による呼びかけ）や、官軍側の布告も重要な一次史料です。これらの文書は、反乱者たちがどのような目的で行動していたのか、また政府がどのように対応しようとしたのかを明らかにします。こうした資料も『明史記事本末』の記事を補強するために利用されたかもしれません。

7. 『大明会典』などの法規・行政記録

『大明会典』は、明朝の法規や行政の基準を定めた法令集であり、社会的な問題や反乱に対する政府の対応を体系的に理解するための重要な資料です。反乱鎮圧に関する政策や法規、罰則などが記録されているため、これらの資料も編纂に役立った可能性があります。

これらの一次資料が、明代の反乱に関する情報を提供し、『明史記事本末』の編纂時に参照された可能性が高いです。『明史記事本末』は、こうした史料を元に体系的に整理され、後世に残されたものです。

CharGPTによる回答

こちらは意外とテキストの連関性について説明が出来ているのではないかという印象がある。もちろん『明実録』などとの連関性があるのではないかという程度の可能性の指摘に止まるが、決して間違ってはいないように思える。（1と2はなぜ項目を分けたのか、理由がよく分からないが…）。
ただ専門研究者にとっては知っていて当然の内容なので、目新しさは無い。というよりももっと直接的にどんな連関性があるのかを知りたい。そういうところで楽をしたい。とはいえ、この指摘通りに史料にあたれば、原典にはあたることができる。学部生にとっては良い方法なのかもしれない。

さてテキストの連関性について可能性に止まってしまうのならば、可能性にとどまらず関連する別の史料を与えてみたらどうなるのだろうか。ここで同時期に起こった性格を異にする反乱の記事である『明史記事本末』の別箇所、巻39平藤峽盜、巻41平固原盜の本文を加えて比較させてみる。

今度は今読んだ史料と他の比較をしたいと思います。
今から二つ史料をあげます。三つで比較をしてください。
【以下に本文】

プロンプト

これに対する返答はこうである。

ありがとうございます。それでは、今読んだ史料『明史記事本末』、および二つの提供された史料とを比較し、それぞれの特徴や相違点を分析します。

1. 共通点

• 反乱とその鎮圧
いずれの史料も、明代における地方での反乱やそれに対する政府の鎮圧について記述しています。反乱の背景としては、経済的な困窮、民族や部族間の対立、地方官の腐敗などが共通して挙げられています。
• 『明史記事本末』では劉千斤による反乱とその鎮圧が中心となり、農民や地方住民の不満が反乱のきっかけになったことが強調されています。
• 一つ目の史料では、広西の大藤峡での瑤族の反乱が詳細に描かれており、韓雍を中心とした官軍の統制的な軍事行動が記録されています。
• 二つ目の史料では、陝西・甘州での満四による反乱が中心であり、山岳地帯の石城を拠点とした反乱の鎮圧過程が詳細に描かれています。
• 反乱の地理的要因
反乱の発生地はいずれも自然地理的に要害である場所が舞台となっており、政府側の軍事行動に大きな影響を与えています。山岳地帯や川が要害として機能し、反乱者がそこに立てこもることで、鎮圧に時間がかかる状況が見られます。
• 『明史記事本末』では、劉千斤が山中の隠れ家を拠点に反乱を続け、最終的に官軍が包囲して鎮圧しています。
• 一つ目の史料では、大藤峡の地理的特徴が反乱者にとって有利に働いたことが記されており、韓雍らがその地形を活かしつつも突破して鎮圧する様子が描かれています。
• 二つ目の史料では、満四が石城の自然要害を拠点に反乱を続け、官軍が最終的にその山岳要塞を攻め落とした過程が描かれています。
• 官軍の統制と指導者の役割
官軍側の指導者たちの役割が強調されており、反乱鎮圧の過程で彼らがどのような戦術を用いたかが詳細に描写されています。
• 『明史記事本末』では、白圭や王恕などが反乱鎮圧に大きな役割を果たしており、彼らの軍事的決断が反乱の終結に寄与しています。
• 一つ目の史料では、韓雍が主導して瑤族の反乱を鎮圧する際の緻密な戦術や、軍の統率が特に強調されています。また、陶魯のような個々の将軍の活躍も描かれています。
• 二つ目の史料では、項忠や馬文升が中心となって満四の反乱を鎮圧する過程が描かれており、特に山岳戦における戦術的な判断が詳細に説明されています。

2. 相違点

• 反乱の背景と規模
それぞれの史料で扱われている反乱の規模や背景は異なっています。
• 『明史記事本末』で描かれる劉千斤の反乱は、民衆の貧困や地方官の腐敗が背景にあり、農民反乱の典型的な事例として捉えられます。
• 一つ目の史料では、広西の瑤族という少数民族が主体となり、彼らの民族的・文化的な背景が反乱の要因となっていることが強調されています。この反乱は民族紛争の側面が強く、官軍の介入も長期にわたるものです。
• 二つ目の史料では、満四の反乱は、石城を拠点とする土着の勢力によるもので、経済的背景や個々の指導者の野心が要因となっています。また、反乱者たちが軍事力を使い、より戦略的に反乱を起こしている点が特徴です。
• 官軍の作戦と結末
各史料において、反乱を鎮圧するための作戦やその結果についての記述が異なります。
• 『明史記事本末』では、劉千斤の反乱に対する作戦は段階的に進められ、最終的に反乱の中心地を包囲して殲滅するという形で結末を迎えています。
• 一つ目の史料では、韓雍が指揮する大規模な軍事作戦が詳細に描かれ、反乱者たちを包囲しつつ戦略的に攻撃を加えたことが記されています。特に地形を利用した作戦が強調されています。
• 二つ目の史料では、満四の反乱に対して、官軍が石城という要塞を攻め落とすために様々な戦術を用いたことが記されています。ここでも、包囲と戦術的な攻撃が重要な役割を果たしており、反乱者たちを孤立させてから降伏させています。
• 反乱の指導者とその結末
反乱指導者の扱いも史料ごとに異なります。
• 『明史記事本末』では、劉千斤や石和尚などの反乱指導者が中心的に描かれ、彼らが最終的に処刑されるまでの過程が詳細に記されています。
• 一つ目の史料では、侯大狗などの瑤族指導者が反乱の中心におり、彼らがどうやって官軍に敗北し処刑されたかが描かれています。また、陶魯のような個々の将軍の役割も強調されています。
• 二つ目の史料では、満四や火敬などの指導者が反乱の中心におり、彼らの処刑や最終的な投降の過程が描かれています。反乱の中心人物である満四の捕縛と処刑が反乱の終結に繋がったとされています。

3. 評価と影響

• 政治的影響
それぞれの反乱は、地方に大きな政治的影響を与え、朝廷がどのように反応したかが記録されています。
• 『明史記事本末』では、劉千斤の反乱を鎮圧することで、中央政府の威信が保たれ、地方の安定が取り戻される過程が描かれています。
• 一つ目の史料では、大藤峡の反乱を鎮圧した結果、地方の再統治が強調されており、韓雍の成功が中央で高く評価されています。
• 二つ目の史料では、満四の反乱を鎮圧することで、陝西地方が安定し、さらに朝廷からの支持が集まった様子が描かれています。

このように、三つの史料はそれぞれ異なる反乱を扱いつつも、共通して反乱とその鎮圧がいかに地方社会や政治に影響を与えたかを詳細に記録しています。それぞれの反乱の背景や作戦の違いを通じて、明代における地方の治安問題や軍事行動の特徴を把握することができます。

Chat GPTによる回答

これもまた大きな破綻は無いように見えるが、大雑把にしか内容は分からず、ニュートラルで平均的なものが生成されている印象がある。とはいえ、分析という点で言えばこれでいいのかもしれない。あくまでここから研究者がそれぞれの視点で解釈を加えていけば良いのだろう。

そうであれば次は視点も与えてしまうどうなるのかが気になってくる。そこで今度はこのようなプロンプトを入れてみる。

これら三つの事件は同時代に発生している事件であり、活躍する人物にもしばしば重なります。
さらに私はこの時代について次のように考えています。

この成化・弘治年間というのは『問刑条例』や『大明会典』の編纂が象徴するように、制度の変革期であった。そしてここで確立した制度は明末まで、延いては清代まで運用され続けるものになっていた。そうであれば、成化・弘治年間に発生した三つの反乱の鎮圧過程には、『問刑条例』の条文編纂と何らかの目的論的な共通思想が見られないだろうか。言い成化・弘治年間における政策の立案・実行過程に何らかの「制度」が見られないだろうかということである。

この視点で考えるとどんなことが言えますか。

プロンプト

筆者がこの史料を読むきっかけとなった問題意識というか、視点を入れてみた。その回答が以下である。

あなたが提起された視点に基づいて、成化・弘治年間の三つの反乱鎮圧過程と『問刑条例』や『大明会典』などの制度編纂がどのように関わっているかを考察すると、以下のような見解が導き出される可能性があります。

1. 制度の確立と「秩序」の維持

成化・弘治年間は、制度が再編成され、官僚制度や法律がより整備された時期でした。『問刑条例』や『大明会典』が象徴するように、明代における法律や統治の基本的な枠組みがこの時期に確立され、その後の明末や清代にまで影響を及ぼしたことを考えると、これらの制度には反乱鎮圧に関連する秩序維持や社会安定に関わる目的が込められていたと考えられます。

例えば、三つの反乱の鎮圧においても、単に軍事的な制圧にとどまらず、地域社会における秩序を再確立するための制度的な対応が見られます。広西の瑤族反乱（大藤峡の乱）において、韓雍が反乱を鎮圧した後、土司（地方の土着統治者）の制度を活用して地域の統治を強化する提案をしている点などが挙げられます。これにより、単に反乱を制圧するだけでなく、反乱後の地域社会を安定させるための制度的な対応が意識されていることがわかります。

『大明会典』は行政・法律を含む統治制度全般の規範を定めた文書であり、反乱鎮圧後の処理や地方統治に関する規範も含まれていた可能性があります。これにより、反乱後にどのように地域を再統治し、秩序を回復するかという点で、制度的に支えられた鎮圧の過程があったと考えられます。

2. 問刑条例と反乱鎮圧の関係

『問刑条例』は、刑罰や法的な手続きを規定する法律であり、成化年間に編纂されました。反乱鎮圧の際に、反乱指導者や参加者への処罰や法的な対応が重要な問題となりますが、これに関連する法的制度がこの時期に整備されていることも重要です。反乱指導者に対する処罰（たとえば劉千斤や石和尚、満四の処刑）がいずれの反乱でも行われており、これが単なる処刑にとどまらず、明確な法的手続きを通じて正当化されていた可能性が高いです。

成化年間における『問刑条例』の編纂は、反乱鎮圧における処罰の適正さや、法的手続きを通じた社会秩序の回復という側面を強調していたと考えられます。この時期、反乱鎮圧後に捕虜となった反乱者たちに対して適切な処罰を与えることで、反乱の再発を防ぐとともに、法に基づいた処罰によって中央政府の正当性を強調することが目的とされていた可能性があります。

例えば、二つ目の史料で描かれた満四の反乱では、反乱の終結後、反乱指導者やその関係者に対する処罰が詳細に描かれていますが、これは『問刑条例』に準拠した法的な手続きを通じた処罰であり、中央政府の権威を示す一環だったと考えられます。

3. 政策の「制度化」と軍事行動の体系化

成化・弘治年間においては、反乱鎮圧のための政策や戦略がより制度化され、中央から地方へと一貫した方針で実施されていたことが考えられます。この「制度化」には、軍事行動の際の指揮命令系統や、地方官の役割、反乱鎮圧後の地域統治に至るまでの体系化された政策が含まれます。

例えば、反乱の鎮圧にあたった将軍や地方官の動きには、中央の指示に従い、法的・行政的な枠組みを遵守しつつ行動している様子が見られます。一つ目の史料では、韓雍が反乱後の地域統治を再建するための提案をし、地方の巡検司や土司制度を強化し、また徴税システムを再構築するなど、行政的な対応を伴った鎮圧が行われている点が特筆されます。これは、軍事行動だけでなく、反乱後の行政や統治をも含む一貫した「制度化」がこの時期に進行していたことを示唆します。

4. 中央集権化と地方支配の強化

成化・弘治年間は、中央集権化が進んだ時期でもあり、反乱鎮圧を通じて地方の支配を強化する動きが見られます。『大明会典』は、明王朝の中央集権的な統治体制を強化するための法的基盤として重要な役割を果たしており、この時期に制定された地方統治の制度が、反乱鎮圧後の統治再建においても活用されています。

特に、広西や陝西のような辺境地域で発生した反乱に対して、中央から派遣された軍事・行政の指導者たちが反乱を鎮圧した後、地方官による統治を再建し、中央の権威を強化する動きが見られます。こうした対応は、『大明会典』で定められた地方統治の枠組みに基づいて行われたと考えられます。

このことから、成化・弘治年間における反乱鎮圧は、単なる一時的な軍事行動ではなく、地方の安定と中央集権化を促進するための制度的な枠組みの中で実行されていたと言えます。

5. 目的論的な共通思想

成化・弘治年間における政策の立案や実行過程には、反乱の鎮圧を通じて社会の秩序を回復し、地方の統治を強化するという目的が一貫していたことが考えられます。この時期に制定された制度や法律は、単にその場限りの対応ではなく、持続的に運用されることを意図していました。

例えば、『問刑条例』の整備は、反乱鎮圧後に反乱者たちを法に基づいて処罰し、中央の正当性を強調するために役立てられました。また、『大明会典』は、反乱鎮圧後に地方の行政を再建し、中央の統治権を強化するための制度的な基盤となっていました。

これらの制度的な枠組みが整備される中で、成化・弘治年間の反乱鎮圧は、その後の明朝末期や清朝初期まで続く制度的な統治の基盤を形成する役割を果たしていたと考えられます。

結論

成化・弘治年間は、法制度や行政制度の整備が進んだ時期であり、これらの制度は反乱鎮圧の過程にも深く関わっていました。『問刑条例』や『大明会典』が編纂される中で、反乱鎮圧の手法やその後の統治再建において、法的・制度的なアプローチが体系化されていたことがうかがえます。これにより、反乱後の秩序回復と地方統治の強化が進められ、明末・清朝にまで続く制度の枠組みがこの時期に確立されていたと言えるでしょう。

Chat GPTによる回答

ここまで来ると所謂ファクトチェック、すなわち生成された情報が誤ったものになっていないかの確認を、人間の目で見ていく必要が出てくる。というのも与えた視点にかなり寄ってしまっているからである。（ちなみに『問刑条例』の編纂はChat GPTがいうほど反乱の鎮圧に関わらない。ここは完全にハルシネーションである。）ここで言われていることが全て正しいのなら、それで良いのだが、あくまで筆者が立てた仮説に則っており、恣意的な読みになっている印象は否めない。これでは正確に読めているとは到底言えない。

とはいえ、ここで提示されたものを一つ一つ検証していくという形をとれば、それはそれで研究成果になるのではないだろうか。ここでも生成AIが読むというよりは、読みの効率化を手伝うツールとしての有用性が目立つように思える。

ちなみにここまでのやり取りは以下に添付したリンクで確認できる。

検証③生成AIによる「古い資料の文字起こしやOCR（光学文字認識）の技術は、手書きの文献や古い版のテキストをデジタル化する作業を大幅に効率化する」のは本当か。

ここまで生成AIで史料を読む試みをしてきたが、一つ見逃せない大きな問題がある。それはテキストデータになっていない史料はどうやって入力するのかという点である。つまりここまでやってきたやりとりを行うためには、翻刻というした準備が必要になるのである。データベースが存在するのであればそれを利用できるが、そうでなければ面倒な作業が必要となってくる。

そこで活躍するのがOCRである。写真から文字を読み取る技術であるが生成AIがもてはやされる以前からいくつか手段はあった。例えばGoogleドキュメントや Adobe Acrobatで行うことができ、もう少し身近なものだとiPhoneの写真にも標準搭載されている。

これは生成AIでも同じことが、あるいはさらに複雑なことが出来るのではなかろうか。確かめてみよう。

今から生成AIによるOCRがどの程度正確かを実験します。
この史料を文字を書き起こしてください。

プロンプト

ここでは『皇明條法事類纂』巻十二、荊襄撫治流民例の写真を利用してみる。写真は以下のホームページからダウンロードした。

これに対しての返答は以下である。

提供いただいた史料の画像からのOCR処理は、適切なテキストの抽出に失敗しました。これは、画像の品質や文字の複雑さ、もしくはクラシックな漢字や日本語に適した言語モデルが設定されていなかったことが原因として考えられます。

より良い結果を得るためには、クラシックテキストに対応したデータセットを使用するか、手動で書き起こしを行う方法が考えられます。正確さが重要な場合は、特に手動の書き起こしが有効かもしれません。

今後の進め方について、どうされたいか教えてください！

Chat GPTによる回答

現状では、手書きの文字の認識は難しいようだ。今回の他にも何度か試したことはあるが、失敗するか全くの出鱈目を挙げてくるかのどちらかである。やはりOCRは専用の環境を整える必要があると言えるだろう。

ただ「生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮する」とも言っている。というわけでこのプロンプトを入力。

では史料を変えます。これならばどうですか？

プロンプト

ここで加えたのはマルティニ・マルティノによる『韃靼戦記』と呼ばれる史料の冒頭である。ラテン語の史料であるが、これを読むように指示を出します。

OCRの結果は以下の通りです。

DE BELLO
TARTARICO
HISTORIA;

In qua, quo patto Tartari hae
nostra aetate Sinicum Imperium
inuaserint, ac fere totum occu-
parint , narratur ; eorumque
mores breuiter describuntur,

TARTARI (antiquissimi in Asia gens, & mul-
tarum gentium principium, jam a quatuor mil-
libus annorum Sinico Imperio inimica) saepe acria bella cum
Sinis gesserunt, & quamuis aliquoties
victi fuerint, saepius tamen victores ex-
titerunt. Tartaros autem voco gentem
illam, quae ad partes Septentrionales
sita est , ultra famosum murum Sina-
rum, ab Occasu in Ortum extensum,
quo, per trecenta & plura milliaria
Germanica continuata quasi serie ex-
tincto, excludebatur, ne Sinicum Im-
perium.

続いて翻訳を提供いたします。

Chat GPTによる回答

そして翻訳をするというので、翻訳をさせる。

以下はOCR結果を基にした翻訳です。

韃靼（タタール）戦記

現代において、韃靼（タタール）がどのようにして中国帝国を侵略し、ほぼ全土を占領したのかが記述されており、彼らの風習も簡潔に説明されています。

韃靼（タタール）はアジアで最も古い民族の一つであり、多くの他民族の支配者でもあります。彼らはすでに4000年もの間、中国帝国の敵であり、しばしば中国と激しい戦争を繰り広げてきました。たとえ何度か敗北したとしても、彼らはしばしば勝利者として浮上してきました。私は「韃靼」とは、北方に位置する民族を指し、その地は有名な中国の万里の長城を超え、西から東に広がり、約300マイル以上続くドイツ風の建築物のように連なっており、中国帝国から分断されています。

文中に多少の不正確さがあるかもしれませんが、この内容を基に全体の意味を把握することが可能です。必要に応じて、さらなる修正や確認を行うことをお勧めします。

Chat GPTによる回答

筆者はラテン語は解さないが、かなり正確に書き起こされているのだと思われる。英語版と比較しても内容に大きな変化はないので、上手く出来ていると考えてよいだろう。

これを踏まえるのならば「生成AIはアルファベットを用いる西洋言語においては比較的優れたパフォーマンスを発揮する」ことに関しては正しいと言えそうだ。

結論

現状では、生成AIが史料を読めるとは到底言えない。だが使い方次第では「研究者が史料を読む」のを手助けをするツールとして有益に使うことが十分に出来ると言える。また統計的な手法を用いるのであれば、さらに良い使い方ができるのかもしれない。

筆者の専門は近世中国史だから現状この結論が出たのであって、別の地域、別の時代を専門とする研究者には、さらに適切な使い方が既にあってかなり有益であるという結論が出るかもしれない。

いずれにせよ人工知能はあらゆる場面で使われるようになるのだから、歴史研究の中でも使い方は模索するべきだろう。これからより最適な命令も作るようになるかもしれないし、失敗したとしてもそこから得られる視点はある程度あるだろう。

【雑記】生成AIは史料を読むことができるか

「生成AIは史料を読むことができるか」

はじめに

読むとは何か

歴史研究における読解の重要性

生成AIの現在の限界

生成AIの期待される役割

結論

検証してみる。

まずはネタバラシ

検証①「生成AIは、テキストの認識や要約において非常に高い精度を持っている」のは本当か。

検証②生成AIには「間テクスト性の理解、すなわち異なるテキスト同士の相互関係や影響を読み解く力には限界がある」のは本当か。

検証③生成AIによる「古い資料の文字起こしやOCR（光学文字認識）の技術は、手書きの文献や古い版のテキストをデジタル化する作業を大幅に効率化する」のは本当か。

結論

いいなと思ったら応援しよう！