武力紛争の計量的研究を支える3つの研究者向けデータセットを紹介する
データセットは調査の基盤であり、計量的アプローチを用いる研究には欠かせないものです。この記事では、研究者が使用するデータセットで武力紛争に関するものを取り上げ、特に有名な3つのデータセットを紹介します。武力紛争といっても範囲が広いので、本稿では戦略行動や作戦行動ではなく、個々の戦術行動の分析のためのデータをまとめたものを取り上げることにします。
CAA Database of Battles, Version 1990
研究者の間ではCDB-90という略称で知られているデータセットであり、正式な名称は「構想分析局の戦闘データベース1990年版(Concepts Analysis Agency Database of Battles Version 1990)」です。1600年から1982年までに発生した660件の戦闘の名称、発生した年月日、交戦者の兵力と損耗、歩兵・騎兵・砲兵など職種別の兵力の組成、攻撃者と防御者の区別、戦闘が継続した期間、戦場の地理的環境、戦術的特徴(戦術行動の種類、戦闘正面の広さ)などのデータが含まれています。以下のデュピュイの報告書でその内容を知ることができます。
Dupuy, Trevor. 1984. Analysis of Factors That Have Influenced Outcomes of Battles and Wars. Technical Report, CAA SR-84-6. Dunn Loring, VA: Historical Evaluation and Research Organization.
数多くの研究で使われてきたデータセットですが、そのコーディングの方法に欠陥があることも繰り返し指摘されてきたデータセットです。データの信頼性に問題がある19世紀までに起きた戦闘のデータに関しては分析対象から除外してしまうか、あるいは定性的分析を踏まえ、慎重に取り扱わなければなりません。20世紀以降のデータに関しても記録されている戦闘が西欧や中東で発生した戦闘に偏っていることが指摘されています。
以前は入手が難しいデータセットでしたが、最近ではプログラムの共同開発やデータセットの共有などに使われるウェブプラットフォームのGitHubでオープンデータになったバージョンが入手できるようになりました(2021年9月現在)。
UCDP GED
ウプサラ紛争データ・プログラム(Uppsala Conflict Data Program)が提供している地理参照事件データセット(Georeferenced Events Dataset)は地理情報を含む武力紛争のデータセットです。
Sundberg, Ralph, Melander, Erik (2013) Introducing the UCDP georeferenced event dataset. Journal of Peace Research 50(4): 523–532.
1989年以降に世界各地で発生した戦闘のデータをウェブサイトで視覚化された形で見ることができるだけでなく、構造化データを入手することもできます。
左上の「Menu」から「Downloads」に入ると、GEDをさまざまなファイル形式で入手することができます。
このデータセットの難点は、それぞれの事象が戦争ごとにまとめられていないことであり、また戦闘の結果として勝敗がどのように決まったのかを判定していません。CDB-90に比べると、戦闘に使用された兵力や戦術に関する情報が貧弱であるという限界があります。計画的、組織的な戦闘だけでなく、散発的、突発的な暴力行為もデータに含まれていることにも注意が必要です。
ダッシュボードの閲覧の仕方についても簡単に解説しておきます。デフォルトでは1989年以降に発生した攻撃が犠牲者の人数に応じて円形のアイコンで表示されています。左下に位置する「2020」と表示されたアイコンをクリックすると、2020年に限定したデータだけを表示することができます。
2020年に犠牲になった人の数は81,447人と記録されていますが、左上の円グラフの隣にあるチェックボックスを操作すると、表示したいデータを限定できます。上から順に犠牲者総数(Total Number of Deaths)、国家型暴力(State-Based Violence)、非国家暴力(Non-State Violence)、一方的暴力(One-Sided Violence)です。戦闘行動に該当する事象は交戦主体によって国家型暴力か、非国家暴力に分類されています。
2020年のバグダッド付近の情報を確認してみると、バグダッドの北東部に位置するショーヤでイラクとイスラム過激派のイスラミック・ステートが繰り返し交戦していたことが分かります。
ACLED
武装紛争位置事件データセット(Armed Conflict Location Events Dataset)も地理情報を含めた戦闘データを提供しています。ウェブページで視覚化されたデータを閲覧することができるだけでなく(ダッシュボードはこちらのリンクから)、1997年以降の戦闘データを入手することもできますが、その場合は個人アカウントの作成が必要です。
ここではアカウントの作成が必要ないダッシュボードの操作法について説明します。ダッシュボードの左上にMap Filetersと記載されていますが、その下に紛争の発生地を国別で示すのか、地点で示すのかを選択できるバーがあります。デフォルトの設定は国別の表示「Country View」ですが、どの地点で攻撃が起きているのかを見たい場合は「Point View」のバーをクリックしてください。すると、次のような表示に変わります。
特定の地域を拡大して表示したい場合はスクロールで近づくことができます。ここでは中国の北京付近を拡大表示し、北京で表示されていた攻撃を確認してみます。
適当に興味があるドットを選択すると、Summaryが表示され、2021年に27件の事象が起きていることがTotal Eventsで確認できます。報告された犠牲者(Reported fatalities)は0です。内訳では暴動(riot)が1件、民間人に対する暴力(Violence against civilians)が26件記録されています。詳細を知りたい場合はSummaryの右隣にあるEvents Detalisを見るとよいでしょう。
アフガニスタンの方を確認すると、戦闘の発生地点が確認できます。こちらはナンガルハール州で発生した攻撃のデータで、戦闘(battle)が3件報告されています。そのうちの1件の詳細を調べると、2021年2月26日前後にShewaでタリバンの武装勢力が待ち伏せ攻撃を実施したことが分かります。