【第2章因果関係】練習問題2.8.3「自然実験としての指導者暗殺の成功」
1.データセット・元論文の紹介
(1)データセット
・第2章の練習問題に取り組む際に必要になるデータセットは、第1章の練習問題と同様に以下のリンク先からダウンロードできる。
(2)元論文
・本練習問題の作成に際して参考とした論文が脚注で紹介されている。参考のためリンクを貼っておく。
2.練習問題2.8.3「自然実験としての指導者暗殺の成功」
(1)データセットの概要把握
①観察数250、変数11のデータ。データは250の暗殺計画を記録している
②1度でも指導者暗殺が計画された国は88ヵ国
③計画の総数と国のユニーク数より1ヵ国当り約2.84の暗殺計画がある
> leaeders <- read.csv("leaders.csv")
> dim(leaeders)
[1] 250 11
> summary(leaeders)
year country leadername age politybefore
Min. :1878 Japan : 11 Mussolini : 6 Min. :18.00 Min. :-10.000
1st Qu.:1920 Mexico : 11 Alexander II : 4 1st Qu.:45.00 1st Qu.: -7.000
Median :1949 France : 10 De Gaulle : 4 Median :52.50 Median : -3.000
Mean :1945 Russia : 10 Alexander III: 3 Mean :53.52 Mean : -1.519
3rd Qu.:1972 United States: 8 Amin : 3 3rd Qu.:61.75 3rd Qu.: 4.000
Max. :2001 Guatemala : 7 Carlos I : 3 Max. :81.00 Max. : 10.000
(Other) :193 (Other) :227
polityafter interwarbefore interwarafter civilwarbefore civilwarafter
Min. :-10.000 Min. :0.000 Min. :0.000 Min. :0.000 Min. :0.000
1st Qu.: -7.000 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.000
Median : -3.167 Median :0.000 Median :0.000 Median :0.000 Median :0.000
Mean : -1.650 Mean :0.188 Mean :0.148 Mean :0.216 Mean :0.184
3rd Qu.: 3.917 3rd Qu.:0.000 3rd Qu.:0.000 3rd Qu.:0.000 3rd Qu.:0.000
Max. : 10.000 Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000
result
not wounded :96
dies within a day after the attack :46
plot stopped :40
wounded lightly :25
hospitalization but no permanent disability:20
survives, whether wounded unknown :14
(Other) : 9
> length(unique(leaeders$country))
[1] 88
> length(leaeders$country) / length(unique(leaeders$country))
[1] 2.840909
(2)指導者暗殺計画の成功率とランダム性
<暗殺成功フラグ(success)の設定条件>
①変数resultが以下に該当する場合「1」を、非該当の場合「0」にする
・dies between a day and a week
・dies between a week and a month
・dies within a day after the attack
・dies, timing unknown
<結果の確認>
①指導者が死亡した場合が計54ケースある
②指導者暗殺計画の全体的な成功率は21.6%になる
③必ず成功又は失敗する訳でなく、5回に1回程度の成功率である。
しかし、成功をもたらす他の要因が存在する可能性があるため、
成功がランダムに決まると仮定することは妥当ではない。
> as.data.frame(summary(leaeders$result))
summary(leaeders$result)
dies between a day and a week 2
dies between a week and a month 2
dies within a day after the attack 46
dies, timing unknown 4
hospitalization but no permanent disability 20
not wounded 96
plot stopped 40
survives but wounded severely 1
survives, whether wounded unknown 14
wounded lightly 25
> leaeders$success <- ifelse(leaeders$result == "dies between a day and a week"|
+ leaeders$result == "dies between a week and a month"|
+ leaeders$result == "dies within a day after the attack"|
+ leaeders$result == "dies, timing unknown", 1 , 0)
> sum(leaeders$success)
[1] 54
> mean(leaeders$success)
[1] 0.216
(3)暗殺成否別の平均ポリティ指標・指導者の年齢
①暗殺計画前の3年間のポリティ指標の平均
1)平均値は失敗の場合-1.743、成功の場合-0.7037と1の差がある
2)箱ひげ図を見ると成功時の方がIQRの範囲が上振れしている
3)指導者暗殺が成功した国の方が民主的だった可能性がある
②暗殺計画時の指導者の年齢
1)平均値は失敗の場合52.71、成功の場合56.46と約4の差がある
2)箱ひげ図を見ると成功時の方がIQRの範囲が上振れしている
3)年齢が高いほど、暗殺が成功する可能性も高いことが考えられる
> tapply(leaeders$politybefore,leaeders$success,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.000 -7.000 -3.000 -1.743 3.000 10.000
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.0000 -6.0000 -3.0000 -0.7037 5.5000 10.0000
> tapply(leaeders$age,leaeders$success,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
18.00 44.00 51.50 52.71 61.00 81.00
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
34.00 47.25 58.00 56.46 64.75 77.00
> par(mfrow = c(1,2))
> boxplot(politybefore ~ success, data = leaeders,ylab = "politybefore",main = "plot failure / success politybefore")
> boxplot(age ~ success, data = leaeders,ylab = "age",main = "plot failure / success age")
(4)内戦及び戦争の発生状況別の平均ポリティ指標・指導者の年齢
①暗殺計画前の3年間のポリティ指標の平均
1)平均値は失敗の場合-1.570、成功の場合-1.431と約0.17の差
2)箱ひげ図を見ると成功時の方がIQRの範囲は広いがほぼ同じ
②暗殺計画時の指導者の年齢
1)平均値は失敗の場合53.25、成功の場合53.99とほぼ同じ
2)箱ひげ図を見ると成功時の方がIQRの範囲は狭いがほぼ同じ
> leaeders$warbefore <- ifelse(leaeders$civilwarbefore == 1 |
+ leaeders$interwarbefore == 1 , 1 , 0)
> sum(leaeders$warbefore)
[1] 92
> mean(leaeders$warbefore)
[1] 0.368
> tapply(leaeders$politybefore,leaeders$warbefore,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.000 -6.917 -3.000 -1.570 3.833 10.000
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.000 -7.250 -3.000 -1.431 4.250 10.000
> tapply(leaeders$age,leaeders$warbefore,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
18.00 45.00 52.00 53.25 62.00 81.00
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
31.00 45.75 53.50 53.99 61.00 81.00
> par(mfrow = c(1,2))
> boxplot(politybefore ~ warbefore, data = leaeders,ylab = "politybefore",main = "warbfore politybefore")
> boxplot(age ~ warbefore, data = leaeders,ylab = "age",main = "warbfore age")
(5)指導者暗殺の民主化又は戦争発生への影響
<データ分析上の仮定>
①比較するグループ間の特徴を極力合わせるため、暗殺計画前に内戦又
は戦争状態にあった国のみを抽出(変数warbefore=1)
②暗殺が行われた後の3年間で内戦又は戦争状態にあった場合1になる
変数warafterを追加
③暗殺の成否別(変数success)に暗殺後3年間のポリティ指標の平均
と内戦又は戦争の状態を比較
<結果の確認>
①暗殺計画から3年間のポリティ指標の平均
1)計画が失敗の場合の平均値は-1.466、成功の場合0.7982である
2)その平均の差は2.2642と大きい
3)暗殺の成功が、民主化に寄与していると思われる
②暗殺計画から3年間の内戦又は戦争の状況
1)計画が失敗の場合の平均値は0.7534、成功の場合0.5263である
2)その平均の差は0.2271と大きい
3)暗殺の成功は必ずしも内戦や戦争を引き起こすとは言えず、寧ろ
発生する可能性を低下させると思われる
> leaeders.warbefore <- leaeders[leaeders$warbefore == 1,]
> dim(leaeders.warbefore)
[1] 92 13
> leaeders.warbefore$warafter <- ifelse(leaeders.warbefore$civilwarbefore == 1 |
+ leaeders.warbefore$interwarafter == 1,1,0)
> tapply(leaeders.warbefore$polityafter,leaeders.warbefore$success,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.000 -7.000 -3.000 -1.466 3.667 10.000
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
-10.0000 -3.6667 1.0000 0.7982 5.7500 10.0000
> tapply(leaeders.warbefore$warafter,leaeders.warbefore$success,summary)
$`0`
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 1.0000 1.0000 0.7534 1.0000 1.0000
$`1`
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.0000 1.0000 0.5263 1.0000 1.0000
> par(mfrow = c(1,1))
> boxplot(polityafter ~ success, data = leaeders.warbefore,ylab = "polityafter")
3.練習問題を解いた感想
・比較するグループ間のランダム性が必ずしも保証されていない場合に、比較可能なグループを抽出してくるというタイプの問題を初めて解いた。
・現実のデータ分析では、RCTによる実験データでもない限り、こうしたタイプの問題の方が圧倒的に多いと思われる。様々な観点からデータセットを部分集合化して、知見をひねり出した際に、その知見での外的妥当性に範囲を強く意識すべきだと思った。
・ようやく第2章まで終わったが、残りの第3章・第4章、そして下巻とまだまだ先は長いので頑張っていきたい。
この記事が気に入ったらサポートをしてみませんか?