北九州市長選挙出口調査の年代別得票率を対応分析によって再分析
2023年2月5日に北九州市長選の投票が行われ、出口調査に基づいて西日本新聞が各候補の年代別得票率を帯グラフで示しています。しかし、2月7日に発行された同紙の記事に掲載された帯グラフには、重要な情報が欠落しています。この帯グラフにおいて、パーセントを計算する際の分母として用いられた各年代の回答者総数が示されていません。
そのため、年代による差がどの部分で統計的に有意なのかが判断できません。例えば、武内和久候補の得票率が10代と20代で差があるかどうかを確認するためには、10代と20代のそれぞれの総回答者数を知る必要があります(注1)。10パーセント以上の違いがあっても、統計的に有意とは言えない場合があり、グラフを読む読者が誤解する可能性があります。
なお、以下の分析は西日本新聞社が新聞等で公表しているグラフ(帯グラフ)を、選挙に関心を持つ市民の一人として再分析するものであり、当然のことですが、内容に誤りがある場合にはそれは分析者の責任です。
1. パーセント計算の基数を確認し、公表されている帯グラフに物差しをあててクロス表を再構成
d1 <- c(14,30,61,110,117,100,127,62) # パーセント計算の基数
d2 <- c(3,11,36,51,62,44,47,20)
d3 <- c(28,46,23,39,34,44,48,51)/100 # グラフより読み取り
d4 <- round(d1 * d3, digits = 0)
d5 <- d1 - d2 - d4
m <- matrix(c(d2,d4,d5),nrow = 8)
dimnames(m) <- list(
Age = c("18-19","20s","30s","40s","50s","60s","70s","80-"),
Candidate = c("Takeuchi","Tsumori","Others")
)
再構成されたクロス表の数値から、2種類のモザイク図を作成。
クロス表全体についてカイ2乗検定を以下のように行う。p値については、p < 0.01という結果がリサンプリング方式で出てくる。
chisq.test(m,simulate.p.value = T)
2. 最初の対応分析
とりあえず、対応分析のグラフを2種類作成。
plot(ca(m))
plot(ca(m),map="rowprincipal", main="rowprincipal")
次に、18歳・19歳を外して、サプリメンタリー・ポイントとして扱ったグラフを示す。
plot(ca(m,suprow=1))
3. 18歳から29歳までを合併して分析する
通常の方法でカイ2乗検定を行うと、結果は以下のように、p < 0.05。
回答者の少ないカテゴリーを合併して作成したクロス表から、モザイク図と対応分析のグラフを作成する。なお、対応分析の出発点になっているのは、クロス表から作成される次の2つの表(行プロファイル表、列プロファイル表)である。
対応分析のグラフ(4)から、探索的分析として、次元(dimension)ごとにグラフを見て、以下のことをいうことができるであろう。
武内候補のプロファイルは、30代、50代のプロファイルと正の相関が見られる。
これに対して、津森候補のプロファイルは、80代、29歳以下、70代のプロファイルと正の相関が見られる。
武内候補のプロファイルと津森候補のプロファイルとには負の相関が見られる。
武内、津森の両候補以外は、29歳以下のプロファイルと正の相関が見られる。
30代のプロファイルと80代のプロファイルとには、負の相関が見られる。
行(年齢層)だけに注目すると以下のグラフのようになる。このグラフは、上記の計算結果のRowsの表に関連させて説明すれば、「Dim. 1」と「Dim. 2」に示されている標準座標(standard coordinates)の数値を使ったものである。
軸(次元)の解釈はここでは行わないが、年齢グループとしては、29歳以下(20代以下)、30代、40・50代、60代以上を区別することができるであろう。
下記のグラフは、シンメトリックではなく、行分析(rowprincipal)のグラフ化をおこなったものである。第1主軸及び第2主軸において、行プロファイルが主座標として示され、列頂点は、標準座標として示されている。
Michael Greenacreによれば、対応分析(非対称、行分析)において、主軸におけるプロファイルの座標位置が主座標であり、主軸における頂点(vertices)の座標位置が標準座標である。非対称マップでは、例えば行分析をおこなうならば、主座標における行点は行プ ロファイルを示し、標準座標における列点は列頂点を示す。両者は、同じ軸に表示されるが非対称分析では異なる尺度が取られている(注2)。
4. 軸形成へのプロファイル・ポイントの寄与
上記の表のctrの列は、「軸形成へのプロファイル・ポイントの寄与」(注3)を示すものである。また、数値の67は、0.067を意味し、軸ごとの合計は1.0である。
Rowsの表から、第1軸の形成に最も「寄与」しているのは、0.375となっている「30代」であることがわかる。同様のことは、第2軸については、「29歳以下」に当てはまる。(補足3)
なお、上記の表のcorの列は、注3で示した藤本一男氏の解説に従えば「ポイントへの軸の寄与」である(FactoMineRのパッケージでは、cos2と表示される)。行及び列のそれぞれにおいて、各カテゴリーの第1軸と第2軸の数値を合計すると、上記の表では1,000となる。例えば、228 + 772 = 1000となるように。
5. 29歳以下を外した場合
29歳以下をサプリメンタリー・ポイントとして扱うと、以下のようなグラフになる。全慣性の約92パーセント以上が第1軸で説明されることになる。
そうしない場合と比べると、第1軸についてだけでなく第2軸の形成へのプロファイル・ポイントの寄与においても、30代が他の年齢グループよりも前面に出てくるようだ。
6. 出口調査結果についてのコメント
新市長となった武内和久候補が、60歳以上と30歳未満の年齢層で相対的にも絶対的にも得票率が低く不人気であったのはなぜなのだろうか。西日本新聞記事は、武内候補が「30~50代の働く世代の支持を集めた」という解釈をしているが、「働く世代」というとらえ方は的確だろうか(注4)。29歳以下でも、60歳以上でも多くの人が働いているわけであるから。落選した津森洋介候補が、30代の年齢層で相対的に得票率が低く不人気であったのはなぜだろうか。
西日本新聞記事によると、「最も力をいれてほしい政策」としてあげられたものを年代別にみると、40・50代では「景気・経済対策」に期待する人の割合が、また、70・80代では「福祉・医療」に期待する人の割合が多かったという。しかし、どの程度の差が年代別にあったのだろうか。
「最も力をいれてほしい政策」を年代別に比較するだけでなく、この「期待する政策」と投票行動(どの候補に投票したか)との関連を同じようにグラフで示すことができたはずだ。また、「年齢」、「期待する政策」の2変数を同時に考慮して各候補への投票行動を分析したらどうだったのだろうか。そのような分析がなされれば、以下のような事柄を明らかにすることができたはずであり、候補者への支持に影響を与えた要因が、候補者のイメージ戦略との関連で明確になる可能性がある。
武内和久候補の選挙活動での公約は、「100万都市の復活」と「稼げる街」というものであった(補足4)。このそれぞれが有権者にどのように受け取られたかは、同候補の年代別得票率にどの程度の影響を与えただろうか。とくに、「福祉・医療」に期待する人の割合が多かったという「70・80代」は、主語が曖昧で意味も不明な「稼げる街」というキャッチフレーズをどう受けとめたのだろうか。このフレーズによって、もしも、例えば、高齢者が生活費の高騰を危惧することなどがあった場合、60歳以上の年齢層において同候補の得票率が低かったことがそのことで説明できる可能性があるだろう。
当選した武内和久候補の場合、「追加公約」として「大胆な子育て支援、今すぐ少子化対策約12億円」というものがあった。この公約は有権者にどのように受け取られ、同候補の年代別得票率にどのように影響を与えたのだろうか。とくに、「教育・子育て」に期待する人の割合が多かったという「10~30代」に対してどの程度の影響を与えたのだろうか。
7. 第1軸及び第2軸の解釈について
補足3の「寄与率のグラフ」は、対応分析において各軸を解釈するためのものであるが、妥当な解釈をおこなうことは難しい。第1軸は、列ポイントのグラフから、当選可能性という要因と関係する認識や態度と解釈できるのではないだろうか。列ポイントのグラフで、2名の有力候補の列プロファイルが第1軸の形成に大いに寄与していることが示されていることからそのように考えられる。
有権者は、各候補者の当選可能性に対する予想に影響されずに投票する場合もあれば、そうではなく、当選可能性の高い候補者の中で選択を行う場合もある。第1軸は、この後者の場合の投票行動が反映されているのではないだろうか。
第2軸については、第1軸の解釈とは別次元のものを想像する必要がある。行ポイントのグラフも参照して考えると、当選可能性の認識に左右されずに候補者を選択するという投票行動の次元であろう。列ポイントのグラフでは、2名の有力候補以外の候補の列プロファイルが、また、行ポイントのグラフで、29歳以下の年齢層の行プロファイルが、第2軸の形成に大いに寄与していることからそのように考えられる。
[注]
(1) 2つの比率の差の検定を行った。
回答者数が少ないことを考慮して、18歳から29歳までを1つのグループとした。
そのグループと30歳代のグループとを比較した場合において、武内候補の得票率に差があるかどうかを通常の方法で検定してみると、「2つの比率に有意な差があります」という結論となる(検定統計量 z = -2.753、p値 = 0.00589)。
R言語のprop.test()関数を使って計算すると、「連続性の補正」がおこなわれた場合のp値は、約0.01である。
なお、武内和久候補の得票率が10代(18歳と19歳)と20代とで差があるかどうかについては、差がないという帰無仮説を棄却することはできない(四分表ととらえてフィシャーの直接確率計算法を適用すると、p値は、約0.489)。つまり、差がないという判断を採用することになる。
(2) Michael Greenacre. Correspondence Analysis in Practice. Interdisciplinary Statistics Series. Chapman & Hall CRC, second edition, 2007.
茂木 豊・文屋 俊子・三隅 譲二・佐藤 繁美「地域生活の総合的満足度の意味及び生活の質に関する質問項目との関係」福岡県立大学人間社会学部紀要 2009, Vol. 18, No. 1, 15-28
『対応分析の理論と実践:基礎・応用・展開』(Michael Greenacre著、藤本一男氏訳)、オーム社、2020年。
(3) 『対応分析入門:原理から応用まで』(Sten-Erik Clausen著、藤本一男氏の訳・解説、オーム社、2015年)の94-95ページを参照。
(4) 「絶対的にも」というのは下図から言えることである。
(5) 朝日新聞デジタル(2023年2月5日)には、グラフも統計表も記事の中には出てこない。西日本新聞の記事のように、グラフ等を示して解説してほしいものである。
「ミドル層」、「シニア世代」という表現が用いられ、ミドル層に武内候補の支持が浸透しているととらえられている。
以下で引用したように、朝日新聞社の調査によると、武内候補の得票率は「40代が52%と最も高い」という結果が出ている。一方、西日本新聞社の調査では、30代が最も高かったようだ。この点において両調査の結果には食い違いがある。ただし、西日本新聞社の調査において、30代と40代における武内候補の得票率の差(約13パーセント)は、統計的に有意ではないようだ(p値は約0.154)。したがって、両社による出口調査の結果が相互に矛盾しているということにはならないであろう。
朝日新聞社の調査で30歳代の得票率がどうだったのか知りたいところであるが、朝日新聞デジタルの記事にはグラフも統計表もないので不完全な解説である。
補足1:「読むニュース北九州」の帯グラフについて
画像検索で次のものが見つかった。
【随時更新】北九州市長選挙 投開票日・最新情報!2023年02月05日
NHKが実施した北九州市長選投票日出口調査の結果として各候補の年代別得票率の帯グラフが掲示されている。残念なことに、この場合も、各年代の回答者数がグラフに示されていない。
帯グラフに物差しを当てて読み取ると、30代の場合、武内氏51パーセント、津森氏24パーセント、その他24パーセントという得票率のようである。40代は、武内氏53パーセント、津森氏32パーセント、その他15パーセントと読み取れる。18歳・19歳は、武内氏37パーセント、津森氏52パーセント、その他11パーセントと読み取れる。70代以上は、武内氏39パーセント、津森氏45パーセント、その他16パーセントと読み取れる。
市長に当選した武内氏であるが、20歳未満、60歳以上という両端の年齢層で得票率が低く相対的に不人気であったようだ。このことは、本文で取りあげた西日本新聞社の出口調査の結果とも一致している。
この20歳未満と60歳以上の年齢層への「イメージ戦略」が、その中間の年齢層へのものと比べて効果的ではなかったということだろうか。
いずれにせよ、若者と老人とが部分的に同じような投票行動を示しているということは、興味深いことである。
補足2:FactoMineRのCAパッケージを利用して図示
上図は、Michael Greenacreの表現を用いれば、行プロファイル及び列プロファイルについての、第1軸及び第2軸の主座標値を用いた「対称マップ」(symmetric map)ということになる。本文中の「対応分析のグラフ(4)」——caパッケージの標準座標値を特異値(sv:固有値の平方根)で乗じて主座標値を算出しggplot2で作画——と比べると、左右が逆になっている。
caパッケージを利用し、行及び列の標準座標値を計算し別々に図示したものを以下に、参考のために示す。
補足3:寄与率のグラフ
以下の2つのグラフは、表6のctrの項目に対応するものである。注(3)の文献の「付録2」に掲載されているRスクリプトを利用して作成した。
補足4:当選した候補者の選挙公約
公式サイトの冒頭にメッセージとして「私は自分が北九州市の先頭に立って、この街を『稼げる街』にしたい、そして『人口100万人』の復活を何とか実現させたい、稼いだ富は次の世代へ投資したい、と考えています」と書かれている。
比較のために、落選した津森洋介候補者の選挙ポスターの一部を示す。選挙時のサイトはすでに閉鎖されていているため、自民党福岡県10区支部長山本幸三氏がツイッターサイトに投稿したもの(2023年2月1日)からコピーした。
その他の候補者の公約についてRKB毎日放送の記事(2023年1月20日配信)は、「永田氏“3つのゼロ”などを主張」、「清水氏『若者が輝くまち』を公約に」と見出しを付けて取りあげた。