アメリカ大統領選挙における異常な数値について

11月3日にアメリカ大統領選挙があった。近年稀に見る大激戦であった。多くのメディアはバイデン氏の勝利を伝えているが、正式な結果はまだ出ていない。11月7日の時点で、現職のトランプ大統領が7039万票を得たのに対し、バイデン候補が7456万票を得てリードしている。アメリカの大統領は、実際の得票数では決まらない。州ごとの得票数によって、その州の力の大きさに応じた数の「選挙人」を獲得し、獲得した「選挙人」の数が過半数を超えた候補が大統領に選ばれる。したがって、一般投票が少なくても大統領に選ばれることもありうる。2016年はまさにその形でトランプ氏が大統領に選出された。

大統領選の仕組みと現状

トランプ、バイデンの両候補の得票数が非常に近い州がいくつかある。このような州を激選州あるいは重要州と呼ぶ。「選挙人」の多い重要州は、大統領選出に重要な役割を果たす。近年では「オハイオの法則」というのがある。これはオハイオ州で勝利したものが大統領に選出されると言うジンクスである。実際、1984年から2016年まで、オハイオで勝った者が大統領に選ばれている。今回のオハイオではトランプ氏の当選確実が出ているので、「オハイオの法則」が成り立てば、トランプ氏が大統領に選ばれるはずである。

普通の選挙では候補者の得票数の差が一定の数以内であれば、投票を数え直すと言うルールがある。今回は、ペンシルベニアやジョージアで再集計が実施されている。ロイターによれば、大統領選での再集計は珍しいことで、再集計は手書きなどの判別しにくい投票をもう一度確認する作業が中心になるので、再集計しても結果は変わらないことが多いらしい。2016年のウイスコンシンでは再集計の結果、100票ほど変わっただけで、大勢には影響がなかった。

ところが今回は、トランプ陣営が大規模な不正があったと訴えているので、普通の再集計とはちょっと違う。トランプ氏は当初より、郵便投票による不正が多発すると主張していた。また、ある州では集計ソフトが別の候補者を数え上げた、別の州では投票用紙が多数捨てられていた、また別の州では死者が投票した、などなど。


異常な数値

不正が行われればどこかの点で辻褄が合わなくなり、統計的にはちょっとおかしな数値が出てくることが多々ある。異常な数値がいつも不正によるものとは限らないが、その原因を探ることで、本質に迫ることができる。今回は、アメリカ大統領選における様々に異常値について調べてみる。


ちょっとおかしな数値は統計にしばしば現れる厄介なものである。一般的にはデータをとった時、とある値に近い数字が多く集まるものだが、それから大きくかけ離れた数字、グラフにすると離小島のような値がが得られる時がある。これらの値のうち、間違って得られたことが判明した者を「異常値」といい、間違っていないけれども、かけ離れている数字のことを「外れ値」と呼ぶ。英語では「異常値」も「外れ値」もともに「outliers」と訳されるが、最近の教科書では「異常値」を「abnormal value」としているものも多い。

とある大学で学生の年齢のデータを取れば、通常は18歳から24歳までの間に収まるが、中には40歳というのもいる。しかしこれは、社会人入学などで実現可能なので「外れ値」である可能性が高い。一方、12歳は「異常値」である。日本の法律では12歳で大学入学はできないからである。

「異常値」も「外れ値」も平均などの統計をとると、そのデータの持つ本来の特徴とは違うものとなる。「異常値」は見つけ次第修正または削除する。「外れ値」は目的に応じて、削除したりしなかったりする。したがって、ちょっとおかしな数字を見つけたときは、その数字がどのようにして得られたのかを、調べ直す必要がある。


投票率のジャンプ

選挙では、誰が勝ったのかということの他に、投票率が話題になる。投票率は全有権者に対する総投票数の割合である。有権者は18歳以上のアメリカ人で、英語では Voting Age Population あるいは VAP と訳される。次のグラフは、1984年から2016年までの大統領選挙における、有権者数(緑)、投票数(青)、投票率(淡橙)の推移を表している。データはFederal Election Commission のレポートの数字を利用した。有権者数はほぼ直線状に増えている。投票数もやや上下はあるが大まかに直線的に増えている。投票率は54%±5%の中に収まっており、ほぼ一定であると言える。

投票率


このような時、統計学では最小二乗直線を使って、2020年の有権者数と投票数を予測するのが王道である。すると、予想有権者数 は 2億5207万人、予想投票数が 1億4289万票である。ここから計算される予想投票率は 56.69% である。

有権者数は United States Election Project によれば、2020年11月で 2億5760万人である。この値は、国勢調査の結果をもとに計算されているので、最小二乗直線による予想有権者数よりも正確であると考えられる。しかし、その差は約550万人、率にして2.2%ほどである。統計学ではこのくらいの差ならあまり変わりがないと判断することが多い。

実際の有権者数(緑)と最小二乗直線による推定値(深緑)をグラフにすると以下のようになる。両者がほぼ一致していることがわかる。

有権者数推定

一方、総投票数は、ロイターの報道をもとに計算すると、1億5920万票になった。この値は最小二乗直線の予想値よりも1600万人以上多い。率にすれば10%強になる。これはちょっと無視できない数字である。

投票数推定


実際の投票数(青)と最小二乗直線による推定値(濃青)をグラフにすると上のようになる。2020年の実際の投票数が最小二乗直線よりもかなり離れていることがわかる。2020年の投票数を「外れ値」と認定する者も出てくるかもしれない。また報道では、まだ郵便投票を開票していないの州がいくつかあるという。今年の郵便投票数は例年よりもはるかに多く、6500万人以上が郵便投票をしたと推定されている。郵便事情で投票日の11月3日以降に配達される場合が多く、総投票数はさらに増えると予想される。

また、投票率は 61.80% 以上になる。この数字も予測値からは5ポイント以上高い。いくつかのメディアは投票率が66%くらいにまで上がると予想していた。

登録者数のジャンプ

日本では、選挙の時、住民票の住所に投票券が自動的に送られてくるが、アメリカには住民票がないので、投票券をもらうために事前に登録しておく必要がある。2020年は11月7日の時点で登録された有権者数は2億1308万人であった。有権者の総数は2億5760万人なので、実に80%以上が登録したことになる。

アメリカ国勢調査局は、有権者と登録された有権者(英語では Registered Voters)を区別している。次のグラフは過去6回の大統領選挙での有権者数、登録された有権者の数とその割合である。2016年までは有権者数の増加と同じくらいのペースで増えていた登録された有権者の数が2020年に突如跳ね上がっていることがわかる。登録された有権者の数の割合も64%前後と安定していたが、2020年は20ポイント近く上がっている。2020年の登録された有権者の数も割合も、外れ値であると考えられる。

画像4

今回の選挙は注目が高かったので、登録が増えたという考え方もあるが、ここは、登録に何かあったのではないかと疑うべきである。

アメリカでは選挙権は、アメリカ国籍を持ち、重罪の刑に復しておらず、精神状態が健康な者に限って与えられる。VAP の数字は全ての18歳以上のアメリカに住んでいる者の数なので、真に選挙権を持っている者の数ではないではない。真に選挙権を持っている者は、Voting Eligible Population あるいは VEP と訳される。VEPは皆選挙登録をすることができるが、VAPでは登録をできないものもいる。

Federal Election Commission はVAPの数字を用いているので、ここではVAPを用いた。United States Election Project によれば、2020年11月のVAPは2億5760万人であるが、VEPは2億3925万人で、1835万人の差がある。VEPを用いると、登録した者の割合は90%に、投票率は66.7%になる。後者の数値はメディアが予想していたものと同じである。


矛盾その1:二重登録と死者の登録

ここまで投票率や登録率が上がると、色々とおかしな数字が出てくる。

選挙直前にアメリカのテレビ局のFOXは、デトロイトでは
⑴ 4788件分の二重選挙登録、
⑵ 選挙登録者は有効な選挙権を持つものよりも3万2519人多い、
⑶ 2503人分の選挙登録は死者のもの、
⑷ 登録者の一人は1823年生まれ、
であったと報道した、という記事が次のテレビ画面の画像とともに、SNS上に出現した。

画像5

すべての項目で異常値を示している。これに対し、不正が行われているとSNS上で色めき立ったが、Buzzfeed は11月5日の記事(https://www.buzzfeed.com/jp/kotahatachi/baidenni1823mareno197gaharidemoha)で、件の画像は2019年12月のもので、とある市民団体が政府を訴えるために用いたもので、大統領選とは関係ないと報道している。⑷の1823年生まれは誤植で、⑶の死者の登録は定期的に名簿をチェックして排除しているそうである。また、⑴の二重登録も修正されているそうである。しかし、⑵については修正されたのかどうか言及されていない。そもそも、これらの数字が訂正されなければ、引き続き大統領選でも使われるので、「大統領選とは関係ない」というBuzzfeed の認識はおかしい。


矛盾その2:実際の投票数が登録した有権者数よりも多い

実際の投票数が登録された有権者数より多かった、という記事も見られる。このようなことは現行の制度上あり得ないので、異常値である。BBCは、11月6日の記事(https://www.bbc.com/japanese/features-and-analysis-54835283)の中で、次のように書いている。

「速報:ウィスコンシンでは登録された有権者より投票の数が多い。登録有権者の総数: 3,129,000。総投票数:3,239,920。これは直接的な不正の証拠だ」というツイートが出回った。
(画像は省略)しかし、この登録有権者の人数は古いデータだ。11月1日時点の最新人数は、368万4726人だった。ツイートそのものは削除されたが、フェイスブックやツイッターではいまだにツイートのスクリーンショットが広く共有されている。

登録は選挙当日でもできるので、登録有権者数はさらに増えたであろう。

11月7日に、Jack Hikuma 氏が Twitter に、週別の、2020年の登録有権者数と大統領選の投票数の表を、「皆ある法則に気がつくかな」というメッセージとともに投稿した。この表によると、アメリカ50州のうち、15州で登録された有権者数が実際の投票者数を上回っている。この15州のうち、9州でバイデン 氏がリードをしている。この表の数字も古いデータが使われていると反論されている。

BBCの記事のツイートや Hikuma 氏の表に書かれている登録した有権者数の数字は、下3桁が000なので、どこかの選挙サイトの出した、過去のデータからの推定値であると考えられる。

しかし、この二つの記事からも、登録された有権者の数が予測値よりも篦棒に多いことがわかる。

次の表たちは、World Population Review が発表した、州ごとの登録した有権者数の数字と、Hikuma 氏の表に書かれている登録した有権者数の数字と、それらの比較を表したものをまとめたものである。Hikuma氏の主張通りに、何か法則が見られないかと、重要州であるかどうか、赤い(共和党支持)州であるか青い(民主党支持)州であるかどうか、11月7日のロイターにおける選挙速報結果、11月11日のFirebird氏の最新の選挙速報結果も追加した。

画像6

画像7

Hikuma 氏の有権者数は、過去のデータからの推定値と思われるので、「%増分」は推定値よりも何%登録者が増えたかを表すと考えられる。アメリカ全体の平均は40%増しであった。ワイオミングを除いて、全ての州で2桁%増になっている。アラスカが77%増、コロラドが60%増、ハワイ、ニュージャージー、ニューヨーク、ロードアイランド、が50%以上の増加になっている。アラスカを除いて、全てバイデン支持州であるところが興味深い。また、半分以上の州で発表日が11月1日以前のため、登録された有権者数は、さらに増えるであろうと予想される。

アメリカの州は過去の大統領選挙結果によって、民主党支持州(blue)、共和党支持州(red)、スイング州と分類ができる。スイング州は、やや民主党より(light blue)、やや共和党より(light red)、中立(neutral)の3つに細分できる。州別登録有権者数の表に分類が書かれている。また、どちらの候補が勝ったのかでも、分類ができる。次の表は、支持政党別及び勝利者別の分類である。

画像8


青い州、つまり民主党の支持州では、40%増しを上回っているが、共和党の支持州は平均以下である。スイング州や重要州はやや多めの傾向がある。やや共和党よりの州が特に高い。また、バイデン氏が勝利あるいは優勢な州で、登録者増がアメリカの平均よりも多い。

Firebird 氏のツイートによる未確定州は、アリゾナ(31.24%)、ジョージア(49.54%)、ミシガン(49.04%)、ネバダ(42.63%)、ペンシルベニア(40.54%)、ウィスコンシン(17.76%)である。(カッコ内は有権者数の増分)これら各州は、ロイターではバイデン氏勝利あるいは優勢であったものばかりである。これらの州では、有権者登録がいまいち足りず、バイデン票が意外と伸びなかったということも考えられる。

矛盾その3:登録した有権者数が実際の有権者数よりも多い

アラスカはトランプ支持州であるが、登録した有権者数がその予想値の77%増しと際立って高い。ところで、予想値は人口の70%程度になる。70%の77%増しといえば、124%である。つまり、アラスカの登録した有権者数は人口よりも多いことになる。この数字はあり得ない。異常値である、

次の表はWorld Population Review の登録有権者数の数字と、United States Election Project の 18歳以上人口(VAP数)とを比較したものである。18歳以上人口の右隣の列が18歳以上人口に対する登録有権者の割合である。100%を超えているところが、18歳以上の人口よりも、登録された有権者の数の方が多い州である。アラスカ、ケンタッキー、デラウェア、ミシガンの4州が該当する。登録有権者数が18歳以上の人口を超えるというのも通常起こり得ないので、異常値である。激戦州でもあるミシガンでは、不正の疑いがあると言われているが肯ける結果となった。ミシガン州は早急に調査を行わなければならない。11月7日のロイターはミシガン州ではバイデン氏の勝利を伝えたが、11月10日の Firebird 氏のツイートでは「未確定」に変更されている。

画像9

画像10

ところで、真の有権者(VEP)の数は18歳以上人口よりも少ない。真の有権者数と真の有権者数における登録有権者数の割合を、上の表に追加してある。割合が100%を超えているところが、真の有権者数よりも、登録された有権者数の方が多い州である。先の4州に、アラバマ、ノースダコタ、ニュージャージー、ロードアイランドが加わる。

また、登録された有権者数を11月1日以前に発表してる州は、ここに挙げた数値よりも増える可能性があるので、90%以上の割合になっている州も、登録した有権者数が真の有権者数を上回る可能性がる。コロラド、フロリダ、ジョージア、インディアナ、メーン、メリーランド、マチューセッツ、ネブラスカ、ニューヨーク、オレゴン、ペンシルベニア、バーモント、バージニアが該当する。このうち、フロリダ、ジョージア、ペンシルベニアは激戦州である。ジョージア、ペンシルベニアでは再集計が行われている。

次の表は、支持政党別、勝利者別の分類である。

画像11


真の有権者に対する登録者数の割合は、民主党支持州及びスイング州が平均より高く、共和党支持週で低い。バイデン支持州の方がトランプ支持州よりも高いが、未確定州が一番高い。このことから、余計に増えた登録者はバイデン氏の方に多く投票したと考えられる。だから、未確定州では、一時期バイデン氏の勝利が伝えられたのではないだろうか。

終わりに

投票数の方が登録有権者数よりも多いという矛盾に対しては、登録有権者数が増えた、という説明がなされた。しかし、これは登録した有権者数が実際の有権者数よりも多いよいう新たな矛盾を生み出した。これに対する説明は今のところ聞かれない。考えられる理由としては、転居や死亡により本来消去すべきであったがしていなかったことが挙げられる。FOXニュースでもそのように伝えていた。しかし、すでに投票用紙は全ての登録者に配送されている。宛名不明で政府に戻されていれば良いは、誰かが勝手に受け取って、それをあたかも自分の投票のように使うこともできる。死者の住所氏名はローカル新聞に載るので、たやすく調べることができ、その家の人が気がつく前に盗ってしまうと聞いたことがある。家の人は、故人に投票用紙が来ないのは当然としか思わないらしい。郵便局の人間が関わっていれば、もっと簡単にできるであろう。また転居者の情報は郵便局が持っている。

もう一つ考えられる理由に、最近急激に人口が増えたから、というのがある。それなら、なぜ急激に人口が増えたのかも説明すべきである。

嘘をつくと、ある部分ではうまく辻褄があったとしても、別の部分で綻びが出てくる。いろいろな統計を丹念に見ていくと、おかしな数値がちらほら出てくる。


この記事が気に入ったらサポートをしてみませんか?