
国民民主党の政党支持率の幅(不確かさ)を計算するとどれくらい?
はじめに
テレビを見ていると「国民民主党の支持率は、5.1ポイント上がって7.4%となり、野党で2番目に高くなった」というニュースがありましたが、これってどれくらい本当なのでしょうか?世論調査は、ころころ数値が上がり下がりするので、国民民主党の支持率が現状どれくらいの幅を持っているのか、今回はそんなことを考えてみます。

世論調査のズレ
今回はNHKの世論調査を参考にします。NHKの世論調査は下記の仕様で行われているようです。
NHKは11月15日から3日間、全国の18歳以上を対象にコンピューターで無作為に発生させた固定電話と携帯電話の番号に電話をかける「RDD」という方法で世論調査を行いました。
調査の対象となったのは、2905人で、42%にあたる1213人から回答を得ました。
つまり、乱数で発生させた番号に電話かけて、およそ1000人に回答してもらったものを世論調査としているようです。いわゆる併用式RDDですね。ちなみに、NHKの世論調査の歴史やRDD調査については下記が勉強になりました。
どの方法論も完璧ではないにせよ、無作為抽出によって「有権者の縮図」、いわゆる世論を調査をしようと試みているわけですが、サンプルの代表性が偏らないようにデータを取得するのには多大な困難が伴います。
余談ですが、欧米ではMRP(マルチレベル回帰事後層化シュミレーション)という統計的な方法で世論調査の精度を上げようとする試みもあるようですが、最近の選挙の度に外れまくる様子をみるとうまく言っていなさそうです。
さておき、今回のNHKの世論調査が正しいとして、国民民主党の支持率はどれくらいなのか?ベイジアンアプローチで調べていきましょう。

政党支持率は多項分布がら抽出されたサンプルと考えることができるので、多項分布を使用します。また、多項分布の事前分布として、共役事前分布であるディリクレ分布を使用します。
共役事前分布を利用することで、多項分布とディリクレ分布の事後分布を解析的に求められるので、事後分布から乱数を生成してシュミレーションします。多項分布とディリクレ分布については下記の確率分布です。Wikipediaより拝借します。


自民、立憲、維新、公明、国民は11月の政党支持率を利用し、その他はまとめて1つとします。10月の衆議院選挙の1週間前の世論調査の結果を事前情報として反映させます。そこから得られる事後分布を使って、11月の政党支持率をシュミレーションします。

国民民主党の11月の政党支持率と同じく、7.04%を中心にした分布が得られています。ここから国民民主党の支持率はどれくらいなのか?幅を計算します。
その結果がこちらです。国民民主党はDPFPなので、95%の確率で、政党支持率は5.9%から9.2%の間にあることがわかります。現時点では立憲民主党の方が政党支持率は高いようですね。維新、公明は幅を考えても、国民民主党が抜いてそうですね。
- LDP : 31.8 % (29.0 - 34.7)
- CDP : 11.1 % (9.2 - 13.1)
- Ishin : 3.7 % (2.6 - 4.9)
- Komei : 3.5 % (2.5 - 4.7)
- DPFP : 7.5 % (5.9 - 9.2)
- Other : 42.4 % (39.4 - 45.5)
おわりに
今回のNHK世論調査のデータを基に、国民民主党の支持率の幅をシュミレーションしてみました。世論調査が正しければ正しく有権者の縮図となっておいれば、国民民主党の政党支持率は95%の確率で、約5.9%から9.2%の範囲にあることがわかりました。
また、今回扱ったモデルは非常にシンプルなモデルなので、今後は更に発展させた「世論調査を合成するモデル」についても、今後、noteに書いていこうと思います。