見出し画像

NIリサーチャーコラム #39 数値を「面」で考える~平均値と中央値 %と実数 見えてくる世界は変わる~(2024年2月執筆)

執筆者: リサーチ・コンサルティング部 シニアリサーチャー S.T
※NIリサーチャーコラムでは、当社の各リサーチャーが日々の業務等で感じた事を自由に紹介しています。

1)平均値と中央値

2023年12月のコラム「日本の市場を知ろう~統計データから見る日本市場~」で、「市場を面でとらえると見えてくるものが変わる」という例を出したのですが、イメージしにくいという話題になり、今回は「どんなふうに見えるものが変わるのか」というテーマで書くことにしました。

今さらですが、「平均値」と「中央値」を正しく理解していますか?

わかりやすく説明するために、15人の現在の貯蓄額が下表のようであったとします。
(違いを見えやすくするため、極端に小さい数字、極端に大きい数値を入れています。)

平均値とは、全員の貯蓄額の合計「a 合計」を15(人数)で割ったものです。
つまりb 平均=a 合計/15(人数)で表されます。

上記の表は昇順(小さい方から大きい方へ)に並べてあるので、ちょうど真ん中の数値(8番目の数値)が中央値になります。

貯蓄0や50万円の人もいるし、中央値は120万円なのに、なぜ平均値は1,559万円になるのかというと、15番目の貯蓄額が2億円もあるからです。

中央値は貯蓄額の50%がどのあたりになるのかなので、50万円以下が〇%、51~100万が〇%・・といったデータからでも、50%がどのあたりになるのかは大よそ計算することもできます。

100点満点のテストの平均点などは、上下の幅にも限度がありますが、貯蓄額や所得、不動産価格など、上下に乖離がある場合や分布に偏りがある場合などは、「平均値」よりも「中央値」の方がより現実感のある、納得感のある数字になることもあります。

それならなぜ「平均値」を出すのかと言うと、それは「面の推計」に使うことができるからです。

b 平均=a 合計/15(人数)で計算できるので、例えばa合計がわからず、総数はわかっている場合、
b 平均×総数=a 合計 が計算できるのです。

これは「中央値」では算出することはできません。

2)平均値を使って「面」を計算してみる

そこで、前回のコラムで書いた

「30年ぐらい前の団塊の世代は、所得も多くて人数も多かったから市場が大きかった」
「今後所得が多少上がったとしても人口が増えなければ市場は急速には拡大しない」

を、計算してみます。

世帯主年齢別世帯平均所得は厚生労働省の「国民生活基礎調査」から引用しています。

「国民生活基礎調査」は層化二段無作為の抽出調査なので、代表性はあるものの、そのデータを積み上げて行っても「国民全体」の傾向を見ることはできません。

そのため、同年の国勢調査の「世帯主の年齢別一般世帯数」を掛け合わせてみます。

平均所得×その母数(大きさ)なので、全体が推計できます。

これを1995年と2020年で比較してみると、25年間で「団塊の世代」の年代がスライドしたことによる変化が、数字としても把握できます。

比較しやすくするために2020年÷1995年の数値を一番右の表にまとめていますが、

25年前と比較して

  • 70歳以上の世帯平均所得は0.88倍に下がった

  • 70歳以上の「世帯数」は3倍になっている

  • 70歳以上の「平均×世帯数」は2.66倍になっている

  • 40~49歳、50~59歳は、「平均所得」と「世帯数」は0.95倍前後で微減、横ばいともいえるが、「平均×世帯数」は0.89倍になっている

つまりは「平均値」だけでみていると、70歳以上の世帯平均所得は下がっているのですが、母数が3倍になったことで、面でみた市場は2.66倍になっているということです。

40~49歳、50~59歳では、平均所得や世帯数は微減か横ばいに見えたとしても、微減×微減はそれなりの減少になるという例です。

もちろん、市場を考えていくためには、世帯主それぞれの年代の平均収入の中身を考えていくことも重要になります。

世帯主年齢29歳以下、30~39歳では「世帯平均所得」は増えています。ただし、「平均×世帯数」は29歳以下では微減、30~39歳では微増です。

では、今の若年層は意外にリッチなのではないか?とも思えますが、「世帯主」ですから、その程度の収入がないと自立すらできないのかもしれない。

世帯平均の伸びよりも、世帯人員1人あたりの平均所得の伸びの方が大きいのは、世帯人員の数が減った(単身世帯や子どものいない世帯が増えた)ことが要因だとも考えられます。

70歳以上の世帯平均年収にしろ、恵まれた額の年金や株の配当、不動産収入などがある人もいるのかもしれないけれど、実際は子、孫までの収入を積み上げた「世帯年収」の平均かもしれません。

「こども部屋おじさん(おばさん)」「パラサイトシングル」などと揶揄された、独身の子どもとの同居世帯が増えているのかもしれません。

さらに、前回のコラムでも書いたように、高年代層は負債が少なく貯蓄額が高く、かつ教育費などの固定費が少ないと推測できるため、「高齢者が使えるお金」は25年前と比較するとこの数値以上に増えていると考えられます。

また40~49歳、50~59歳は、晩婚化にともなう出産年齢の上昇、子どもの大学進学率の上昇などを合わせて考えると、まだまだ教育費などの固定費がかかる年代であることが推測できます。

この表一つからでも、様々な情報を組み合わせていくと、その数字の持つ意味は無限に広がります。

さらに要因を検証したいのであれば、世帯構成人員や世帯形態なども国勢調査ではまとめられているので、その数値と比較することでまた見えてくるものもあるでしょう。

もちろん、年金額が少なく生きていくために働き続けなければならない高齢者、無年金の高齢者がいることも、子どもの貧困が問題視されることも事実で、平均値だけで測れない現実はあります。

ただ、このように全体を俯瞰することで、支援を必要とするボリュームが推測できるし、ボリュームが推測できれば施策の検討も現実的に考えられます。

3)%と実数で「面」を考える

次に、%と実数の見方です。

ある商品で、昨年満足度調査をしたところ、男女とも高年代層で若年層と比較して満足度が低いという結果が出ました。

そこで、「高齢者の満足度を上げようプロジェクト」を立ち上げ、1年間様々な取り組みを行い、高齢者の満足度は高まったのですが、売上は伸びるどころか減少してしまいました。

さて、なぜなのか。

そうです。

根本的な「ユーザー構成比」を無視して、元々ユーザー比率が低い高齢者層へのサービスに注力してしまったことが、ユーザーボリュームが大きい若年層の満足度を下げてしまったのです。

それで、「面」としての市場では売上が減少してしまったのです。

でもこれも、「女性60代の満足度は15%も上昇したのに!」という数値だけを見ていては気づかないということもあるのです。

これは調査のサンプルサイズを決める際にも見逃してしまうことで、各性年代を同数(すべて200サンプルなど)で調査した時の結果を見る場合などは、特に注意が必要です。

では、ウェイトバック集計すれば「全体」は面を示すのでは?と思っても、前提をちゃんと整理、理解してウェイトバックをしなければ、面は面でなくなってしまうこともあります。

例えば、ユーザーに対して調査を行ったのに、国勢調査の性年代でウェイトバックをかけてしまうと、その「面」の意味が不明になってしまいます。

4)%と実数で見え方が違う

もう一つ見え方が変わる例を。

所得についてデータを整理していると、「正規」「非正規」という雇用形態と絡めて分析されているものを多くみます。

先日、学生の方々とお話する機会があり、下図の元データの読み方についてディスカッションをしました。

「氷河期世代は非正規が多いというけれど、年代に関わらず非正規は増えている。これは世代の問題ではなく、働き方への意識の変化なのではないか」という意見を言う学生がいました。

確かに、このグラフは%で作られているので、「非正規」でこの10年ぐらい顕著に増えているのは65歳以上で、これは氷河期云々というよりも、定年後の延長雇用が増えてきたことを示すものかもしれません。

氷河期世代と言われる年齢が含まれる現在「45~54歳」のデータを過去にさかのぼっていっても、彼らは10年前に「35~44歳」だったのだから、2012年あたりの「35~44歳」のデータを見ると、確かにこの世代の非正規率は高いけれど、「正規」の率も高い。

時系列でみれば、「45~54歳」の非正規の割合は徐々に増えてはいるものの、目立つほどの増加ではないように見えます。

データ引用:総務省統計局 「労働力調査」

さて、これを実数で積み上げたグラフが下記です。

データ引用:総務省統計局 「労働力調査」

ここでざっくりと言えるのは、労働人口は増加しているのに、「正規雇用」の実数値は1990年代前半、つまりはバブルの時代に上昇しているものの、その後はゆるやかながらも徐々に減少し、やや持ち直してはきたところであること、労働人口は非正規の増加で賄われていることが明らかであることです。

このように、%と実数値のどちらで表すかで、同じ棒グラフでも見え方が違ってきます。

また、雇用機会均等法、労働者派遣法、外国人労働者に関する法律(労働基準法、出入国管理および難民認定法、雇用対策法等)の変遷をある程度把握しておくと、「なぜこの年から急に変化していったのか」の見え方もまた変わってきます。
(※法律の名称は略称・通称)

5)数字は面白い

統計データでもマーケティングのために集めたデータでも、「何が知りたいのか」「何を確かめたいのか」を考えながら、数字を見ること、加工することはとても面白いことです。

日々ニュースや新聞で見る情報、家族、友人、会社の同僚、電車の中でたまたま耳に入ってくる他人の会話などから、「あれ?」と思ったことを、数字から深堀し、分析し、納得し、予測することもできます。

ここでいくつかの例を出しましたが、同じデータであっても、あなたのアイデアで、また別の世界が見えてくることもあるかもしれません。

ほんの25年ぐらい前までは、ほとんどの統計データはすべて「本」で、数値は転記するしかありませんでした。

「デジタル化が遅れている」とは言われるものの、今では「総務省統計局」のホームページから省庁横断で探すことができますし、「e-Stat」では、データを加工してダウンロードできるものもあります。

検索エンジンをうまく使えば、どのデータにも素早くアクセスできるようになりました。

様々な変化はこのような数値に現れ、変化には必ず「理由」があります。

日々締切に追われる業務の中でも、その楽しさを感じながら、SNSやネットニュースだけではなく、自分自身で情報やデータを探しに行き、より広い目で現象をとらえられるリサーチャーに育っていって欲しいと、若い仲間たちを見ながら、数字の海を楽しく泳ぎ続けてきた数字オタクおばさんは心から願っています。

そして、そのようなリサーチャーが育っていくことが、クライアント様の課題を解決し、ひいてはより社会に役立つ、喜ばれる商品やサービスを提供していくことにつながるのだと信じています。

----------------------------------

執筆者プロフィール
リサーチ・コンサルティング部 シニアリサーチャー S.T

工学部工学研究科博士課程都市・交通計画専攻で道路計画、交通計画、都市計画を学ぶ
公共系シンクタンク、大学研究所では総合計画・各種計画・施策の立案、住民参加型まちづくり事業の推進を担当
高速道路建設の経済効果等を研究する中で、「満足度をお金に換算して経済効果に計上できないのか?」と思い立ち、マーケティング理論に出会う
39歳でマーケティングリサーに会社に転職
その後は各種公共施策の立案と並行し、商品開発、市場分析等を担当
海外調査(グローバルリサーチ)については、気づいたら16か国延べ40都市で50以上のリサーチを実施
定量調査のみではなく、定性調査のモデレーター、ワークショップのファシリテーターなど、定性調査の実施・分析も担当
8年前から現職