見出し画像

【有料級】正しくデータを見る力を身につけよう!webアンケートでの統計処理の仕方

アンケートの統計処理ってどうやるの?って思っている人がいそうなので、
今日はwebアンケートでの統計処理(ウェイトバック)の方法を説明します。

もし、クラウドソーシングなどでアンケートをしていて、この処理をせずにそのまま分析しているとしたら、もしかしたらそのアンケートで意思決定を行っているのがうまくいっていない原因かもしれません

webアンケートのモニタは歪んでいる

みなさんは、まずアンケートの分析をみた時に、そのモニタを正しく理解していますでしょうか?アンケートのモニタに答えるのは、どのような人だと思いますか?

アンケートはポイントをもらえるから答えるというのが多いと思います。つまり、webアンケートのモニタは収入的には少し低い人が集まっていて、お金を持っている30-40代の労働世代が少し少なくなるという傾向があります

傾向としては、主婦やシニアが多くなり、既婚者が増えるというの傾向があります。

そして、これがクラウドソーシングなどでアンケートをとるともっと歪んだ回答者の構成になることが考えられます。

これらを統計的に補正して、アンケート調査を使って、正しく市場調査をしてくれるのがリサーチ会社です。

ただ、調査会社に依頼すると、結構高い金額を取られます。相場としては数十万円から数百万円になります。

市場調査やアンケート調査をしたいけど、そんな払えないよって声が多いと思います。

今日は自前で安くやるために、統計的補正(ウェイトバック)のやり方を紹介できればと思います。

統計的補正(ウェイトバック)のやり方

まず、人口構成として、元にするデータを紹介します。政府データが良いと思います。最新の人口統計を利用します

こちらをダウンロードします。エクセルでダウンロードしてください

ダウンロードのデータに上記の部分があり、これが正しい日本の人口構成になります。この構成になるように、アンケートの回答に重み付けをしてアンケートデータを見る必要があります。

ここで、より正確にやりたい人向けにお話しすると、webアンケートはインターネットが使える人でないと答えられないというのがあります。上記はインターネットができない人も含め他人数なので、インターネットが使える人で構成を考えるのがより正確です。

(2023年時点では、インターネットを使えるのが当たり前なので、そこまで気にしなくて良いですが、スマホ普及前は、考慮すべきポイントでした。)

そこで、各年代のインターネット利用率を上記の人口に考慮するという作業をします。各年齢のインターネット利用率は以下政府が調査しております。

このデータになります。

以下、インターネットの利用率が出ているので、それを人口にかけて、インターネット人口を算出します

私の場合は、別のエクセルに、人口統計とインターネット利用率の必要な数字だけを取り出して、新しいエクセルで下記のように計算させて出しています。
また、アンケートでは10歳きざみで統計処理をすることが多いので、まとめてしまっていたりします。

これが正しいwebアンケートで見るときの人口構成になります。この構成になるようにアンケートデータを補正します。

アンケートデータの補正

では、アンケートデータを補正していきます。まず、アンケートが以下の回収だったとします。合計1300人へのアンケートです。

これを本来、上記の政府が出している日本人口の構成だったとき1300人はどのような人数になっているべきかというと

このような人数構成になっているのが正しいです。どうやって計算したか?というと、現在、インターネット人口は約1億人います。それをもし1300人だったらという計算をしました。

これで、本来あるべき人数が出てきます。では、アンケートでの回答を一人としてカウントするのではなく、例えば、10代の女性であれば、0.91として数えるようにすれば、正しい統計補正ができるようになります。

アンケートの統計補正での集計の仕方

これをどのように使うかというと、まだここは原始的なのですが、エクセルのvlookupでアンケートのローデータにくっつけて、ピポットテーブルで集計するというやり方をしています

(良い方法を知っている方がいたら、教えてください。ちなみに調査会社は専用のツールなどを使ってやっています)

裏技

ここで怠け者であるYKが考えた方法をお伝えしたいと思います。上記の補正は、以下で紹介した、年代別などの分析をするときに必要なのですが、そこまで細かいクロス集計をしないよーって人は、もっと簡単です。

例えば、アンケートで1000人集めるとしましょう。先ほどのエクセルを使って、合計が1000人になる場合の人数構成を出すと以下になります。

アンケートの調査には割付機能というのがあります。割付機能というのは、どの年代で何人回答したら、それ以上その年代からは回収しないという機能です。Freeasyさんでは、以下のように設定できます

それを人口構成に合わせて、設定すれば自動的に正しい人口構成でアンケートが回収されます。
(機能として、人口構成割付機能がありますが、インターネット利用率を含んでいない場合があり、その場合60代の回答が多くなります。シニアをターゲットしている商品でない場合は、余計な回答が多く含まれて、費用の無駄になるので、YKはインターネット利用率を反映させたものを推奨しています)

という形で、簡単に、正しい統計処理がされたアンケート調査を実施することができます。

まとめ

いかがだったでしょうか?自分でもできるかもと思った方もいるのではないでしょうか?

今回、統計処理に使ったエクセルは、用途をお聞きし問題がなければ、以下のLINEからお渡しすることが可能です。

必要な場合は、「ウェイトバックのエクセルが欲しい」お声がけいただければと思います。

ちなみに、裏技的な方法は、あくまで初心者向けで、本当に価値のあるプロダクトを世の中に出そうと思った場合は、年代別の分析やもっとユーザーの利用度に応じたニーズの違いなどの高度な分析が必要です。

もっとちゃんとアンケート調査をしたいと思ったら、上記のLINEで相談も可能ですので、お声がけいただければと思います。

ぜひ、アンケート調査を活用して、良いプロダクト開発や良い記事をかいてもらえればと思います。

引き続き、よろしくお願いいたします。


この記事が気に入ったらサポートをしてみませんか?