見出し画像

消費者調査と統計学のすゝめ

ビッグデータ、データドリブン、機械学習など、様々なマーケティングに関わる言葉を目にすることが本当に多くなりました。データをメインに取り扱う会社にいる立場として、この上ない喜びです。しかし、その一方で消費者データの不要論者がいるのもこれまた事実です。
もちろん、消費者データが全てのマーケティング課題を解決してくれるとは言いませんが、消費者を理解することはとても大切だと信じています。
今回は、リサーチすることの重要性、統計を勉強することの重要性についてお話をしたいと思います。

リサーチはなぜ必要か?

ビジネスを進める上では、迷いが生じることは必ずあると思います。
その悩みが議論を深めることなどで、解決できるのであれば問題はないのでしょう。しかし、そのような迷いばかりではないと思います。

消費者に対して商品やサービスを作っている以上、最終的には消費者がどう思うのかという部分が分からない状態では、前に進むことが出来ないケースが生じます。

この前に進めない状態を前に進みやすくするのがまさにデータの役割です。
そして、複数ある選択肢の中からどれが一番失敗するリスクが少ないのかを見極めてくれるのもデータとしての役割と言えます。

例えば、A案、B案、C案と3つある商品案についてどれを発売すれば一番売上が見込めるかを見極め、決定しないといけない場合、データがなければ意思決定は社長の鶴の一声で決まる他、方法がありません。

しかし、リサーチを使えば、どれが成功するを決めることまでは難しくても、失敗する確率が最も低い案を選び出すことは可能になります。
あえて、「たった」という言い方をしますが、たった200万円程の消費者調査費用で、調査をせずに発売した際の、数千万~数億円規模の損失をあらかじめ回避できることもあるのです。

※もちろん「たった」なんて思っていません。1円たりともビジネスにおいては無駄に出来ない大切な予算です。

消費者に聞かなくても、社内調査でいいのでは?

消費者に聞かなくても、社内の人間も一消費者なんだから、社内調査をすればよいのでは?という声が聞こえてきそうですが、そこには大きな問題が一つ横たわっています。

会社の人たちはもはや普通の消費者ではありません。何らかの形で商品やサービスに仕事を通じて携わっており、消費者視点に加えて社員としての意見を持っているケースがほとんどです。

そのような人たちに聞いたところで、本当の消費者の意見とはGAPが生じるのは間違いありません。社内の人たちを調査することは偏りのあるデータを分析していることになりますので、本来の母集団を正確に予測できるものではないことには注意が必要です。

統計から逃げるな

調査結果を取り扱う際には、様々な統計学の知識が本来は必要となります。
しかし、実際の業務ではこれらはあまり重視されず、調査で得られた結果をそのまま解釈するケースも見かけられます。ここからは、データの見方についての一例を見ていきながら、統計を学ぶことの重要性を説いていきたいと思います。

例えば、Aという商品に対して購入意向を聴取した調査結果が以下の通りだったとします。

とても購入したい:25%
やや購入したい:35%

どちらともいえない:20%
あまり購入したくない:15%
全く購入したくない:5%

TOP2購入意向(とても購入したい+やや購入したいの系合計)は60%です。

一方でBという商品に対して購入意向を聴取した調査結果が以下の通りだったとします。

とても購入したい:25%
やや購入したい:15%

どちらともいえない:30%
あまり購入したくない:20%
全く購入したくない:10%

TOP2購入意向は40%です。

それでは皆さんに質問です。A案とB案のどちらを発売すべきでしょうか?

恐らく、統計や調査に詳しい方は「この情報だけでは分からない」とお答えになると思います。しかし、慣れない方はA案の方が20%も購入意向率が高いから、A案に違いないと答えるはずです。

実際には、何人のサンプル(標本)を調査したのかという情報と、標本誤差を考える必要があります。

標本誤差とは、

調査対象者全体の中から一部の対象者を抽出して行う標本調査の結果から、母数を推定する際に見られる標本スコアと母数との差のことである。この誤差の大きさについては、その大きさの範囲をサンプルサイズと標本スコアを元に算出することができる。 出典:マクロミルHP

我々が興味があるのは、標本(調査に回答してくれた人たち)の結果ではなく、実際の母集団(本来の世の中のターゲット)の人たちの中でその商品が売れるかどうかですよね?

母集団はとても大きな数になるので、全員に調査をすることはコスト的にも非現実的です。そのため、母集団と同じ構成になるように、100人程度の標本を母集団の中から無作為に集めてきて調査を行います。その標本から得られた結果をベースに母集団での結果を推測しています。

しかし、何百万といる母集団の結果をたった100人の結果を用いて予測するので、誤差が生じてしまいます。

その誤差を表したのが、以下の表になります。

画像1

例えば、先の調査結果の例の時、調査対象者数(標本数n)が100だったとします。

A案の結果はTOP2:60%
B案の結果はTOP2:40%でした。

表側(表の一番左側の2列)に記載されている%の中から今回の調査結果に対応する箇所を見つけます。その後、今回の調査で得られた標本数と合致する部分の数字を見ます。

今回のケースでは、A案とB案共に「9.8」をサンプリング誤差として見つけることができます。

この時、A案の結果は50.2%~69.8%の間に95%の確立で収まっています。
B案は30.2%~49.8%の間に95%の確立で収まっています。

調査結果で得られた値を中心に、前後でこれだけの幅があるということです。つまり、真の値はAの場合は50.2%~69.8%の区間に95%の確率で存在しているということを意味しています。

そして、A案とB案の区間は重なっていないことが分かるため、A案はB案に対して有意な結果となっていると言えそうです。

もし、A案とB案の区間が重なっていた場合は差が必ずあるとは言えない状態となってしまいます。調査結果をそのまま鵜呑みにすると間違った判断をしてしまうことになりかねません。

まとめ:

リサーチを行うことで、消費者のニーズを幅広く偏りなく集めることができ、マーケティング施策を考えたり、意思決定をする上で大いに役立つことは間違いないと思います。しかし、統計の知識がない状態でこれらのデータを扱うことは、後半で見たように間違った判断をしてしまう可能性もあるのです。リサーチと統計知識はマーケターにとって必須の学習項目といっても過言ではありません。

よろしければサポートお願いします!これからの記事制作に使わせていただきます。