顧客データを分析するときは、平均値だけのデータで判断すると危険!
こんにちは。私は、デジタルマーケティングの会社で働いている自称マーケターです。最近のお気に入りは、海老入り揚げせんべい。香ばしくてサクッとしてて、少し甘みもある。和風でありならがらコーヒーにもぴったりなお菓子です。
このnoteではコーヒーカップを片手に、マーケティングの仕事で大事にしていることや、データを眺めて思ったことを自由につぶやいています。今回は、データは「顧客データを分析するときは、平均値だけのデータで判断すると危険!という話」をお届けします。
マーケティングの仕事をしていると、「平均値」を使ってデータを読み解くことがよくあります。しかし、平均値だけで判断してしまうと、実態と印象がことなる場合もあることを前回の記事では「結婚年齢」を例にしてみてみました。
今回は、もう少し単純化したグラフでみてみましょう。次のグラフは、すべて平均値は「45歳」です。印象はだいぶ異なりますね。
一番左のグラフAは富士山型、真ん中のグラフBは長方形、一番右のグラフCはつま先が右を向いているブーツのような形になっています。
平均値の「45歳」だけで比較すると、「年齢層は同じ」と判断してしまいがちですが、グラフ化してみると、実際の年齢の分布はだいぶ異なる、ということがおわかりいただけると思います。
真ん中のグラフBは、現実社会ではあまり見ないグラフです。日本ではそもそ団塊世代、団塊ジュニアの人数が多く、年代別の母数が異なります。
また、生物学的に考えて、年齢により体の能力や性質それらに起因するお悩みは異なってくるため、どの年代も同じように分布する、というグラフはなかなか見かけないでしょう。
「年代別に人数制限をしている文化講座の参加者分布」など入口で制限しない限り、このようなグラフにはならない気がしています。今回は「平均値」だけで分析しようとすると、実際の顧客層を見間違えてしまう例として、あえて用意したグラフになります。
一番左のグラフAと一番右のグラフCは現実社会でもよくみるグラフだと思います。
グラフAは、40代が一番多く、ボリュームゾーンは40~60代です。例えば、40代をメインターゲットとした日本国内向けファッションブランド顧客の年齢層をあらわしたグラフ(年代別顧客数)は、このような形になるかもしれません。
それなりにトレンドは意識しているけど、シルエットは中年以降向け。メインターゲットの顧客数が一番多いけど、デザインが好きであれば、ターゲット層から外れる若年層、高齢者層も一定数顧客を獲得できている。
平均値である45歳前後、40~50代が一番多いものの、それ以外の年代の人数は全体の58.3%つまり、このブランドをアピールするときに、40~50代むけばかりを想定した内容をアピールしてしまうと、約6割の顧客からそっぽを向かれ、売上が下がってしまうかもしれません。
グラフCは、30代~50代が圧倒的に多いグラフです。例えばお高めのアンチエイジング美容液の購入者の年代別グラフ(年代別顧客数)はこのような形になるかもしれません。シミやしわは20代まではあまり気にならず、収入も少ないことが多いため購入者数は0。現役のころは高額美容液を購入できた人も、年金生活に入ると購入できなくなり、60代以上の購入者数は減ります。
グラフAと異なり、40~50代の比率は全体の59.7%。30代の顧客は意識すべきものの、それ以外の年代層をあまり考慮せずに販促施策を実施しても問題ないかもしれません。
「平均値」だけを見て判断することが危険だ、ということはおわかりいただけましたでしょうか。平均値は、数字単体だけではなく、グラフ化してみると実態がよくわかる例をあげてみました。比較対象が多く、グラフでの比較が難しい場合は、「中央値」や「最頻値」もあわせて確認すると、「平均値」だけ見るより対象を明確に把握・分析することができるのでおすすめです。
次回のテーマは、1.000円のジーンズは高いのか安いのか?を予定しています。興味があったら、また是非おつきあいください。