見出し画像

【要約&実践】統計学が最強の学問である

どうもー、消費財メーカーのマーケターとして働くmotuです。
マーケティングに関する書籍の"理解"から"実践"への架け橋となる記事を投稿していきたいと考え、活動しています。

書籍の内容を"実務"で活かすことができるよう、要約・体系化していくので、ぜひご覧ください。
それではやっていきましょう!

書評

【再現性】   ★★★★
【面白さ】   ★★★
【おすすめ度】 ★★★★

私の記事では、上記3項目を5点満点で評価しています。
再現性は、筆者が自身の成功(失敗)を体系化して、私たちでも実践できるような形のノウハウとして提供しているかで評価しています。
面白さは、純粋に書籍としての面白さで、読みやすさなども考慮して評価しています。

今回紹介するのは、西内啓氏著書の「統計学が最強の学問である」です。
この書籍からは、統計学の基本的な考え方や活用方法について幅広く学ぶことができます。中西達夫氏、畠慎一郎氏著書の「武器としてのデータ分析力」と併せて読むことで、マーケティングで必要となる統計の基本的な考え方を身に着けることができるのでおすすめです。

それではやっていきましょう!

統計分析

統計分析において重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点。ビジネスにおける具体的な行動につなげる必要がある。

データをビジネスに使うための3つの問い
①何らかの要因が変化すれば利益は向上するのか
②そうした変化を起こすような行動は実際に可能なのか
③変化を起こす行動が可能だとしてその利益はコストを上回るのか

以上3つの問いに答えられた時点で初めて、統計解析に従って新たなアクションを取っていく。

また、統計分析によって、「自社の商品を買ってくれる人とそうでない人」などの違いを見つけ出すには以下の2点が重要である。

①適切な比較を行うこと
「目指すゴールを達成したもの」と「そうでないもの」の違いを比較する。直接的な利益、あるいはそこに至る因果関係の道筋が明らかな何か。
②ただの集計ではなくその誤差とP値についても明らかにすること
カイ二乗検定

このとき、直接的な利益、あるいはそこに至る因果関係の道筋が明らかな何か、を解析していくことが重要である。

また、データの取り方について考えることも重要である。最も強力な手法は、「ランダム化」である。ランダム化比較試験をすることで、人間の制御しうる何者についても、確率によってその因果関係を証明することができる。
一方で、ランダム化には3つの限界がある。

①現実の壁
1度きりのチャンスや数回程度のチャンスしか与えられないものを取り扱うことができない
②倫理の壁
有害なものや明らかに不公平なものを取り扱うことができない
③感情の壁
何か嫌と実験に参加する人が思うことを止めることはできない

以上のようなランダム化の限界に対して、①ケースコントロール、②回帰分析、の2つのアプローチができる。

①ケースコントロール分析

同様と考えられるグループ内で層別解析する。調査項目以外の性別、年代、社会階層、居住地域といった条件をそろえて、男女別や年代別で区切ったグループごとに比較する。

②広義の回帰分析(一般化線形モデル)

データ間の関係性を記述する、あるいは一方のデータ(説明変数)から他方のデータ(結果変数)を予測する数式を推定するのが回帰分析の考え方。バラつきは生まれるが、たまたま得られたデータから計算された統計量がどの程度の誤差で正しい値を推定しているかを数学的に整理することで、ランダム化に頼ることもなく、データの取り方を工夫してケースコントロールすることもなく適切な判断ができる。よって、マーケティングの実務で幅広く活用されている。

以下の表のように、変数に応じて分析手法を使い分ける。

出典: 統計学が最強の学問である

例えば、男女別の違いで顧客1人当たりの売り上げが異なるかを分析したいときは、説明変数が2グループ間の比較、結果変数が連続値であるため、それぞれの平均値を記述しt検定によって得られた「この平均値の差は誤差の範囲といえるかどうか」というp値や信頼区間を示す。

このとき、以下のことに注意する。

・何カテゴリーかに分類される結果変数の場合も、二値として扱うか連続値として扱う。
・重回帰分析における、複数の回帰係数は「お互いに相乗効果がなかったとすれば」という仮定のもと、説明変数が結果変数にどの程度の影響を与えるかを示している。相乗効果があることで発生する問題は、傾向スコアを用いることで解消する。
・ロジスティクス回帰は、0か1かという二値の結果変数を変換し、連続的な変数として扱うことで重回帰分析を行えるようにしている。このとき、回帰係数はオッズ比(約何倍そうなりやすいか)で示される。

以上で扱った広義の回帰分析は、「すでに目的となる数字(結果変数)があって、その数字の改善、悪化に影響を与える要因を特定したい」ときに使う。

反対に、因子分析やクラスター分析などは「データはあるけれど、何をしたらいいのかわからない」ときに使うため、予測に役立つ。一方で、回帰分析は予測モデルから今後何をすべきか知ることに役立つ。

最後に、マーケティングの実務で実際にどのように回帰分析を利用するかに関しては、森岡毅氏著書の「確率思考の戦略論」をおすすめしておく。

以上です。長い文章にお付き合いいただきありがとうございました。
本日紹介した書籍は以下のリンクにまとめてあるのでぜひチェックしてみてください。また次回!

この記事が気に入ったらサポートをしてみませんか?