見出し画像

【初心者向け】データ分析を学べるおすすめ本

どうもー、消費財メーカーのマーケターとして働くmotuです。
マーケティングに関する書籍の"理解"から"実践"への架け橋となる記事を投稿していきたいと考え、活動しています。

書籍の内容を"実務"で活かすことができるよう、要約・体系化していくので、ぜひご覧ください。
それではやっていきましょう!

書評

【再現性】   ★★★★
【面白さ】   ★★★★
【おすすめ度】 ★★★★

私の記事では、上記3項目を5点満点で評価しています。
再現性は、筆者が自身の成功(失敗)を体系化して、私たちでも実践できるような形のノウハウとして提供しているかで評価しています。
面白さは、純粋に書籍としての面白さで、読みやすさなども考慮して評価しています。

今回紹介するのは、中西達夫氏、畠慎一郎氏著書の「武器としてのデータ分析力」です。この書籍からは、統計学の基本的な考え方や活用方法について幅広く学ぶことができます。西内啓氏著書の「統計学が最強の学問である」と併せて読むことで、マーケティングで必要となる統計リテラシーの基本を身に着けることができるのでおすすめです。

「武器としてのデータ分析力」が活用方法によって書かれていて、「統計学が最強の学問である」は考え方によって書かれています。個人的には、「武器としてのデータ分析力」を読み実践のイメージをつかんだうえで、「統計学が最強の学問である」で理解を深めるという順番がおすすめです。それではやっていきましょう!

データ分析

データ分析を効率よく行うには以下の4つが必要。

①データ- データ分析のおおもと
②理論- データをどのように活用するのか
③ツール- データを分析するための道具
④目的- データ分析をする際の大前提

このとき、「何のためにデータ分析をするのか」という目的が特に重要。

データ分析の手法は大きく分けて、①データ把握(1変数の分布把握)、②データ把握(2変数の分布把握)、③探索型データ分析、④目的型データ分析、の4つある。最初に「データ把握」をし、次に「探索型データ分析」で具体的な目的を明確にし、続けて「目的型データ分析」に移行する。

1. データ把握(1変数の分布把握)

時系列データの場合は"変化"、それ以外の場合は"分布"に着目する。数ある分布の中には、数学的に性質が明らかになっている"確率分布"がある。手元のデータに最もふさわしい確率分布を探して当てはめ、データを意味のある数値に変換することがデータ把握段階の核心部。

1変数の分布把握の道具
・ヒストグラム
データの形から分布を視覚的に確認することができる

・確率分布
①正規分布
最も自然なばらつきの分布
②二項分布
成功確率が一定の試行を繰り返したとき、実際に成功する回数の分布
③ポアソン分布
まれにしか起こらない事象の発生回数の分布

2. データ把握(2変数の分布把握)

2種類のデータの関係について典型的に使われるのが"相関"。一方のデータが変動したとき、他方のデータがどの程度つられて動くかを示している。関係のある変数を集める。このとき、因果関係の向きや第3の隠れた原因に注意する。

2変数の分布把握の道具
・散布図と相関(量的データ)
・クロス集計表とカイ二乗検定(質的データ)
量的データ×質的データの場合は、t検定や分散分布。

3. 探索型データ分析

「データはあるけれど、何をしたらいいのかわからない」ときに使う。手元にあるデータから、①自社の現状を把握し、②自らの置かれている立ち位置を明確にする。これによって、自社の強みと弱みを明らかにし、製品の改善ポイント、市場や顧客層を見出すことができる。具体的には、マップの作成などに使われる。

探索型データ分析の道具
・因子分析(量的データ)
・コレスポンデンス分析(質的データ)
複数のデータの中から背後にある因子を探り出す。それぞれの因子がどれだけの重みをもっているかを示した"寄与率"をもとに、上位何番目の因子までを取り出すか判断する。コレスポンデンス分析は、クロス集計表の結果を視覚的にわかりやすくするツールとしても用いることができる。

・クラスタリング
上手く分離することができないことや、解釈に苦しむこともある

因子分析によってマップの軸を設定した後、クラスタリングによってグループを形づくりマップを作成する。もちろん、外的基準(年齢、性別など)によってグループ分けする、セグメンテーションも用いる。

4. 目的型データ分析

「すでに目的となる数字があって、その数字の改善、悪化に影響を与える要因を特定したい」ときに使う。数字を左右する隠れた要因を特定することによって、どうすればその数字を改善・向上できるかが分かる。

・回帰分析
あらかじめ探索型データ分析で関係の強そうな変数をピックアップして重回帰分析に用いるのが基本方針。
・ロジスティク回帰(結果変数が二値のデータの場合)
・コンジョイント分析
製品やサービスをいくつかの要素に分解し、それぞれの要素が結果に与える影響を調べる分析方法。コンジョイント分析という方法論の中で、具体的に利用する1つの手順が回帰分析という考え方。

以上の回帰分析は、データに最もよくあてはまる直線(トレンド)を描きだすのに用いるが、データの広がり(ボラティリティ)が異なれば予測の価値が変わる。そこで、当たる確率を数字で示すために、①変数を分散として取り出す、②正規分布(ポアソン分布etc.)に当てはめる、③分布から確率を読み取る、の3つが重要になる。

回帰分析は、過去の販売実績や出荷実績から需要予測を立てるときにも利用できる。

最後に、マーケティングの実務で実際にどのように回帰分析を利用するかに関しては、森岡毅氏著書の「確率思考の戦略論」をおすすめしておく。

以上です。長い文章にお付き合いいただきありがとうございました。
本日紹介した書籍は以下のリンクにまとめてあるのでぜひチェックしてみてください。また次回!

この記事が気に入ったらサポートをしてみませんか?