【読書ノート】統計学が最強の学問である[実践編]
こんにちは、けいごです。
DXやデータサイエンスによって、何かを予測するのは面白そうですよね! 物事の関係を調べたりして、どうすれば良い結果に繋がるのかを突き止める過程はQOLを向上させる上でも重要だと考えます。
本記事では、「データを使いこなす上で必要な知識が知りたい」「私生活や仕事に活かせる統計の使い方が知りたい」という方に向けて書いていきます!
本書における統計学の軸
本書では「統計学」を、以下のように使うことを軸としています。
ビジネスにおいては、購買という求める結果の背後にどのような原因が存在するか、という因果関係を探り当てることが重要です。つまり、原因と因果関係を知ることで、「売れる」を実現することが出来る確率が高まります。これは、私生活でも活かせることはあります。例えば、「人の反応を見て統計的に調子の曜日に頼み事をしてみる」や「どのような習慣を身に着けた時に自分の調子がよいか」ということです。
また、本書では「頻度論」という統計学の考え方に基づいてまとめています。何故なら、「洞察」との相性がいいからです。その他「ベイズ論」という考え方もありますが、こちらは「予測」する上で相性がよいため、本書の主旨と外れます。
統計学の基礎知識
これまで統計学を使ってこなかった人が、「分析による因果関係の洞察
」に踏み出すために必要な知識は以下です。
①平均値や割合など統計指標の本質的な意味の理解
平均値と割合は本質的には同じです。なぜなら、100人に対する調査で60人が男性という結果が得られたとします。この「割合」は60%です。一方で「平均」は男性を「1」、女性を「0」とした場合、男性である度合いは「0.6」になります。
②「データを点ではなく幅で捉える」という考え方
データの点とは、平均や割合という意味です。平均では、20歳が100人いるのか、1歳と40歳が半々づついるのかは把握できません。そのため、データの幅を把握する方法を知る必要があります。
③「なんの値を何ごとに集計すべきか」という考え方
因果関係を知る上では「最終的にコントロールしたい結果とそれに影響を与えうる原因の候補」という観点でデータを捉える必要があります。そのためには、見るべき値とカテゴリの明確化が重要です。
分析をする上で知っておくべきこと
売上を分析する上では、「平均値」を使いましょう。何故なら、中央値や最頻値では、施策の結果が分からないからです。
そして、「標準偏差」の理解も重要です。標準偏差とは、「平均値からの偏り」を表すものです。値が大きければ大きいほど平均からずれていることになります。
この標準偏差ですが、理論的には「平均値から標準偏差の2倍を足した数~標準偏差の2倍を引いた数」までのあたりに全体の4分の3以上のデータが存在することが証明されています。詳しく知りたい方は本書を読んでみてください。
私が理解できたのはここまでです。要約を見たかった読者さん、力不足で大変申し訳御座いません。しかしこれ、とても難しいですね、、、、中高でまともに勉強してこなかったつけが回ってきました(笑)
途中で挫折しましたが、読書を継続して理解できるようにしたいと思います!
今の私にはもっと初歩的に、段階的に復習するべきですね! また、そもそも1日で理解しようとすることも問題なので、更にわかりやすい本とか活用していきます。
若しくはChatGPTで知りたい統計解析だけを調べたり、作ってもらいながら統計学に慣れることが最適ですね、、、いや断然ChatGPTを有効活用します(笑)
もし読者さんの中に「統計学」について「わかりやすくまとまった記事やサイト」などご存じの方がいましたら、是非コメントで教えてください!
Keigo.log サイトマップ
この記事を気に入った読者様、是非フォローと拡散宜しくお願い致します!