見出し画像

統計学が最強の学問である①:経済成長において重要なのは「〇〇の〇〇」、統計学的な回答とは?

読書ノート(136日目)
さて、先週に年末年始の
読書宣言をしてから1週間。
いつもは日曜日の午前中に読書をして
そのままnoteに整理をして投稿する。
というのがルーティンでしたが
今日はまだ土曜日の午後…!

先週のnote投稿で、今年の年末年始は
「統計学が最強~」シリーズを読む宣言
したことが影響しているのか、
少しずつですが
読書ペースが上がってきています!

ということで今日から始まる
「統計学が最強~」シリーズ、
最初は「オリジナル版」ということで
こちらの本の紹介です。

第1章:なぜ統計学が最強の学問なのか
・統計学は最善最適の正解を出す
・ハーバード大学のメディカルスクールの統計学の教科書には
 「統計学的思考が読み書きと同じように
  良き社会人として必須の能力になる日が来る」
  と、1903年のH.G.ウェルズの予言が冒頭に記載

・「疫学の父」である外科医ジョン・スノウの活躍
・19世紀のロンドンにて、コレラの予防方法を探った方法
 ・コレラで亡くなった人の家を訪れ、
  話を聞いたり付近の環境をよく観察する
 ・同じような状況下でコレラにかかった人と
  かかっていない人の違いを比べる
 ・仮説が得られたら大規模にデータを集め、
  これらの発症/非発症と関連していると考えられる
  「違い」について、どの程度確からしいか検証する

・結果として、水道会社の違いによって、
 その死亡者率は8.5倍の違いがあったことを示した

・医療だけではなく経済学など他の分野でも
 統計学的な解析が進んでいる
・従来の理論先行での数理モデル考案に対して、
 過去何百年にもわたる各国の経済に関するデータ
 (性年代別人口や国民の所得と貯蓄額、物価など)から、
 「経済成長が起こるには」の問いに回答
経済成長において重要なのは「技術の進歩」であり、
 さらに技術の進歩に寄与する教育レベル
 技術開発を行った場合に、その利益が開発者に
 適切に配分
されるかという「社会の制度」
・逆に天然資源の有無などが関連しているとは言えない。
 といったことが明らかにされた。

第2章:サンプリングが情報コストを激減させる
・サンプルを1万増やしても標準誤差は0.1%しか変わらない
・10万人の顧客データから男女別割合を調べる場合
・サンプル数が100名分の場合の標準誤差は4.6%、
 100人のうち女性が70人ならば、10万人の顧客データのうち
 女性の割合は61%~79%にある確率が95%と算出。
・サンプル数が1000名分の場合の標準誤差は1.4%、
 その場合は67%~73%に予測範囲は狭まる
・サンプル数が8000人分の場合の標準誤差は0.5%、
 その場合は69%~71%。
・ただし、サンプル数が1万人の時の標準誤差は0.4%、
 2万人分で0.3%と推移は緩やかになる傾向があり、
 サンプルを1万増やしても標準誤差は0.1%しか変わらない

・正しい判断に必要な最小十分のデータを扱うことが大切

統計分析するときの流れとして
スノウ博士の
「事象を観察する」
「違いについて仮説を持つ」
「統計的に検証する」

という一連の課題解決の流れは、
まさに原点だなぁと、感じました。

また、
サンプルサイズと標準誤差についても
サンプル1000件を集めれば、
標準誤差は±1.4%以内に収められる
ということで、今後何かの
アンケートを取る際の基準目安数として
参考にできそうです。

※今回の場合、男女比は約50%ということで、
 標準誤差は確率50%の時が最も大きくなる
 (確率50%だと正誤の予測が最も難しい)
 という背景があるので、サンプル1000件を
 集めれば、標準誤差は±1.4%以内に収まる。

と考えてしまっても良いのかなぁと感じました。

…ということで今日はこの辺で!
それではまたー!😉✨

いいなと思ったら応援しよう!