『はじめての統計学』サトウマイ著 書評
<概要>
私たちの身近な事例を題材にして統計学や行動経済学の知見をわかりやすく解説した人気YouTuberによる統計学の入門書。
<コメント>
スティーブン・ピンカー著『人はどこまで合理的か』の統計学領域の理解を深めるために購入したのですが、一気に読めて統計学のキモが頭にスッと入る良書でした。
内容的には過去にyoutubeで公開している内容が多く、その書籍版といった感じですが、個人的には動画よりも書籍の方に馴染みがあるので、書籍として読むとより理解が深まったな、という印象。
そしてできるだけ物事は「数値化」して共有することが大事だとの彼女の主張も納得です。
以下『人はどこまで合理的か』の紹介で引用した部分以外の気になった箇所をメモ。
■金融業に必須の「大数の法則」
「大数の法則」とは、
例えばサイコロの場合は、1から6までの6つの面があって、どの面も理論的には同じ確率のはずです。ところが同じ確率になるのは、6万回サイコロを振らないといけない。6万回振るとどの面も出現確率が16.5%〜16.8%の範囲に収まるようになります。それまでは、6つの面の出現確率に偏りが起きてしまう。
つまり「大数の法則」が教えてくれることは、ギャンブルはやればやるほど損する確率が高い、ということです。なぜなら回数が増えれば増えるほど本来の確率に収束するから、つまり絶対損する確率が高くなるから、です。
逆に胴元は、お客さんが増えれば増えるほど、場が繁盛すればするほど、大数の法則が働いて、目指すべき利益率(控除率=取り分)に収束してくるので商売が成立する、というわけです。
健全な市場でも大数の法則に基づいて商売が成立しているのが「保険業」。
事故率や死亡率も確率ですから、回数が増えないと本来の確率に収束しません。より契約が多ければ多いほど大数の法則が働いて目指すべき利益率に近くなります。逆に災害などが多く発生すれば、災害発生率も変わってくるので、つどつど保険業界が儲かるよう、利率は変更されています。
このほか、カード業界、銀行なども事故率を加味しつつ、利率を設定するわけですから、大数の法則あっての金融業、と言えるかもしれません。
■「宝くじ」で理解する「期待値」「還元率」「控除率」
個人的に宝くじは嫌いなので、買ったことはほとんどありません(昔買った記憶を辿ると当時の上司のプレッシャーに負けて1,000円ぐらい買った)。
なぜなら、最も損するギャンブルだと教わったから。それでも「夢を買うんだ」という人の気持ちもわからないではないです。買わなきゃ3億円が当たらないわけだから。
以下は「年末ジャンボ宝くじ」60億円を買った時の事例で説明。
ちなみに「60億円買うと30億円ぐらいはあたる」というか30億円損するということです、こんな馬鹿げたことはやめた方がいいと、すでにこの時点で夢のない私は思ってしまいます。
【期待値】
期待値とはクジ1枚あたりの当選金額の平均値のこと。60億円払って30億円戻ってくるので、約半分。1枚300円だとすると、その価値は149円ということです。
【還元率】
投資した時のリターン率のこと。ジャンボ宝くじの場合は、
2,989,900,000/6,000,000=49.8%
となります。この還元率は数あるギャンブルの中でも最低ランク。それにしてもひどいな。半分しか還元しないっていうのは。
【控除率】
投資したときに、そのうち何%が引かれるのか、という指標。当然これは
100%ー還元率49.8%=50.2%
となります。ところが宝くじを買ったことのある人は、そんなに還元率が高いわけないじゃないか、と思うらしい。これは簡単で当たりが数億円とデカいから、そっちに当たり金額の多くが吸い取られてしまうからです。
【平均値と中央値の使い分け】
宝くじの場合は「平均して購入した金額の半分が戻ってくる」という確率ですが、なぜ購入者の実感に合わないかというと、宝くじはあまりにも当選金額に偏りがありすぎるから。
平均値は、数値のばらつきが少ない場合に利用される指標だからです。
宝くじのようにあまりにも当たり金額がデカすぎる(=数値にばらつきがある)場合は、中央値を使った方が実感に近い数字になります。中央値とはデータを順番に並べて真ん中に来る値のことです。
例えば日本人の平均年収は430〜440万円ぐらいですが、中央値は350〜360万円ぐらい。つまりごく一部の超高額所得者に引っ張られて平均値が上がっているので、私たちの実感と大きく違ってしまいます。なので年収についても中央値でみないと、大多数の人の年収のイメージからずれてしまいます。
最後に、ご参考までにギャンブル還元率ランキングです