![見出し画像](https://assets.st-note.com/production/uploads/images/29599652/rectangle_large_type_2_ebb799688092b13d95fa4a3e957f723e.jpeg?width=1200)
研究データの読み方
読んでいただきありがとうございます。
これからもよろしくお願いします。
本日TVでみた数値の話。
「コロナウィルスの無症状患者からの感染は
ある研究データでは40%」と発表していました。
事実はわかりません。
伝えたいのはこの40%というのがどのくらい危険かということです。
深沢真太郎先生の
『数学女子智香が教える仕事で数字を使うって、こういうことです』
では、この数値の読み取りをわかりやすく解説しています。
本日はこの本についてお伝えします。
この本との出会い
確か去年だったと思います。
社会人であれば数字を使った説明が必要ってのを
よく聞いていて。
そんな時にネットで見つけたような気がします。
感想は
とても面白いです。
日本だけでなく、世界中で共通の言語。
国籍だけでなく年齢や性別も問いません。
個数にしても割合にしても
多く感じるか少なく感じるかは別として
「1個」は誰にとっても「1個」だし
「50%」は誰にとっても「50%」と伝わります。
それが数字です。
数学っていうのはなんだか計算することって思っていましたが
実は数字を使って人にメッセージを伝えることなんだなって感じました。
気になる内容は
実際に読んでみてください。
とても面白かったことをひとつご紹介します。
統計データを出す時には母数が重要です。
確か、全国的な統計データとして必要な母数は最低1000件。
1000件のデータがあればその割合を人口に合わせて
計算できるはずです。(間違いだったらすいません。)
例えば、特定集団1000人の中で10人が年収1億円を超えていた。
そういうデータがあれば
全国で1300000人が年収1億円を超えていることになって
人口5000人の田舎でも年収1億を超える人が5人いるってことになります。
人口が1000人以上いれば少なくとも1人は年収1億円を超えているはず。
でもそんなことないですよね。
割合はあくまでも割合。絶対にいると保証するわけでありません。
重要なのは、1000人に1人の条件を解析することです。
冒頭でお伝えした
「コロナウィルスの無症状患者からの感染は
ある研究データでは40%」というのは危険なのか?
極端な考え方をすれば
全世界で感染者数は1000万人、
その40%と考えると400万人。
しかし、統計データの母数を1000人でとって
そのうちの400人いた。
でも他の999万9600人は
全くそのデータが当てはまらないとどうでしょう?
400万人対400って40%の割合もどちらを信じるかで
危険か危険じゃないかかなり変わってきますよね。
僕は実際に統計の専門家ではありません。
統計データに必要な母数も違うかもありません。
ただそれでも、割合では何も評価できないということ。
割合の解析が重要。
割合と同時に、全体の数字もみないことには
何も判断できません。
2つ以上のデータで判断しましょう。
https://twitter.com/taro_nutrition
https://www.instagram.com/taro_book.read/?hl=ja
https://note.com/taro_humuhumu
https://taro0000.wordpress.com/
で、SNSやっています。
「いいね」「フォロー」「コメント」よろしくお願いします。
#yuki ota さん
画像使わせていただきました。ありがとうございます。