見出し画像

コロナウイルスの検査対象を不用意に拡げない理由を科学する

※本記事は、”あくまで数学的”見解からコロナウイルス感染検査実施の要否を述べており、社会影響や、感染予防の観点については言及しておりません

皆さん、こんにちは!けんたろと申します!
数学とファイナンスがとても得意で、良く講義などさせていただくのですが、
今回は表記コロナ検査について、”数学的視点”から、意外にも知られていないことがあるな、と感じたのでnoteに書きました。
もちろん、その内容をビジネスにどうつなげるのかまで考察してますので、
・人材分析をする人事の方
・品質管理に統計学を採用する予定の方
・就活生でNEWSへの見解を問われる可能性がある方
・数学好きの方
是非最後までお目通し頂けると嬉しいです^^

検査されない日本の状況(20年3月20日時点)

新型コロナウイルス(COVID-19:以後コロナ)の感染者数が、3月20日12:00現在、国内で950例となりました。
一方、検査者数は1.8万件程度と、潜在的にウイルスを対内に有しているのではないかと、日々不安に駆られ、
検査を待ち望む声もちらほら聞こえます

そんな中、日本を代表する経営者の投稿が話題を呼びましたよね。それがこちら

結局、多くの反対意見があり、こちら見送りになっちゃいました。
この問題を見た時に僕が感じた数学的課題とは別の論点が日々のワイドショーなどで流れていて違和感を感じたのである実験をしてみました。
皆さんも下記問題に挑戦してみてください

ちなみに、ワイドショーでは主に”医療機関への影響:ベッド・看護師数の不足や、病院における二次感染リスク”や、”感染予防:自分の感染有無を把握することで拡散の対応がしやすくなる”の論点が目立ってました

スライド2

実は、この問題、僕が勤める会社のクローズドな勉強会のチャットにも投げてみたんです。
それなりに有名なテクノロジーカンパニーです。ほとんどが大学卒/大学院卒で人より多く教育を受けてきたはずが、実は正解率は0%でした。目をつぶって選んでも33%の正解率があるのに、です。

さて読者のみなさんはどれが答えか選べましたか?
正解は・・・








数学的考察の答え

「B」です。
ちなみに当社では「A」の検査の精度が低いが最も多く支持されてました。
それほど、通常のイメージ(常識)とはかけ離れた答えなんです。

では、なぜ「A」や「C」ではなく、「B」なのか、少し仮想的な問題を解きながら解説したいと思います。
仮に、めちゃくちゃ検査精度を高くすることができたことを仮定して以下問題を見て欲しい

検査の精度が非常に高い条件における仮想問題

スライド3

検査精度を100%にはできないという前提で、100%にとても近い精度という状況で以下問題について皆さんはどう思うだろうか。
多くの方は、”黄色の吹き出し”を読むまでは「90% or 95%」と答えたに違いない。そして読んだあとは「?」が頭の中を駆け巡るだろう。

<問題>
・以下の条件において、日本国民からランダムで選出したAさんの検査結果が「陽性」だった場合、Aさんがコロナウイルスに感染している確率は?
<条件>
・日本の人口を1億人とする。またコロナウイルスに実際に感染している人は人口の0.01%相当の1万人と仮定する
・コロナ検査の精度がとても高く仮に以下の精度で判定できたとする。
 ①コロナに感染している場合、正しい結果(陽性)とでる確率90%
 ②コロナに感染していない場合、正しい結果(陰性)とでる確率95%

ここで、重要なのが、「検査で陽性が出た≠コロナウイルスに感染している(二つの関係はイコールではない)」ということだ。
100名の感染者がこの検査をすると、90名は陽性と反応結果が出るが、10名は陰性と誤結果となる。
同様に100名の健常者の結果は、5名は陽性と誤結果になり、95名は陰性となる。

数学嫌いの方には少し頭が痛くなってきたかと思うが
ビジネスにもとても生きる考え方なので、最後まで是非お付き合いいただきたい!

仮想問題の答え

スライド4

まずは先ほどの問題の答えから述べようと思うが、きっと驚く数字になっていると思います。
皆さんは何%くらいを予想していたでしょうか、「半々の50%くらいかな~?」「いや、10%まで落ちるんちゃうか?」
色んな数字が飛び出しているのが想像できますが、皆さんが想像したよりもきっともっと少ない答えになっていると思います。

答え:0.18%

18%ではないく、その百分の1である0.18%ですよ。驚きません?
これは、実際にAさん(ランダムで選ばれた)が検査した結果、
「検査で陽性」と出たのにも関わらず、感染している確率を示しています。
つまり、同じようにランダムで選んだ人で、陽性の反応が出た人のうち556名中1人しか感染している人はいないということなんです。
この数学的落とし穴は、この後解説しますが、
皆さんこんな低い結果は予想していたでしょうか?そしてなぜこんなに低い結果になるのか・・・
さらにどうしたら高い検査結果にすることができるのか、気になってきませんでした?

仮想問題の解説

なぜこんな低い値になったのか、結論から述べると、

感染者が全体の中から0.01%(人口1億人に対し、1万人)と圧倒的に少ないからなんです。
つまり、9999万人は感染していない人になるんですが、今回の例題では95%の検査精度になるので、5%は陽性と誤検知してしまいます。
おおよそ500万人(正確には499.95万人)は陽性と判断されてしまうんです。

次に感染者1万人を見てみると90%の検査精度になるので、
こちらでは、0.9万人が陽性とはんだんされます。

数学が得意な方はもうお気づきですかね?
つまり陽性の検査結果になる人数が、(500万人+0.9万人)=約501万人になるんです。
そして、上記通り約500万人はじっさいには感染していない健常者の誤検知結果でしたよね。
つまり、陽性と反応した約501万人中、本当に感染している方は1万人にもみたないたった9000人のみということです。

”どんなに優れた検査機を作っても、調べたい対象が少なすぎるため、ノイズに埋もれる”状況になってしまうということです。

もっと詳しく計算の前提を知りたい方は、補足ページを作っておきましたので下部まで見に行ってみてください^^

ここで皆さん気になりませんか
「ん?ではどうやって、今検査して感染している/してないを見分けてるの?」

答えはとっても簡単です。
検査の母集団を絞ること。現在、日本政府の方針ですよね。
あれは、医療機関への影響や二次感染などの効果ももちろん狙っていると思いますが、”無作為的に検査をすると検査結果が著しく悪化する”ことへの対策でもあるんだと思っています。

検査精度を上げる対策

最後に、今回のケースにおいて、日本政府は検査対象を絞り込む施策を講じましたが、
他の打ち手はないのだろうか、、、
以下現実可否置いておいて、数学的なアプローチの観点で施策をまとめました。
3つの施策を組み合わせることでもっとも精度高い検査ができるようになるので、それぞれ是非見ていただきたいです^^

スライド6

▼▼①検査を受ける人を絞り込む
こちらは、上記日本政府と同じ対応ですが、検査対象を絞り込み
”健常者をできる限り検査しない”ようにスクリーニングしておくことが重要です。そうすることで、健康なのに陽性反応が出る患者数を減らすことができます。
例えば、既に感染が分かっている人と接したかどうか、コロナの症状と著しく等しい症状が起きているか、きめ細かに確認してから検査をする。
そうすることで、検査の精度を高めることができるんです。

▼▼②複数回検査をする
次は、陽性の結果がでた場合、全員複数回実施するという施策です。
健常者の誤検知はたった5%なので、2回、3回続いて誤検知が起きる可能性ってとても低いですよね。
1回の検査では0.18%だった、今回の検査も
2回の検査では3.14%(※2回どちらも陽性となった患者のうち、実際にコロナに感染している人の含有率)
3回の検査では、36.8%。4回目にはとうとう91.3%にまで跳ね上がります。
これは癌の検診でも採られる方法で、ご家族が癌になったことがあるかたはご存じかもしれませんが、癌の検査で陽性になった場合、再度検査を行います。こちらも実際全国民のうち、癌になっている人はそんなに多くない(致死率は高いが、今この瞬間、癌になっている人は数%程度)ため、複数回の検査によって、癌であることを断定していくんです。

▼▼③健常者の誤検知精度を高める
多くの方は、このような問題に立ち向かう時、よりコロナ感染者を正しく発見する検査方式を検討されるんじゃないかな、と思います。
でも実は隠れた論点があって、それは健常者への誤検知を低下させる検査方法なんです。
言われてみれば、そうだよね、と思うと思いますがなかなか見落としがち。
理由は①と同じで、健康なのにコロナ感染者と誤検知される人が多すぎたことが問題だったので、その人数を下げる施策になります。

最後に

以上、数学的に今回のコロナウイルスの検査に関して考察してみました。
数学的に机上での議論では、上記通り多くの人に検査はしない!という結論になりましたが、
感染に気付かず拡散してしまったり、重症化するまで放置してしまったりと多くのリスクも孕んでいます。
数学的に検査精度を上げる施策だけでなく、どのように人名に向き合っていくべきか、とても難しい問題だなと思いますので
今回の考察も”あくまで数学的”という認識で捉えて頂けるとありがたいです^^

また、ビジネスでは
「ゆくゆくは経営者を担っていく人材の人物像をアセスメントしよう!」とか「イノベーションに成功した人を登用しよう!」とかいう問いに向き合う方も多々いるんではないかと思います。
これらも今回に立ち返ると、”そもそも全体の中で一握りしかいない”人材を、何かのテスト/アセスメントで炙り出すのはとても危険であること。
それでも、必要に駆られて取り組むときには
上記①~③で記したテクニックを思い出していただければなと思います。特に③は意外な盲点で着目されないことが多いので、要注意してみてみてください。
例えば「今後の経営者を見つけるアセスメント」では、経営者になる資質を持った人を探す精度を上げるよりも、
経営者にならない人を探す精度を上げる方が、圧倒的に効果的であることがそうでしょうか。

とはいえ、可能性をゼロにするような対応で悲しい気もしますね・・・

けんたろ

----------------------------------------
twitterもやってます|フォローしてね!
けんたろ|コミュニティ運営&採用人事 @murajuku

もしよろしければnoteのスキとフォローをお願いします。
シェアや感想をいただけると次回作への励みになります^^
----------------------------------------

Vol.2の宣伝

統計学を使って、新型コロナウイルス(COVID-19)について考察する企画第二弾書きました!
20/04/05時点でまだ政府発表のPCR検査陽性者は2000名しかいない状況ですが、統計アプローチをすると、もう数桁多い感染者がいるかも?
ということで分析してます。
こちらもよろしければご確認下さいませ。



補足:条件付き確率

スライド5


条件を2軸に取り、四角形の面積を求めると求めたい確率になります。
今回のお題について、改めて見てみると

スライド4

このように黄色の正方形で表すところが陽性結果を表す部分になります。
黄色の面積を求め、実際に感染者だった、下の横長長方形の面積を求めれば今回算出したような結果になります。
気になる方は、予習/復習かねて計算してみてください。
わからない場合は、コメントいただければもう少し突っ込んで解説いたしますので、お気軽に問い合わせください^^

後書き:
冒頭問題の選択肢Aについて、もし仮に100%の精度を実現でできるのならば「A」も正解になる。ただし、健常者誤検知含めて100%になり、万人が検査できる施策は合理的にないとして選択肢から省いております。

いいなと思ったら応援しよう!