PCR検査の特異度の検証
次に、実際にPCR検査の特異度、つまりウイルスがいない人から採った検体で、検査結果が陰性になる確率は、どのくらい、と考えられるかを検証します。
(1) 報道に見るPCR 検査の実際の検査結果の多数の具体例
以下に列記するのは、PCR検査が多数の人になされた実際の結果(検査人数と陽性者数)の具体例です。一見、いま私たちが目指しているPCR検査の特異度の検証と関係ないように思う方も多いかもしれませんが、これを先に多数見てみましょう。
例1
2020年9月4日 NPBニュース NPBはNippon Professional Baseball Organization 一般社団法人日本野球機構
https://npb.jp/news/detail/20200904_02.html
「プロ野球12球団は、選手、監督、コーチ、球団スタッフら計2172名に対して8月分の新型コロナウイルスPCR検査を実施、全員の陰性判定を確認」
例2
2021年2月中旬下旬
https://www.nikkei.com/article/DGXZQOJB015KI0R00C21A3000000/
日本の広島市 6573人を対象にPCR検査。陽性4例
なお、このうち、住民向けは3238人を検査し、陽性4例。就業者向けは3335人を検査して、陽性者ゼロ。
例3
2021年3月1日
https://full-count.jp/2021/03/01/post1055752/
「日本野球機構(NPB)は1日、プロ野球12球団がキャンプ地入りする前とキャンプ期間中に実施した新型コロナウイルスのPCR検査の総数と結果を発表した。延べ1万7573人の検査を行い、陽性だったのは3人。陽性率は0.017%だった」
さて、この記事の中では、実際の検査の例として、全部で8例を挙げます。ですから、まだ、ここまででは、その半分も挙げ終わっていないわけですが、続いて他の例を見る前に、この後で他の例を見る時の参考になるように、例3を一例として分析してみましょう。
例3のプロ野球12球団での検査では、1万7573人に対してPCR検査をして、結果は陽性が3人です。ですから、1万人当たりの検査に直すと、陽性者はおおよそ2人の計算です。仮に、ここで用いたPCR検査の感度が70%だった場合を考えます。特異度が99%なら、偽陽性率は1%になるはずです。ですから、分科会の第一回の資料が想定するように、特異度が99%であった場合、検査1万人当たりでは「偽陽性」が1%、つまり100人程度出るのが標準的な検査結果であるはず、です。同様に、特異度99.9%なら偽陽性率は0.1%になります。ですから、PCR検査の特異度がもし99.9%なら偽陽性者が10人程度出るのが標準的な検査結果であるはず、です。ところが、このプロ野球12球団のPCR検査では、そのようになっていません。そのようになっていないばかりではなく、そもそも検査結果としての陽性者自体が2-3人しか出ていません。実際問題として、この検査結果で陽性になった2人や3人が仮にすべて「偽陽性」だったとしても、特異度は、99.9%よりも精度の高いほうの値、つまり>99.9%になっている可能性が高いと思われます。理論的に、特異度99%ならば、1万人に対して検査をした時、100人、特異度99.9%ならば10人、の偽陽性者が出るのが標準のケースであるはずですが、実際に検査を行ったこの結果の、検査対象1万人当たりの陽性者は2人程度でしかありません。仮にこの陽性者2人ともが偽陽性、という極端なケースを想定してさえ、人数がそれより大幅に少なくなっています。
ましてや、素人考えですが、2人や3人しかいない陽性者が、全員「偽陽性」などということがあるだろうか、という考えが心に浮かびます。そのような常識的な考え方をすれば、「99.9%」でさえ、PCR検査の特異度の評価として、過小評価ではないのか?という強い疑いが生じます。つまりPCR検査の特異度は、政府にコロナの感染症対策をアドバイスする分科会によって、精度の悪いほうに誤って想定されていたのではないか、と強く疑われます。推定される特異度の数値は、この、『全員「偽陽性」だった』、という、余りありそうにもない想定で計算した数値よりも、さらに高い、つまり「精度が良い数値」なのではないか、と疑われます。
別の角度からも見て見ます。岩田健太郎医師は、その著書『僕が「PCR」原理主義に反対する理由』(集英社インターナショナル2020年12月)の中で、神戸市民について感染確率が一万分の一だった場合を仮定して、その上で「あえてPCRを過大評価して、感度90パーセント, 特異度99.9%パーセントと仮定」したとき、仮に神戸市民全員にPCR検査をしたら検査結果がどうなるかについて、ベイズの定理を用いて「陽性と判定されたその人が新型コロナである可能性は8.3%しかありません。事前確率が0.01%だったとき、陽性と言う結果は90%以上の確率で間違っているわけです」、と断定しています。(110-111ページ) 仮に岩田教授の言うように、各例で陽性判定された人が正しく陽性である確率が8.3%しか無ければ、この例3のケースでは「陽性判定になった3人全員が実際には陽性でない」というような極端な結果である可能性が相当に高くなるのではないか、と思いますが、実際にそんな可能性は高いでしょうか?常識的に考えて、これだけ陽性者が少なければ検査結果に色々検証もされるし、トラッキングもされて、もし偽陽性であればそうだと分かるだろう、と少なくとも素人考えには思います。この岩田医師の論説は、上記の本単独で読むと、如何にも正しそうに見えるのですが、以上のように分析的に考えると、常識的に考えて、岩田教授のいうような、正しく陽性である確率がたったの8.3%しかない、というようなことは、机上の空論ではないか、と強く疑われるように思います。
さて、ここで断定を避けて、一度冷静になって、特異度以外の他の要素の影響を考えて見ます。それら、特異度以外の他の要素が分科会の仮定と違っていたため、陽性者がこれ程少なくなってしまったのではないか、というふうに考えて見るとどうでしょうか?
そこまで考えると、先に見た分科会の資料の中に見られる偽陽性率の仮定には、3つの変数があることに気が付きます。第一に「感度」、第二に「特異度」、そして第三に「感染者の割合」(第一回資料では1万人に100人、第二回資料では10万人に100人)です。分科会の偽陽性率に関する仮定は、この三つの要素だけからできており、他の要素はありません。ですから、その確からしさを分析するには、ここまで検証してきた「特異度」以外に、「感度」と「感染者の割合」の二つを検討すればよいことが分かります。
まず、感度をみましょう。プロ野球12球団への検査で使われたPCR検査の感度が、仮に、感度が分科会が想定していた70%よりも低い、つまり感度が70%未満の検査が行われた、それが検査結果に影響している、という可能性について、先に考えてみます。
第一回の分科会の資料で使われている仮定は以下のようなものです。1%の人が感染している1万人に検査し、感度が70%、特異度が99%だったという想定です。
では、感度がこの想定より低かったり、高かったりした場合にどうなるか見てみます。まず低い場合です。仮に感度が50%しかないとします。その場合、このようになります。
次に高い場合です。仮に感度が90%だとします。その場合、このようになります。
ここで最初に注意すべきは、上の三つの表で「感染なし」の列がすべて同一の数字になっていることです。つまり、注目すべきは、検査対象の人数に対する感染者数の割合が一定の時、「感染していない人」が検査結果で「陽性」になる数、「陰性」になる数は、感度が高い、低いに関わらず一定である事です。
これは、当然です。なぜなら、検査対象の人数は1万人で固定されており、且つ感染者の割合も1%で固定されているから、感染者は1万人の1%で100人、「感染なし」は1万人から感染者100人を引いた9900人で固定されるからです。そして、特異度の定義は、ウイルスがいない人が正しく陰性(感染なし)と判定される確率ですから、正しく陰性(感染なし)と判定される人は、「感染なし」の9900人の99%で、9801人とはっきり決まって固定された数になります。これは理論計算上の話ですので、誤差があってブレるという話ではないです。一意に決まります。このように、「感染なし」の列の数値は、感度の高低に関わらず三つの場合で同じになります。
さて、以上を踏まえて、その上で「合計」の列を見ると、あたり前のことですが、合計は「感染なし」の列の数字に、「感染あり」の列の数字を足したもの、になってることが分かります。つまり「合計」は「感染あり」と「感染なし」の列の和です。当然ですが、どちらの列の値も正の数です。そうすると、また当たり前の事ですが、「検査で陽性になる」人の数は、特異度から計算された、「本当はウイルスがいないのに、誤って陽性になってしまった」つまり「偽陽性」の人の数を下回ることはない、ということが分かります。単純に数学、あるいは算数の問題として、A, Bが共に正の数の場合、AとBの合計が、A,B,どちらかの数より小さくなる、ということはあり得ないからです。
さらに「偽陽性」の数について考えます。先程見た様に1万人に検査して、感染者は1%、で、検査の特異度は99%という想定をすると、感染者は100人で非感染者は9900人、このうち、検査で正しく非感染者と判定されるのは、「非感染者を正しく非感染と判定できる確率」という特異度の定義から、9900 x 0.99 = 9801人、非感染者なのに、誤って陽性結果が出てしまう「偽陽性者」の数は、その余りである9900 x 0.01 = 99人です。ここまでの数値は、それぞれすべて「想定自体」にあらかじめ含まれている数値、といえます。
ですから、(1)「感染あり」の陽性者と、「感染なし」の陽性者の合計である、検査結果としての「陽性者数」は「偽陽性者」の人数を下回ることはない、という事と、(2) 偽陽性者数は検査人数、その中での感染者の割合、特異度、の三つが決まっている場合、「偽陽性者の数」も決まっていて固定である、という今迄ずっと見てきたことを合わせて考えると、感度がどのようであっても、陽性者数が、検査人数、感染比率、特異度、の三つから決まってくる「偽陽性者数」を下回る事はない、ことが分かります。感度が、高ければ高いほど陽性者数は増えますが、感度とは全く関係なく、陽性者数の下限値は決まっており、その下限値は「偽陽性者数」である、ということが分かります。
ここまで考えると、感度が分科会の第一回の資料で想定している70%より低かったり、高かったりする可能性は、例3のプロ野球選手1万7573人に対してPCR検査を行った時、
陽性者数が、特異度から考えてもっといるだろうと思われる人数より大幅に少ない原因になっていないだろう、と推定できます。なぜなら、PCR検査の感度は、以上検証してきたことから、検査人数と特異度から決まってくる「偽陽性者数」という陽性者数の下限値に全く影響を与えませんので。特異度99%なら, 特異度99.9%なら、本当の感染者が1人もいない場合でさえ、それぞれ約176人、18人程度の陽性者がでるはずなのに、実際にはたった3人しか出ていないのは、感度が分科会が想定した70%より高かったり、低かったりしたことが原因ではないはずだろうことが分かります。上記でみてきたことから、感度が70%より低くても高くても、特異度が99%, または99.9%なら、それぞれ陽性者数は約176人、18人程度を下回ることはないからです。
これは分科会の第二回の資料で想定している0,1%の人が感染している10万人に検査し、感度が70%、特異度が99.9%だったという想定の下でも同じことが言えます。
感度が50, 70, 90%の場合を見ると、次のようになります。
どの場合でも、「感染なし」の列の数値は同じで、合計は、「感染あり」と「感染なし」の和になっていて、この分科会第二回の資料で想定されている場合も、分科会の第一回の資料で想定されている場合と同じことが言えます。この時使われたPCR検査の感度が70%より高かったり、低かったりしたかもしれない可能性は、特異度99.9%なら、本当の感染者が1人もいない場合でさえ、18人程度の陽性者がでるはずなのに、実際にはたった3人しか出ていないことの原因ではないはずだろうことが分かります。感度に関わらず、検査結果としての真の陽性と、偽の陽性の合計である陽性者数は、理論的には、特異度99.9%なら生ずるはずの偽陽性者数18名を下回るはずがないからです。
これで、感度が分科会の想定である70%からいい方にも悪い方にもずれていた場合でも、「分科会の特異度の想定は誤っていたのでないか」という疑いはまったく減らないことが概ね説明できたのではないかと思います。
次に最後の変数である、検査対象の中の感染者の割合の影響について検討します。
第一回の分科会の資料で使われている仮定は以下のようなものです。1%の人が感染している1万人に検査し、感度が70%、特異度が99%だったという想定です。
では、これに感度と特異度は同じで、10%の人が感染している場合、0.1%の人が感染している場合、誰も感染していない場合(感染者ゼロ)を加えて、この四つで比較してみます。
これを見ると、まず感染者の割合が分科会の想定より多くなると、陽性者数も分科会の想定の場合より多くなることが分かります。ですから、検査結果の陽性者数が、特異度が99%なら、本来いるはずの約176人より大幅に少ない原因が、感染者の割合が分科会想定より高いためだ、という可能性は排除されます。感染者の割合が分科会の想定より高ければ、陽性者数は約176人を超えるはずだからです。
では、最後に残るのは、感染者数の割合が分科会の想定より少なかったために、陽性者数が、特異度が99%なら本来いるはずの約176人を大幅に下回った、という可能性です。
これはどうでしょうか?たしかに、感染者の割合が10%, 1%, 0.1%と順番に見ると、陽性者数は990人, 169人, 107人、とどんどん減っていきます。これだけ見ると、例3のプロ野球の検査では、感染者の割合が少なかったために、陽性者数もとても少なかったのか?という気にもなります。しかし、直上の四つの表をよく見れば、感染者の割合が10%から1%に下がった時は、陽性者数は83%も大幅に減ったのに、感染者の割合が1%から0.1%に下がった時は、陽性者数は37%の減少と、感染者数の比率が一桁減る度に、陽性者数の減り方が少なくなっています。そして、真の感染者がゼロのケースでは、0.1%のケースから陽性者数は6.5%程度しか減っていません。感染者数の割合が下がれば下がるほど、感染者割合の桁が下がるたびに陽性者数の減少幅は少なくなっていき、最終的に、検査対象人数の1%が陽性者数の下限になる、と言ってよいように思います。私は数学は得意でないので、推定ですが、その可能性が高いように思います。
第二回の分科会の想定を使ったケースでも、感染者の割合が一桁減るごとに、陽性者数の減り方も、上記の第一回の分科会の想定を使ったケースと似たような減り方になり、結局検査対象人数の0.1%が陽性者の下限になる、といってよいように思います。以下の四つの表はその計算です。ご自身でご確認ください。
結局、1万7573人に検査した場合、検査対象の中に含まれる本当の感染者数の割合に関わらず、検査対象人数(1万7573人)に対して、行われた検査の特異度が99%の場合1% の約176人、特異度が99.9%の場合0.1%の約18人が陽性者数の下限となりそうです。
つまり、先程、感染者の割合が分科会の想定より高いことは、実際の検査結果の陽性者3人が本来いるべきと思われる176人や17人より大幅に少ないことの原因にはならないことをみましたが、その逆に感染者の割合が、分科会の想定より少ないことも、やはり陽性者数の下限は176人や18人であることから、分科会の特異度の想定と、実際の陽性者数に大きな違いがあることの原因ではないことが推測できます。
ここまで見て頂いて分かるように、分科会の想定にある三つの要素、特異度、感度、感染者の割合のうち、特異度以外の、感度と感染者の割合のどちらを検証しても、いずれが分科会の想定と異なっていたとしても、例3のプロ野球でのPCR検査について、陽性者数が特異度99%の場合で176人、特異度99.9%の場合で17人を大幅に下回る3人しかいないという結果は招かないことから、分科会の特異度の想定である99%や99.9%は誤りである蓋然性がひじょうに高いと推定される、ことが分かります。
ここで「蓋然性」とか「推定される」と書いているのは、私の計算や推論が間違っている可能性を考慮してこのように書いているもので、私個人としては「分科会の特異度の想定である99%や99.9%は誤りである」とはっきり思っています。しかし、本人が確信していることが、他の人から見ると別の要素を考慮して誤っていることもあるので、このように書いています。
ここまで考えたところで、他の実際の検査結果の例も見ていきましょう。
例4
2020年12月14日~2021年1月24日 中国北京市内 1745万人対象 陽性8例
(中国青年網2021年1月26日) https://www.sohu.com/a/446768437_119038
例5
2020年10月中の5日間 中国青島市内 900万人以上対象 陽性12例
(財新網2020年10月12日) http://www.caixin.com/2020-10-12/101613800.html
例6
2021年1月25日-1月26日 中国河北省石家庄市 371万人対象 陽性8例
(北青網新聞2021年1月27日) http://news.ynet.com/2021/01/27/3120327t70.html
例7
2020年7月26日-7月31日中国大連市448.8万件、陽性107例
(網易新聞2020年8月1日 ソースは新京報) https://www.163.com/news/article/FIUQ259500019K82.html
例8
2022年1月12日~14日 中国天津市1200万件样(12067865)、陽性44例
https://xw.qq.com/cmsid/20220114A08WX700
これらの例で、検査結果での陽性率を計算すると以下のようになります。
検査結果での「陽性」全件が偽陽性だった、というような、極端なであまり考えにくいケースを想定した場合でも、偽陽性率は以下のようになります。
例1: 0/2172 = 0
例2: 4/6573 = 0.0006085
例3:3/17573 = 0.0001707
例4: 8/1745万 = 0.0000004
例5: 12/900万 = 0.0000013
例6: 8/371万 = 0.0000021
例7: 107/448.8 万 = 0.0000238
例8: 44/1200万 = 0.0000036
この時、各検査結果の陽性に、ウイルスがいないのに誤って陽性判定された「偽陽性」が含まれている場合、偽陽性率の最大値は上記各例の小数点で表されている数値と一致します。「最大値である」ということは、仮に「陽性結果の全てが、偽陽性(本当はウイルスがいない陰性)」だった、という最悪のケースでも、偽陽性率はこの数値を越えないということです。偽陽性は、結果としての現れ方は必ず「陽性」ですので、検査結果の「陽性」の数の範囲内であるはずだからです。また別の面から見ると、偽陽性率はこの数値か、もっと小さい、ということでもあります。
これらは分科会の第一回資料の中の特異度99%,第二回資料の中の特異度99.9%から想定される偽陽性率、それぞれ1%, つまり0.01, および0.1%, つまり0.001より遥かに小さくなっています(わずかに例2が0.001に比較的近い)。
ですから、これらの計算結果から見ると、先程、例3の検査結果を分析した際に生じた「PCR検査の特異度は、政府にコロナの感染症対策をアドバイスする分科会によって、想定された特異度99%、あるいは99.9%は、誤りで、PCR検査の特異度は本当はもっとよいのではないか、という疑いはますます強くなります。
但し、報道による、これらのPCR検査の結果は、1回の検査ではなく、複数回検査して陽性を確定しているのでないか、という見方もできます。その場合は、そのように複数回検査された場合の初回の検査の偽陽性率の最大値は、これより大きいのではないか、仮に(あくまで仮にですが)そうだとすると、分科会の特異度想定は正しい可能性もあるのではないか、という考え方もできると思います。しかし、多数の人がコロナで亡くなっている状況下で、目下の検査の目標は、感染者を正しく見つけ出して、隔離、治療し、感染の連鎖を断つことにあります。少なくとも、目前の検査の目的は、基礎科学の研究ではなくて、実際に感染者を見つけること、ですから、PCR検査において、複数回検査することによって確認することも含め、その最終確認の段階で偽陽性になってしまう人の発生する確率が分かれば、実用上は十分ではないでしょぅか。
以上のことから、結局、偽陽性率の最大値は、検査の精密性に依存しつつ、0.0006 から0.0000004の間程度にあるといえよるように思います。特異度は、「ウイルスがいない人が正しく陰性になる確率」ですので、間違って陽性になる確率の補数、つまり(1-偽陽性率) になります。ですから、この偽陽性率の最大値は、それぞれ報道された検査結果での陽性の全数が「偽陽性」であった、という余りありそうにない極端なケースでも、特異度99.94%から99.99996%に該当するのではないか、と思います。そして、且つ、これは陽性の全数が偽陽性、という極端な仮定をした下のものなので、常識的には、実際の偽陽性率は0.0006 から0.0000004より更にかなり低い可能性がある(というよりその可能性がむしろ高そう)といえそうです。つまり、0.9994 から0.9999996くらい、つまり99.94%から99.99996%くらいが特異度の考えられる最悪値、で、かつ実際の特異度は、99.94%から99.99996%より更にかなり良い可能性がある(というより更にかなり良い可能性がむしろ高そう)ということになるはずと思われます。そして、何度も繰り返しますが、これは、検査結果「陽性」の全数が偽陽性、という極端な、余りありそうにない仮定に基いて考えられる、ありうる「最悪値」なので、PCR検査の実際の特異度は99.94%から99.99996%よりかなり高い、つまり精度がよい可能性がある(というより可能性がむしろ高そう)、といえそうです。これが私の検証の結論です。
さて、私の検証の結論は出たわけですが、最初のほうで見た、2020年7月6日の第一回分科会後の会見での尾身さんの発言は、以下のようなものでした。
https://www.youtube.com/watch?v=zTd8AlPa_Bg
25分50秒くらいの位置
以下、尾身さんの発言
「特異度っていうのは、99%, 実際にはもっと低いかもしれないけど、わざと少しよりよい方に99ていう事で、この仮定で計算して」
尾身さんの発言引用終わり
この発言から普通に考えれば、尾身さんの当時の特異度についての認識は、99%よりもうちょっと悪いくらいじゃないか、というものであった可能性が高そうだと言えます。(99+α)%くらいを想定していた感じです。これは最初に私がお話しした通りです。また、分科会第一回の資料4-1(たたき台案)のスライド11枚目では、99%が特異度の仮定に使われていました。
そしてまた、分科会第二回の資料6-1のスライド9枚目では、99.9%が特異度の仮定に使われていたことも先程見た通りです。その上で、尾身会長および分科会第一回資料の仮定、分科会第二回資料の仮定、上で見た、実際の検査結果例1-例8の特異度の最悪値をそれぞれ使って、100万人検査した時に、計算上、標準的にどれくらい偽陽性の判定がでる人がでるかを列記して比較、すると以下の様になります。
特異度99% (尾身会長2020年7月6日発言、及び分科会第一回資料)
偽陽性1万人
特異度99.9%(分科会第二回資料)
偽陽性1000人
特異度99.94%(例2広島市検査例、但し、陽性者が全員偽陽性の場合の仮定上の最悪値)
偽陽性608人
特異度最悪値99.99996%(例4中国北京市検査例、但し、陽性者が全員偽陽性の場合の仮定上の最悪値)
偽陽性1人未満
これだけの著しい違いがあります。
しかも、皆さんに再度注意を促しますが、広島市の例では、検査結果で陽性とでた人が全員本当はウイルスがいなくて誤って陽性になった偽陽性である、という極端なケースで特異度の最悪値を考えると99.94%である、というだけです。そして、この最悪の仮定で考えると偽陽性が608人となるわけですが、これはあくまでも理論上、最悪の場合、偽陽性者がこれだけでる可能性がある、というだけです。実際には、単に推測だけだとしても、検査結果の4例陽性が、すべて偽陽性だと考える人は、あまりいないと思います。四例の陽性者のうち、本当の陽性者が多ければ、推定される特異度はもっと上がり、偽陽性者はさらに少なくなりますし、全員が真の陽性者であった場合、この例2の広島県の検査で使われたPCR検査の特異度は100%に近い、としか推測できなくなり、100万人検査すれば、ほとんど偽陽性者は出ないだろう、と推測できるだけとなります。
多数の中国での検査例から見ると、特異度は実際の運用上は、100%に限りなく近いのではないか、という気がします。PCR検査で「偽陽性」が出る可能性は、検査システムの運用が適正になされている限り、ほぼゼロに近いのではないか、と思わされるような結果です。
そうだと考えると、尾身会長の考え方や、分科会の想定の正しさが問われます。100万人検査して、尾身会長や分科会の資料上の特異度の想定では、1万人の偽陽性が出る、実際の検査結果から想定される特異度では、偽陽性、つまり、ウイルスがいないのに「陽性」結果となってしまう人が、一桁ないしはゼロもしれない、くらいの差があるわけですから。
我々一般人には、99%も99.9%も99.9999%も、ほとんど同じに見えるため、新聞でもテレビでも、また我々も、チェックがひどく甘くなってしまっていたように思います。しかし、実際には特異度が(1) 99%、(2) 99.9%、(3)99.9999%、の各場合では、100万人に検査して、偽陽性が(1)1万人でるか、(2) 1000人出るか、(3) 1人しか出ないか、という天文学的、というと語義上は正確ではないですが、いずれにしろそのイメージに近いたいへんな違いがでます。
実際運用上、数十万人に検査して多くて何人かでるかでないか、程度にも思われる偽陽性者を、百万人に対して検査して、一万人とか千人とかのオーダーで偽陽性がでるから、という想定を一つの大きな根拠として、政府や分科会が、検査に慎重というか、実質的に抑制する方針を取ってきたことの妥当性は、今も、今後も厳しく問われるべきだと思います。