トム&デイヴィッド・チヴァース『ニュースの数字をどう読むか ――統計にだまされないための22章』
☆mediopos2648 2022.2.15
「統計」そのものがもつ問題や信憑性は
とりあえず置いておくとしても
ニュースで報道される「数字」は
とくに「見出し」に見られるように
ほとんどのばあいその文脈や根拠
そして他データとの比較がなされることは少ない
わかりやすさと強い印象づけのためだ
そして多くは伝えたい「結果」ありきで
わかりやすく見える「数字」だけが示される
そこには視聴者がそれをもとに考えていく視点はない
その背景にあるのは
視聴者の科学信仰とメディア信仰であって
示された「数字」もまた信仰されてしまうことになる
ここ数年のCOVID−19をめぐっての報道は
そのことを再確認するための恰好の材料ともなっている
SNS等も含むメディアでの異論の検閲や
限られた視点以外はとりあげられない海外報道など
ある意味で第二次世界大戦中の大本営発表のようにも見える
本書はイギリスでの事例を含む視点だが
日本でも同様にそうしたバイアスの形成を
避けるためのガイドとして有効である
以下の引用にジャーナリスト向けに示された
11のガイドのタイトルを挙げておいたが
その視点から一般のわたしたちも用心すべき点を
いくつか敷衍するとすれば次のようになるだろうか
まず「数字」がどのようなところで
どのように使われているか
その文脈を意識すること
ときにその文脈以外の視点が排されていることがある
また「数字」が示されるとき
それと比較可能な数字も示されているかを確認すること
(たとえば通常年のインフルエンザ等による影響との比較など)
使われている「数字」の出所(権威)がどこにあるのか
また「出所」の「意図」がどこにあるのかを
用心しながら「数字」を理解すること
「数字」がチェリーピッキング(いいとこ取り)である
その可能性を常に意識してそれを受けとること
(その場合ネガティブな結果は隠蔽される可能性が高い)
「出所」の「意図」に関係して
それによる諸利益の有無について意識的であること
多くの場合利益を得る「出所」の「意図」が
そこに深く関わっている可能性は高い
「数字」の出所(権威)に対して
批判的な視点があるとすれば
視点を比較できるようにしておくこと
(大本営発表の「数字」だけでは事実は見えない)
原因と結果との関係づけに
明確な根拠があるかどうかに注意深くあること
「数字」のその影響について
その「出所」が責任をとり得るかどうかを確認すること
本書の序にあるように
「数字」を受けとる際に気をつけなければならないのは
「数字が表しているのは人間、
そうでなければ人間にとって重要な何か」であって
「数字」そのものを鵜呑みにしないようにすることだろう
「数字」を読むときにも
そのためのリテラシーが必要ということだ
■トム&デイヴィッド・チヴァース(北澤京子訳)
『ニュースの数字をどう読むか ――統計にだまされないための22章』
(ちくま新書 筑摩書房 2022/2)
(「序」より)
「本書で私たちは、数字について多くのことを語りたいと思っています。数字がメディアでどのように用いられているかについて、そして数字がいかに間違い、また誤った印象を与えているかについて。しかし、このとき気を付けなければならないのは、こうした数字は何かを表しているということです。たいていの場合、数字が表しているのは人間、そうでなければ人間にとって重要な何かです。」
「私たちはたいていの場合、数字には正解と不正解があると考えますが、それもやはり、多くの場合必ずしも正しくありません。少なくとも本書に出てくるような数字では。たとえば、恐ろしげですが一見シンプルな数字、COVID−19の総死亡者数を例にとりましょう。この場合、私たちはどの数字を使うべきでしょうか? 検査で診断が確定した〝確認済みの〟死亡? それとも、今年の死亡者数を過去数年間の死亡者数の平均と比べた〝超過〟死亡でしょうか? この2種類の数字のどちらを用いるかによって答えはかなり違ってきますし、どちらを使うべきかは、答えようとする質問によります。どちらも誤りではありませんが、どちらかが〝正解〟というわけでもないのです。」
(「第1章 数字はどうやって人を欺くのか」より)
「COVID−19によって世界中の人々は、いちかばちかの超特急で、統計の概念を教えこまれました。人々は突如として、指数曲線、感染致命割合(IFR)と致命割合(CFR)の違い[IFR(infection farality rate)は感染者に占める一定期間内の死亡者の割合、CFR(case fatality rate)は確定診断された患者に占める一定期間内の死亡者の割合]、擬陽性と偽陰性、信頼区間といった用語を理解しなければならなくなりました。そして、こうした用語の中には明らかに複雑なものもありましたが、「ウイルスによる死亡者数」といった単純極まりないと思われるものですら、意味がつかみづらいことがわかってきました。第1章では、一見したところ単純明快な数字が、驚くべきやり方でいかに人々を欺くかを見ていきましょう。
「ニュースの読者やジャーナリストにとって重要なのは、記事の見出しに出て来る数字はより複雑な現実を隠していることがあり、それを理解するためには、さらに掘り下げてみる必要があるということです。」
(「第22章 グッドハートの法則」より)
「経済学の古いことわざに、グッドハートの法則というものがあります。イングランド銀行の前の経済アドバイザーであるチャールズ・グッドハートにちなんで名づけられました。「ある測定値が目標になってしまうと、それはもうよい測定値ではなくなる」という意味です。ドライに聞こえるかもしれませんが深い含意があります。そして、一度気が付くと、それが至るところで起きていることに気づきます。意味するところは、何かをどの程度うまくやれているかを評価するために使う基準は、それが何であれ、人が操作してしまうということです。
古典的な例は教育です。
(・・・)
教師の中には、目標を達成するのにもっとも早くもっとも簡単な方法を見つけようとする人がでてきました。そして、もっとも早くもっとも簡単な方法は、アリストテレス式のバランスの取れた教育(すなわち「健全な身体に宿る健全な精神」を確かなものにし、児童の好奇心を促し、個々の強みを引き出すような教育)ではありません。もっとも早くもっとも簡単な方法は、児童に過去問を山ほど与えて、試験に何が出そうかを教えることです。もっとも早くもっとも簡単な方法は、評価システムを操作することなのです。
(・・・)
医療においても同じようなエビデンスがあります。」
「イギリスのCOVID−19対応が(検査を含めて)適切だったかどうか、そして、そうでなかったなら誰に責任があるのかは、公の審理が避けられない問題であり、分かるまでに今後数年はかかるでしょう。(・・・)目標値、評価の基準、そして統計について読む(または書く)際は、それ自体が大切なのではなく、あくまで大切なことの代理であるということを覚えておいてください。」
(「結論および統計スタイルガイド」より)
「私たちがもっとも重要と考えること、数字に責任を持つジャーナリストのための統計スタイルガイドをお示しします。」
「①数字を文脈の中に置きましょう
それは大きな数字ですか? と自分に問いましょう」
「②相対リスクだけではなく絶対リスクも示しましょう
焦げたトーストを食べるとヘルニアが50パーセント高くなると言われたら心配になります。しかし、ヘルニアがどのぐらい多いのかをまず言ってくれなければ無意味です。」
「③自分が記事に書いている研究が先行研究の公正な代表かどうかを確認しましょう」
「④研究のサンプルサイズを示しましょう−−−−小さければ用心しましょう」
「⑤科学はp値ハッキングや出版バイスなどと戦っているという問題を意識しましょう」
「⑥予測値を1つの数字として出さないでください。信頼区間を示して説明しましょう」
「⑦何かが何かの原因であると言ったりほのめかしたりしている場合は注意しましょう」
「⑧チェリーピッキング(いいとこ取り)やランダムなばらつきには用心しましょう」
「⑨ランキングには気を付けましょう」
「⑩常にネタ元を示しましょう」
「⑪間違えたらそれを認めましょう」
(「訳者あとがき」より)
「数字があると私たちはより詳しく、より正確に分かった気になります。今月は先月に比べてCOVID−19が「すごく増えた」と言うよりも「100人増えた」と言うほうが、具体的と言えば具体的です。しかし、「先月は20人だったが今月は100人増えて120人になった」のと、「先月h2万にだったが今月は100人増えて2万100人になった」のとでは、「100人増えた」の意味はまったく違ってきます。(・・・)数字がありさえすればより詳しくより正確に分かるとは必ずしも言えず、かえって誤解を生んでしまうこともあります。
例を挙げましょう。COVID−19の抗体カクテル療法が日本に導入され始めた2021年9月、NHKで「抗体カクテル療法 約8割の患者回復 軽症者向けで効果 東京都」というニュースが報じられました。見出しの「約8割」からは、抗体カクテル療法は約8割も効果がある画期的な薬という印象を受けます。本文では「この治療を受けた102人のうち82人は症状が回復するか安定したということです」と説明され、8割とは「82÷102」を指していることがわかります。
しかしよく考えてみると、この82人の中には、抗体カクテル療法を受けたために症状が回復するか安定した人と、もし抗体カクテル療法を受けなかったとしてもいずれ症状が回復するか安定した人が混在している可能性があります。言い換えれば、抗体カクテル療法を受けなかった人との比較がない以上、約8割という数字を抗体カクテル療法の効果と捉えることはできません。そのためのこの見出しは読者の誤解を招く恐れがあります。
抗体カクテル療法の特殊承認の根拠となった臨床試験(・・・)では実際に、抗体カクテル療法群とプラセボ群を比較しました。その結果、投薬29日目までに入院または死亡した人は、抗体カクテル療法群は736人中7人(1.0パーセント)、プラセボ群は748人中24人(3.2パーセント)でした。3.2パーセントを1.0パーセントに減らしたのですから、抗体カクテル療法には入院や死亡を約7割減らす効果があると言えます。NHKの記事の「8割」よりは小さいものの、画期的な薬には違いなさそうです。
でも、もう少し数字を眺めてみると、違う側面が見えてきます。抗体カクテル療法群で1.0パーセントが入院または死亡したということは、残りの99.0パーセントは入院や死亡に至らなかったことになります。同様に、プラセボ群は99.8ペーセントが入院や死亡はしませんでした。つまり両群ともほとんど(95パーセント以上)の人は、抗体カクテル療法を受けようが受けまいが入院も死亡もしなかったことになります。両群間の差は2.2パーセント分だけ。「約7割減らす」に比べると、薬の効果がよりリアルに見えてくると思いませんか。」