バットマンの活動期限3年という重大な読み間違い〜データの解釈の重要さ〜
実は私、結構なバットマンファンです。
もちろん、この前公開されていたThe Batmanも観ましたよ!バットマンのフォーマットでも謎解きミステリーを当てはめられるという証明がなされたように思い、個人的には感動でした。
ただ、尺が長すぎる。
最後のエピローグパートいらないでしょ…と思いましたが、名作です。
そのバットマンはよくデータ界隈ではスーパーマンや他のヒーローと異なり、普通の人間であるためにデータ予想では余命3年になるというフレーズが有名だ。
しかし、これこそデータ分野で知見がない人間が出すインフレ的誤謬なのです。
ロジックで考えてみましょう。
いくら普通の人間とは言え、アンビリーバブルなスーパーパワーを持った人は多くいます。
野球の大谷翔平とか、サッカーのクリスティアーノ・ロナウドやメッシなんかもそう。
この辺のスーパースターは、スタッズも普通の選手とはかけ離れていて、データ統計上はノイズとして処理されてしまう。
これを外れ値と言います。
この外れ値はデータクレンジングという処理でなかったことにされることが多々あります。
では外れ値を処理すると、クリスティアーノ・ロナウドが、37歳でエヴァートン戦で子供の手を叩く疑惑が起こることは予想できても、まさかその次の試合でハットトリックを決めるなんて予想やシミュレーションは出てこない。
また大数の法則を考えてみても、この3年というのは区間推定もなく、人間の平均寿命に対していかに短く精度が低いかがわかる。
そもそも、通常では考えられないことを連続させ、予想不可能な超人をヒーローと呼ぶのであり、DC アメコミのヒーローであるバットマンが、常人の統計を出されても何の価値もない。
この想定できないことを想定できるとすることが、インフレ的誤謬を生むのである。
例えば、エコノミストが予想するマーケットの未来予測は大抵信じられないのはこの辺の理由である。
あの有名なヘッジファンド、プライスウォーターハウスクーパースのレイ・ダリオでさえ、かつて目算を誤ったのだ。
いわんや、このバットマン問題くらいは目を瞑るとしよう。