見出し画像

#66「ドアを開けば世界が変わる:モンティホール問題で学ぶベイズ思考の威力」

デデデータ!!〜“あきない”データの話〜第32回「モンティーホール問題から考える「モダンな確率」の話:ベイズ統計の活用法の台本・書き起こしをベースに、テキストのみで楽しめるようにnote用に再構成したものです。

はじめに

「ある選択をしたあと、新しい情報を得た場合、その選択をどう見直すか」。この問いは、確率や統計に深く結びついている。数学や統計の世界では「モンティホール問題」が直感と論理のギャップを示す代表例として有名だ。さらには「ベイズ統計」という考え方が近年注目を集めており、医療やビジネスにおける意思決定を大きく変えつつある。ここでは、モンティホール問題の概要とその拡張版、そしてベイズ統計のエッセンスや伝統的統計との違い、さらに日常的な事例までを一挙に整理してみる。


モンティホール問題とは何か

モンティホール問題は、1960年代アメリカのゲームショー番組で登場したシンプルな確率の問題がもとになっている。司会者モンティ・ホールは、挑戦者がドアを選んだあとに「外れ(ヤギ)」のドアを開けて見せる。そこから生まれる「ドアを変えるべきか、変えないほうがよいか」という問いが数学的に深い議論を招いた。

具体的には3つのドアA・B・Cがあるとき、どれか1つに新車(当たり)が隠され、残り2つにはヤギ(はずれ)がいる。プレイヤーは最初に1つのドアを選ぶ。ここで当たりを引く確率はもちろん1/3だ。モンティは外れのドアを知っているので、残り2つのうち必ずヤギのドアを開ける。すると閉まったままのドアが自分の選択したドアAともう1枚のドア(仮にCとしよう)の2枚だけになる。その時点で「ドアAからCに変えるか、あるいはAのままにするか」と問われたとき、通常は「どちらも当たる確率は1/2じゃないのか」と思う。しかし正しい結論は「ドアを変えたほうが当たる確率は2倍になる」というものだ。

はじめに選んだドアが当たりである確率は1/3で変わらない。一方、残りの2枚のドアのなかでモンティがはずれを開けたことで、もう1つのドアが当たりである確率は2/3になる。これは直感に反するが、何度もコンピュータでシミュレーションしても結果は同じである。大論争を巻き起こしたのは、世界一のIQを持つとされるマリリン・ボス・サヴァントが「ドアを変えたほうが確率的に有利だ」と回答したところ、多数の数学者や博士号保持者から「間違っている」という投書が1万通以上も届いたという歴史的エピソードが背景にある。


100個のドアに拡張するとどうなるか

3つのドアのバージョンでは直感とのズレがやや分かりにくいと思う人もいるかもしれない。そこでドアを100個に増やすと、その効果は如実にあらわれる。

  1. プレイヤーは100個のドアのうち1つだけ選ぶ。このとき、選んだドアが当たりである確率は1/100である。

  2. 残り99枚のうち、司会者モンティは98個の「はずれ(ヤギ)」ドアを開けて見せる。残るのはプレイヤーの選んだドアと、もう1つ別のドア(ドアX)の2つだけになる。

  3. 最初に選んだドアが当たりである確率は、モンティが何枚開けようが1/100のままだ。一方、ドアXが当たりである確率は99/100にまで跳ね上がる。

こうなると、直感的にも「自分が選んだドアに当たりがある確率は1%しかないだろうに、そのまま固執するのは不自然だ」と感じるはずだ。モンティは常に“はずれ”だけを確実に開けてくれる。そのため「残りのドア」の確率がそっくりそのまま移行してくるのである。


直感の落とし穴

多くの人は、モンティがドアを開けたあとに「残った2つを比較するのだから1/2だ」と直感する。しかしこれは、新たに提供された情報が確率に影響を与えていないという誤解に基づく。同様の誤解は日常生活でも起こりやすい。「一度決めたことは変えないほうがよい」と考えたくなる心理や、ある時点での観測から「状況はもう変わらない」と考える傾向が災いする。その意味で、モンティホール問題は「情報が追加されたとき確率は再評価(更新)される」という重要な教訓を示している。


日常生活への応用

●子どもの発熱をどう考えるか

たとえば、朝、娘の体温を測ったら36.9度あったとする。平熱36.2度より少し高く、「これは風邪かもしれない」と疑う。それだけなら決定打にはならないが、さらに保育園の状況を聞けば「10人中4人が風邪で休んでいる」という情報が得られたとしよう。この追加情報によって「娘が風邪である確率」は一気に高まる。実際、仮に風邪をひいている人の多くが発熱する確率を80%とすれば、統計的には、保育園で4割も休んでいる時期に娘の体温が上がったとなれば、元の40%という数字は70%を超えるレベルに“更新”される。これもベイズ的な確率の発想に通じる話だ。

●インフルエンザ検査

医療現場での「インフルエンザ検査をするかどうか」も同様だ。元々インフルエンザと診断される確率が10%程度の時期と、インフルエンザが大流行している時期では、同じような“風邪っぽい”症状でも「インフルエンザである確率」は大きく異なる。病院はこうした流行状況や症状の一致度など、絶えず更新される情報をベイズ的に取り込んで「検査をするか」「タミフル等を投与するか」を判断しているのである。


■ベイズの定理とは何か

このように、新たな情報が得られるたびに確率を更新していく考え方を数学的に裏づけるのが「ベイズの定理」だ。18世紀の聖職者トーマス・ベイズが提唱したものであり、いまでは機械学習や医療、経済学、マーケティングなど多様な分野で応用されている。

ベイズの定理をシンプルに書くと、

ベイズの定理

という形になる。左辺は「あるデータが観測されたとき、その仮説が正しい確率」であり、これを「事後確率」と呼ぶ。右辺には「仮説が正しいときにそのデータが出る確率」(条件付き確率)や、「仮説が正しいと考えるもともとの確率」(事前確率)が含まれる。観測データは、新しい情報として事後確率を更新するカギになるわけだ。


ベイズ統計がいま注目される理由

ベイズ統計は古くから存在したが、長らく主流ではなかった。理由はいくつかある。まず「頻度主義」と呼ばれる客観的な確率観が19〜20世紀初頭に強く支持されていたこと。大規模な反復実験で長期的頻度を計測する統計こそが科学的とみなされたのだ。次に、ベイズ統計の計算は複雑であり、手計算では困難を極める。当時はコンピュータ技術が未発達だったため、ベイズ理論を実務に使うのはほぼ不可能だった。

ところが20世紀後半以降、コンピュータの発展によって大規模データを扱うことができるようになり、さらにMCMC(マルコフ連鎖モンテカルロ法)などの新手法も登場した。ビッグデータ時代には、データ量が膨大であればあるほど、事前確率やパラメータを柔軟に更新するベイズ統計が有利に働く。そのため近年、AIや機械学習の領域でもベイズアプローチが再評価されている。


伝統的統計との比較

●頻度主義統計とは

頻度主義統計の典型例として「帰無仮説の棄却」がある。例えば「普通の宝くじは100枚中20枚当たる(20%)」という前提があるとしよう。新しい宝くじを試しに100枚買ったら60枚当たった。もし本当に20%が正しければ、60枚もの当たりが出る確率は極めて低い(端っこの極値)。ゆえに「帰無仮説を棄却する=この新しい宝くじは当たりやすいに違いない」という結論に至る、という流れだ。これはいわば「分布の外側に出るくらいの結果なら通常では説明できない」というアプローチである。

●ベイズ統計的アプローチ

一方でベイズ統計なら「そもそも新しい宝くじが当たりやすいかどうかの仮説(事前確率)」を置き、それに観測データ(60枚当たった)をかけ合わせることで「新しい宝くじが当たる確率は何%に更新されたか」を計算する。その結果「初めは20%だと思っていた当選率が、観測結果を踏まえると80%くらいに上昇した」というように数値をアップデートしていく。どんなに仮説が低い確率でも、大量の強力なデータが加われば、ぐんと確率が上方修正される。これは、まさにモンティホール問題の核心「最初に選んだドアの確率は固定ではない。追加情報が入るたびに再評価すべきだ」という考えにつながる。


まとめ

モンティホール問題は「3つのドアから1つを選ぶ」というシンプルな設定でありながら、多くの人の直感を裏切るために大論争を招いてきた。その本質は「一度選んだ確率が、追加の情報によって変化することを理解できるか」という点にある。さらに、この情報更新の論理的基盤となるのがベイズの定理であり、ベイズ統計が多種多様な分野で再評価されているのは、コンピュータの飛躍的な進化とビッグデータの到来が大きい。

日常生活でも、子どもの微熱やインフルエンザの流行を考え合わせるといった、確率を更新しながら判断する場面は無数にある。伝統的な統計が「帰無仮説を棄却できるか」という二値的な世界観を重視するのに対し、ベイズ統計は「どの程度確率が上がったか」という連続的な更新を許容する。これからの社会では、状況が刻々と変化するなかで素早く確率を見直せる人・組織が有利となるだろう。モンティホール問題の結末に驚くのではなく、「なぜそうなるのか」を理解することが、柔軟な思考とデータ活用の第一歩である。


ディスカッションノート

論点の整理

  1. モンティホール問題

    • 3つのドアのうち1つが当たり(車)、残り2つがはずれ(ヤギ)の状況で、最初に選んだ後に司会者がヤギのドアを1つ開ける。

    • 「最初のドアに固執すべきか、もう1つのドアに選択を変更すべきか」で大論争が起こった。

    • 数学的に正しい結論は「ドアを変更したほうが当たる確率が2倍になる」。

  2. 拡張例:ドアが100個あったら?

    • 初期選択で当たる確率は1/100。

    • 司会者が98個のハズレを開けてくれたら、残るドア(自分が選んだものを除いた“もう一つ”)が当たる確率は99/100にアップする。

    • 「新情報」(司会者がはずれを開ける)を得ることで、確率の評価が大きく変わる。

  3. ベイズ統計の考え方

    • 事前確率(Prior)を置き、観測データ(あるいは新情報)によって事後確率(Posterior)を更新する。

    • 「最初に選んだドアが当たる確率は変わらず」「残りドアが当たる確率を再評価すると高くなる」という構造も、ベイズの発想でとらえることができる。

    • 医療やマーケティングなど、複数回にわたって情報が更新される現場で活用されやすい。

  4. 日常的・実務的な示唆

    • 「一度決めたことでも、新しい情報で確率を見直せば意思決定が変わりうる」という教訓。

    • 確率は固定値ではなく、状況の変化や追加のデータにより刻々とアップデートされる。

    • 決断力と柔軟性を両立するために、ベイズ統計的な発想を身につけるのは有益。


専門用語解説

  1. 事前確率(Prior Probability)

    • 新しい情報を得る前に、もともと「ある出来事が起こる」と考えている確率。例:「宝くじは100枚中20枚が当たるはず」といった前提。

  2. 事後確率(Posterior Probability)

    • 追加のデータや観測結果を得て更新された後の確率。例:実際に引いてみて60枚当たった → 「新しい宝くじはもっと当たりやすいかも」というふうに再評価した確率。

  3. 条件付き確率(Likelihood / 条件付き確率)

    • ある仮説(例:「この宝くじは20%の当選率を持つ」)が正しいとき、今回の観測データ(「60枚当たり」)が起こる確率のこと。

  4. 周辺確率(Marginal Probability)

    • いくつかの可能性をすべて合算した全体確率を指す。ベイズの定理で分母に入る値。

  5. 帰無仮説(Null Hypothesis)

    • 「何の差も効果もない」ことを仮定するための前提。これを棄却すると、差や効果がある(今回の場合は「新しい宝くじが明らかに当たりやすい」)と結論づけられる。

  6. MCMC(マルコフ連鎖モンテカルロ法)

    • ベイズ推論などで用いられる計算技法。複雑な確率分布からサンプリングを繰り返し、事後確率を推定するために使われる。


身近な事例で解説

3-1. 子どもの風邪と保育園の流行状況

  • 朝、娘の体温がいつもより高めという情報だけだと、「風邪かもしれない」という推定にとどまる。

  • しかし「保育園で40%の子が風邪で休んでいる」という追加情報が得られると、「うちの子も風邪である確率」が一気に上昇する。

  • 保育園の流行状況+高めの体温→事後確率の大幅アップ。これこそベイズの「追加情報で確率を更新する」考え方。

3-2. インフルエンザ検査のタイミング

  • 流行期のインフルエンザは事前確率が高いため、同じ症状(例えば「せき、発熱、関節痛」など)を持つ患者が来れば、「インフルエンザである」確率が高まる。

  • 一方、流行していない時期の同じ症状なら「単なる風邪の可能性」が高くなる。

  • 病院は患者の訴えや周辺情報を使い、「検査が必要か」「ただの風邪か」をベイズ的に見直すわけだ。

3-3. 天気予報の更新

  • 朝7時の予報では「雨が降る確率は20%」だったとする(これが事前確率)。

  • しかし9時になって急に雲行きが怪しくなり、気象衛星からのデータが示すところによると、局地的に雨雲が急速に発達しているようだ。

  • 新しい観測データが入ると、天気予報は「雨が降る確率40%」と更新される(事後確率)。

  • このように「天気予報が1日に何度も変わる」ことが、ベイズ的な確率アップデートのわかりやすい例。

3-4. アラームの誤作動と防犯意識

  • 自宅の防犯アラームが鳴ったとき、「誰かが侵入した」確率を最初は低い(1%以下など)と想定していたかもしれない。

  • しかし実際に外カメラをチェックしてみたら、ドア周辺に不審な人影がちらりと映っていた(新情報)。

  • この瞬間、「侵入者がいる」可能性が一気に高まる。

  • さらに警察が付近で侵入未遂事件の報告を出していたなら、確率はさらに上がる。

  • こうして**最初の確率(アラーム誤作動の可能性が高い)→ 追加情報(人影)→ さらに追加情報(近所の未遂事件)**で、確率が段階的に更新され、防犯対応が変わってくる。

3-5. メールのスパム判定

  • メールソフトには「スパムと判断した単語が入っているか」「メールヘッダ情報が怪しいか」など、複数のシグナルを用いたベイズフィルタが組み込まれている場合がある。

  • はじめは「差出人が怪しいサイトドメイン」→ スパム度30%くらい。

  • さらに本文で「クレジットカード情報を要求」「怪しいURLリンクがある」→ スパム度70%に引き上げ。

  • もっと深堀りすると「本文が定型文である」「ウイルス感染が確認されたPDFが添付されている」→ スパム度90%超え。

  • 新しい特徴量を見つけるたびに、スパム判定確率(事後確率)が上がっていくのはベイズ的な更新プロセスだ。

3-6. マーケティング施策や広告配信

  • 例:ネットショップでの広告バナー

    • 前回のキャンペーンでは「クリック率が5%」だったが、新しいデザインに変えたら「10%」に上昇したという観測を得る。

    • 最初は「バナーを変えてもそんなに効果はない」と思っていた(事前確率が低い)。

    • だが、実際に二週間のテストを行いクリック率が顕著に上がったので、「新しいバナーが効果的である確率」を大きくアップデートする。

    • 続けて、さらにABテストを行いデータを追加するごとに、「新バナーは従来の2倍以上効果が高い」「いや、たまたま週末だけ伸びた可能性がある」などを検証して確率を更新していく。

3-7. 車のトラブル診断

  • エンジン警告ランプが点灯した時点で、「オイル不足」「燃料系統の不具合」「センサーの誤作動」など、複数の故障要因が想定される。

  • 「オイル漏れの痕跡がある」「過去に同じエラーでセンサー交換した履歴がある」などの追加情報を得るたびに、「どの故障が起きているか」の確率が変わる。

  • 整備士が一度に全ての部品を換えるわけではなく、症状と照合しながら少しずつ原因を特定していくプロセスは、ベイズ推論の典型例だ。


ディスカッションの視点

  1. 確率の“再評価”をどのように組織で共有するか

    • 「最初の判断がすべて」と思い込む組織風土は、柔軟な意思決定を妨げる要因になりやすい。

    • データを集め、新情報を加味して「いまの仮説は本当に正しいのか」を見直す文化が重要。

  2. 直感 vs. 数学的事実

    • モンティホール問題のように、直感が裏切られるケースでは納得に時間がかかる。

    • 組織やチームメンバーにどう説明・合意形成していくかが現場の課題。

  3. ベイズ的思考の導入ハードル

    • 「事前確率をどう設定するか」「事前分布に何を使うか」など主観的要素も大きい。

    • データサイエンスの現場では計算手法(MCMCなど)にソフトウェアが使われることが多いが、原理の理解と運用ノウハウは依然として重要。

  4. ビッグデータ時代での利点

    • データ量が膨大なほど、ベイズ推論が強力に機能し、新しい情報で細やかなアップデートが可能になる。

    • AI・機械学習分野では、ベイズベースのアルゴリズム(推定・分類など)が再評価されている。


いいなと思ったら応援しよう!