とことんモンティホール

モンティホール問題を定期的に考えているのでまとめ

基本解

画像1

モンティホール問題は、上の決定木(英語版Wikipediaより抜粋)がわかりやすい。挑戦者が選択を変更すると67%の確率で車を当てることができる(注:挑戦者が選ぶドアをDoor1と名付けている)

懐疑への論駁

上記解法とは別の論証を使って誤った解を主張する人に論駁してみよう。

「Door1と残ったドアのどちらかに入っているのだから50%:50%じゃないの?だったら選択変更してもしなくてもよいのでは?」

「あなたは宝くじがあたるか当たらないかのどちらかだからといって、当たる確率は50%だとは主張しないでしょう。それと同じです。二つの選択肢は同じ確からしさではないのです。Door1の当たりやすさは1/3でしょうが、もう片方はDoor2とDoor3の当たりやすさの合計になっているのですから。」

他にも色々な論証とそれへの論駁があるが、ある程度の知識があれば簡単。Wikipediaに一通り記述されている。

派生問題

挑戦者とモンティのゲームとみなそう。挑戦者は「ドア選択」と「ドア再選択」の2回の決定の機会があり、モンティは「開示ドア選択」と「挑戦者への再選択機会提供有無」の2回の決定の機会があるとみなす。

そこで、モンティの戦略を可変にすることで、派生問題を作れる(補足:ドア開示時に車があった場合、TVショーとしてはつまらないが、挑戦者はその時点で失格となり、ドア再選択の機会も与えられず、車は得られないものとする)

さて、我々が気にするのは「挑戦者にドア再選択の機会が与えられている時、再選択をした時の勝利確率が67%でない場合はあるか?」。答えはYesであり、モンティの戦略に応じて0%~100%の任意の値を取れる。

派生1-天使モンティ

モンティの戦略が「挑戦者が最初に車を選んでいた場合には再選択の機会を与えず、そうでない場合にはヤギのドアを開示して再選択の機会を与える」である場合、挑戦者が再選択をした場合の勝利確率は100%になる。

派生2-悪魔モンティ

モンティの戦略が「挑戦者が最初に車を選んでいたらドアを開示して再選択の機会を与え、そうでない場合には再選択の機会を与えない」である場合、挑戦者が再選択をした場合の勝利確率は0%になる。

派生3-無知モンティ

モンティの戦略が「ドアを無作為に開示して、可能なら(つまりヤギがでたら)再選択の機会を与える」の場合、挑戦者が再選択をした場合の勝利確率は50%になる。

派生4-嗜好を持つモンティ

モンティの戦略が「必ずヤギが出るようドアを開示するが、両方がヤギだった場合かつある特定のドアが開示可能な時にのみ、無作為ではなく、そのドアを確率qで選択する。挑戦者には再選択の機会を与える」の場合、その特定のドアが開示されたという条件の下で、挑戦者が再選択をした場合の勝利確率は100/(1+q)%になる。q=1/2 の時は、オリジナル同様67%の勝率となるが、それ以上にもそれ以下にもなりうる(が、挑戦者が別のドアを選ぶべきだという結論に変わりはない)。

非協力ゲームとナッシュ均衡

挑戦者は車を得たくてモンティは車を渡したくないという非協力ゲームとして考えよう。気になるのは挑戦者がモンティの戦略を知りえず、モンティもまた挑戦者の戦略を知りえない場合、両者の取るべき合理的な戦略の組み合わせはどうなるだろうか(ナッシュ均衡は何であろうか)?

ゲームの定式化の仕方によって挑戦者の勝率が67%の場合と33%の場合の二つがある。

ナッシュ均衡1

ゲームを以下のように定める「1. モンティがドア3つのうち1つを車として選ぶが、挑戦者にはそれを秘密にする 2. 挑戦者はドア3つのうち1つを選びモンティにそれを教える 3. モンティは挑戦者が選ばなかったドア2つのうち1つを選びドアを開けて挑戦者に中を見せる 4. 挑戦者はドアのいずれか一つを選び中のものを獲得する」。

この場合のナッシュ均衡をなす戦略の組み合わせは、ほぼオリジナルの問題と同様となる。モンティの戦略は「無作為に車の場所を選び、開けるドアは車が入っておらず挑戦者が選んでいないものの中から無作為に選ぶ」挑戦者の戦略は「最初は無作為にドアを選び、二回目は一回目とは別のドアを選ぶ」。モンティは挑戦者の戦略がどうであれ67%を超える確率で負けることはないし、挑戦者は少なくとも67%の確率以上で勝てる。

ナッシュ均衡2

モンティが再選択の機会付与の権利を握れる場合の定式化。すなわち上の節のルール3. をしなくてもよい時を考える。モンティのとれる選択肢が多くなるので答えが変わる。

この場合のナッシュ均衡をなす戦略の組み合わせはだいぶ違う。モンティの戦略は「無作為に車の場所を選び、再選択はさせない」、挑戦者の戦略は「無作為にドアを選び、再選択の機会があってもしない」となる。モンティは挑戦者の戦略がどうであれ33%を超える確率で負けることはないし、挑戦者は少なくとも33%の確率以上で勝てる。

最後に

- 日本語よりも英語のWikipediaの方が記述が充実している
- 鳩もちゃんと正しい戦略を学ぶらしい