「未完のゲーム」を終わらせよう〜「数学ガールの秘密ノート／確率の冒険」研究問題5-2

Almond Fish (Motofumi Kozakai)

2024年10月19日 20:02

カバー写真はUnsplashのKarolina Kołodziejczakが撮影した写真。ダジャレですけど。

数学ガール

結城浩先生の「数学ガールの秘密ノート　確率の冒険」を読んで、巻末の「研究問題」についてあれこれ考えています。

結城浩先生の研究問題がとても優れた問題であることは、もう何度も書いていますので繰り返しません（といいつつまた書いています…）。この「未完のゲーム」は、私の頭脳にとってはけっこうキビシイ感じの難問でした。

研究問題5-2

研究問題5-2は、こういう問題です。

第5章〈未完のゲーム〉では、フェアなコインを投げてゲームを行いました。もしも、偏ったコイン（表が出る確率が1/2ではないコイン）を用いた場合は、どのような答えになるでしょうか。

同書より

では、順番に考えていきます。まず、もっとも単純なP(1,1)からです。
表記の約束事を最初に書いておきます。偏ったコインを投げたとき、表が出る確率をpと表記します。また、P(a,b)は、プレーヤーAとBの残り点数がそれぞれa,bであったときに、プレーヤーAが（すなわちコインの表が出た時に1点を獲得するプレーヤーが）勝つ確率を表す関数であるとします。

P(1,1)を考える

コインの表が出る確率はp（＝裏が出る確率は1-p）です。したがって、確率pで表が出てプレーヤーAが1点を獲得して勝ちます。すなわち確率(1-p)で裏が出てプレーヤーBが1点を獲得して勝ちます。ですから、$${P(1,1)=p}$$と書くことができます。

また、P(0,b)は、Aの残り点数が0点で、すでにAの勝ちが決まっています。逆にP(a,0)は、Bの残り点数が0点で、すでにBの勝ち（Aの負け）が決まっています。したがって、$${P(0,b)=1, P(a,0)=0}$$と書くことができます。これは、公平なコインを使ったときと同じです。

P(2,1)を考える

1回目が表なら

まず、1回目のコイン投げで表が出た場合を考えましょう。表が出るとAは1点獲得し、残り点数が1点減ります。表が出る確率はpですから、この式は確率pでP(1,1)に変化します。ただし勝負はまだついていませんから、もう一度コイン投げをして、確率pでAが、確率(1-p)でBが勝つことになります。ここまでを整理すると、こうなります。

1回目が裏なら

では、1回目のコイン投げで裏が出た場合はどうでしょう。裏が出るとBが1点を獲得し、残り点数を1点減らします。P(2,1)は確率(1-p)でP(2,0)に変化します。この場合、Bの残り点数が0になりましたから、すでに勝負は決まっています。が、本文でも議論されていたように、今後のために、あえて2回目のコイン投げを続けます。整理すると、こうなります。

いちおう書いておきますと、結城先生の本では、この段階でP(2,-1)の形は出てきていません。1回目が裏ならもうBの勝ちが決まりますね、ということを図で表していて、関数Pの引数が0や負の数になる場合の解釈については先送りにしています。これを書きながら改めてその部分を読んでみると、とても慎重に、新しいことを一つ一つ（一つだけずつ、と言った方が適切か）議論していることが感じられるのです。すごいなあ、と。今更ながら感心しています。
ですが、ここでは、公正なコインを使った場合の議論をいちおう理解しているという前提で書きますので、いくつかのことを先取りして書き進めます。

まとめると

上の2つの図を数式に表してみます。

$$
P(2,1) = p^2 \cdot P(0,1) + 2p(1-p) \cdot P(1,0) + (1-p)^2 \cdot P(2,-1)
$$

右端に出てきたP(2,-1)は、P(2,0)でBの価値が決まった後にも、あえてコイン投げを続け、「すでに勝ちを決めていたBさんがまたコイン投げで勝ってしまった」形です。これも、P(2,0)と同じく、P(2,-1)=0と置き換えられます。したがって上の式はさらに次のように変形できます。

$$
P(2,1) = p^2 \cdot 1 + 2p(1-p) \cdot 0 + (1-p)^2 \cdot 0 = p^2
$$

結局、第1項だけが残り、P(2,1)でAが勝つ確率は$${p^2}$$だとわかりました。本文でも、「P(2,1)というのは、2回続けて表が出る確率に等し」いというテトラちゃんの発言がありますから（p.209）、正しい結果でしょう。

P(2,2)を考える

上のような図をつかって、P(2,2)を考えます。この図を使いながら、一般化のための準備をしていきます。

コイン投げの最大回数

このゲームで、コイン投げの最大回数は3回です。1回コインを投げるごとに、どちらかが1点獲得し、残り点数が1点減ります。残り点数は両者合わせて4点ですから、3回投げると、必ずP(1,0)またはP(0,1)になり、勝敗が決まります。つまり、最大で$${a+b-1}$$回コイン投げをすれば、必ず勝負が決まります。この数を$${n}$$と表記することにします。

確率での表記

3回のうち、表と裏がどのような組み合わせで出るかは、4通りしかありません。ただし、順序が異なる場合を考慮すると、{表表表}が1通り、{表表裏}が3通り、{表裏裏}が3通り、{裏裏裏}が1通りで、これは二項係数$${{ n \choose k}}$$で、$${n=3}$$の場合に相当します。本文での議論に合わせて、$${k}$$を「裏が出る回数」としておきます。

最終的なP(a,b)の形

たとえば図の一番上の、$${p^3(1-p)^0}$$では、表が3回出ていますから、Aの残り点数が3点減っていることになります。したがって、P(2,2)がP(2-3,2)=P(-1,2)になっています。次の$${p^2(1-p)^1}$$では、表が2回、裏が1回なので、Aの残り点数が2点減り、Bの残り点数は1点減ることになります。したがって、P(2-2,2-1)=P(0,1)です。

Aが勝つための条件

こう考えると、コイン投げをして、裏が出た回数が、Bの残り点数と同じか、それ以上になってしまうと、Bの勝ちが決まってしまうことがわかります。つまりAが勝つ条件は、【裏が出る回数＜Bの残り点数】ということです。裏が出る回数を$${k}$$で表すことにしたので、これは$${k \lt b}$$という式で書くことができます。ただし、kもbも整数ですので、この式は$${k \le b-1}$$と同じです。

P(a,b)の一般化

P(2,2)の図を式に表す

まず、図の右端に整理したものをそのまま（かなり冗長ですが）式に書きましょう。

$$
1 \cdot p^3(1-p)^0 \cdot P(-1,2)+3 \cdot p^2(1-p)^1 \cdot P(0,1)+3 \cdot p^1(1-p)^2 \cdot P(1,0) + 1 \cdot p^0(1-p)^3 \cdot P(2,-1)
$$

式の中に残っているP(-1,2)などは全て、1または0に置き換えられます。また、係数の1,3,3,1は、二項係数を使って表記できます。

$$
{3 \choose 0} \cdot p^3(1-p)^0 \cdot 1+{3\choose1} \cdot p^2(1-p)^1 \cdot 1+{3\choose2} \cdot p^1(1-p)^2 \cdot 0 + {3\choose3} \cdot p^0(1-p)^3 \cdot 0
$$

この式で、二項係数を$${n \choose k}$$と書き表し、pや1-pの指数もこれらの文字を使って書き表すと、総和記号$${\sum}$$でまとめることができます。(1-p)の指数は$${k}$$と同じです。また、pの指数は$${n-k}$$と書くことができます。そうすると、

$$
\displaystyle \sum_{k=0}^{n} {n \choose k} p^{n-k}(1-p)^k
$$

そして、すでに述べたように、すべての項を足し合わせる必要はなく、A
が勝利する条件である$${k \le b-1}$$だけを足し合わせます。よって、

$$
P(a,b) = \displaystyle \sum_{k=0}^{b-1} {n \choose k} p^{n-k}(1-p)^k, \quad (n=a+b-1)
$$

これでできました。

疲れた〜

これで、研究問題5-2に対する回答案の作成は終わりです。疲れた。途中にも書きましたが、こうやって自分で文章にしてみると、結城先生の解説（僕とテトラちゃんとの会話の進め方）が、いかに洗練されて、計算されているのかが実感できます。すごいなあ〜。
と感心したところで、次回はアニメーション版です。でもこれ、アニメーションにするとすごい単純なんですね。あんまり面白くなってない感じがします。でも、いちおう、お楽しみに。