麻雀における平均順位のぶれ
目次
1 はじめに
2 信頼区間について ~平均順位のぶれる範囲~
3 信頼区間の使い方 ~簡易な実力の評価方法~
4 まとめ
1 はじめに
今回のテーマは平均順位は試合数によってどの程度ぶれるのかについて。
例えば、次の問題を考える。
(問1)
平均順位2.5、順位率が総て等しい者が2000試合打った。
(小問1)その人の現実的な平均順位は約70%の確率でどの範囲に入っていると言えるか(所謂70%信頼区間)。
(小問2)その人の現実的な平均順位は約95%の確率でどの範囲に入っていると言えるか(所謂95%信頼区間)。。
(小問3)平均順位2.4の者が2000試合打った場合の95%信頼区間はどうなるか。
現実的に即せば次のような問題を考えるべきだろうか。
(問2)
5000試合打ったものが平均順位2.35をマークした。この者の実力は最低でもどの程度あると考えるべきか。
2 信頼区間について ~平均順位のぶれる範囲~
まずは、70%信頼区間、95%信頼区間について調べる。
なお、具体例として平均順位2.5のケースについて書いた。
しかし、平均順位2.3~2.7(鳳凰卓や特上卓で現実的に取りうる平均順位の範囲)であれば、信頼区間の幅は大差ない。
平均順位2.4のケースは平均順位2.5の信頼区間の上限、下限それぞれから0.1を引けば良い。
信頼区間の幅を見ればそのままその表の数値は使える。
早速、表をご覧いただこう。
打った試合を100試合から100000試合とした場合における、順位分布が25%、25%、25%、25%のプレーヤーの平均順位のぶれ(70%信頼区間、95%信頼区間)は次のとおりである。
ラベルの使い方を説明する。
70%信頼区間(厳密には69.2%だが、70%と書く)というのは「(平均値)ー(標準偏差)」から「(平均値)+(標準偏差)」までの値を示したものである。
例えば、2000試合打った場合の70%信頼区間が2.475~2.525となっている。
これは、2000試合打った場合に平均順位が2.475~2.525となる確率が70%であるということである(問1、小問1の解答)。
ちなみに、外側は上下あわせて30%ということであるから、2.475より下がる確率、2.525より上の確率はそれぞれ約15%である。
約7分の1だから生じにくい現象ではあるが、たまたま起きた可能性は否定できない。
次に、95%信頼区間(厳密には95.4%だが、95%と書く)というのは「(平均値)ー2×(標準偏差)」から「(平均値)+2×(標準偏差)」を示したものである。
例えば、2000試合打った場合の95%信頼区間が2.45~2.55となっているが、1000試合打った場合に平均順位が2.45~2.55となる確率が95%であるということである(問1、小問2の解答)。
ちなみに、外側は上下あわせて5%ということであるから、2.45より下がる確率、2.55より上の確率はそれぞれ約2.5%である。
2.5%となれば(0ではないにせよ)稀であると考えてもよいだろう。
70%信頼区間の幅の半分というのはn試合打った場合の平均順位の標準偏差である。
95%信頼区間の幅の半分というのはn試合打った場合の平均順位の標準偏差の2倍である。
なお、今回は平均順位2.5の信頼区間の話をした。
しかし、信頼区間については平均順位2.3~2.7でもトップ率とラス率の和が60%あるようなトップラス麻雀でも大差ない。
順位分布を現実的な範囲で変動させることによって、1試合あたりの平均順位の分散は1.1~1.45に変動する(すべての順位率が同じ場合の分散は1.25)。
しかし、信頼区間の幅は平均順位2.5のケースと比較して0.9~1.1の間に収まるので、平均順位2.5のケースと同様に考えてよい(もちろん、別途計算してもよいが、誤差は僅少である)。
だから、平均順位2.4のプレーヤーが2000試合打った時の95%信頼区間は2.35~2.45である(問1、小問3、なお、厳密に計算したならばそっちを優先してよい)。
このように信頼区間を求め、用いることで、プレーヤーの実力が既知の場合、そのプレーヤーの順位分布がどの範囲でどの程度入るかを調べることができる。
これが信頼区間の価値である。
3 信頼区間の使い方 ~簡易な実力の評価方法~
信頼区間は実力が既知の場合に分かるものである。
とすれば、実力が未知の場合には使えないのが原則である。
しかし、実力が既知の場合の信頼区間を用いれば、次のような使い方をして、実力の範囲を推測することができる。
そのロジックは次の通り。
(なお、片側検定を使うといったことは考えないものとする)
① 2000試合打ったところの平均順位Aの95%信頼区間はB~Cである。
② 2000試合打ったところ、平均順位Aの人間が平均順位B以下をマークする確率は2.5%であり、稀である(可能性が低い)。
③ 私は2000試合打ったところの平均順位はDをとったが、DはBより低い。
④ 私が平均順位Aの実力であれば、平均順位Dをマークする確率は2.5%以下であり稀である。
⑤ よって、私の実力が平均順位Aより下(弱い)である可能性は低い。
⑥ 以上より、私が平均順位Aより下(強い)である可能性はは高い。
簡単に書くと、
実力Aの者が平均順位Dを取るのは稀である。
しかるに、私は平均順位Dをマークした。
よって、自分の実力はAではない(Aより上、下である)。
になる。
具体例を用いて説明しよう。
例えば、問2のケースを用いる。
私が5000試合で平均順位2.35をマークしたとする。
この場合、この人の実力をどう見積もれるかを見てみよう。
① 5000試合打ったところの平均順位2.39の95%信頼区間は2.358~2.422である。
② 5000試合打ったところ、平均順位2.39の人間が平均順位2.358より下をマークする確率は2.5%であり稀である。
③ 私は5000試合打ったところの平均順位は2.35をマークし、それは2.358より低い。
④ 私が平均順位2.39の実力であれば、平均順位2.35をマークする確率は2.5%以下であり稀である。
⑤ よって、私が平均順位2.39(より上)である確率は低い。
⑥ 以上より、私が平均順位2.39より低い確率は高い。
こう使うことによって、自分の実力の範囲を決めることができる。
今回は平均順位の下限(実力の上限)を決める際に用いたが、逆に用いれば、平均順位の上限(実力の下限)を決めることもできる。
ぜひ、実力の推測に役に立てていただきたい。
それでは。
4 まとめ
(信頼区間関係)
① 麻雀は運ゲーであるが、実力が一定の場合、多数試合打てば、平均順位は一定の範囲に収まる。例えば、平均順位2.5のプレーヤーが1000試合打って平均順位2.8以上、平均順位2.2以下をマークする確率は1億分の1以下である。
② 平均順位2.5の者がn試合打った場合に70%の確率でこの範囲に入る、その領域のことを70%信頼区間と言う。
③ 平均順位R、標準偏差をσとした場合の70%信頼区間の求め方は「R-σ~R+σ」である
④ 平均順位2.5の者がn試合打った場合に95%の確率でこの範囲に入る、その領域のことを95%信頼区間と言う。
⑤ 平均順位R、標準偏差をσとした場合の95%信頼区間の求め方は「R-2σ~R+2σ」である。
⑥ 信頼区間の具体的な数値は上の表のとおり
⑦ 平均順位が現実的な範囲で変わっても標準偏差は同じとみてよい。だから、上の表は平均順位が2.5出ないケースでも利用できる。
⑧ 上の表はモデル値である(平均順位Rの者が1000試合などを打った場合の順位分布を求めたものである)。
(以下、実力の判定関係)
⑨ 95%信頼区間から、実力が平均順位に換算してRの人間が採りうる平均順位の範囲を定めることができる。
⑩ 実力が平均順位に換算してRの人間が採りうる平均順位の範囲がA~Bとした場合、Aより下、Bより上の平均順位をマークすることはない(正式に説明すれば可能性が低い)
⑪ とすれば、仮に、具体的なプレーヤーが平均順位A以下、B以上をマークした場合、その人の実力は平均順位に換算してRではないことになる(厳密には可能性が高い)。
⑫ ⑩と⑪を繰り返すことによって、現実のプレーヤーの実力の範囲を決定することができる。
もし気が向いたら、サポートしていただければありがたいです。 なお、サポートしていただいた分は、麻雀研究費用に充てさせていただきます。