(7):計算された信頼区間(実現値)をどう解釈するのか

難しいです。はい。(2回目)

こんな問題、簡単じゃん!と思える人は、以下は読まなくていいです。

定義ではなく解釈の問題

この問題がぱっと見難しいのは、私がこれを「定義」の問題だと勘違いしているからかもしれません。この問題は、信頼区間の定義をたずねているのではなく、信頼区間の解釈をたずねています。ここに実は大きな、そしてとても本質的な問題が含まれています。
何それ、ちんぷんかんぷん。と思われた方は、以下をお読みになるともっとわからなくなる可能性があります。ごめんなさい。

定義を確認しよう

まず、私が勘違いしていた、「信頼区間の定義」を確かめましょう。

ある信頼度のもとで示される母数が含まれる区間のことを、信頼区間(confidence interval) といいます。(第8章)
「あらかじめ定められた確率」を信頼度といい、その確率で母数を含むと推定される区間を信頼区間という(第10章)

心理学統計法 ’21 第8章、第10章

これが定義です。しかし、これが次のような表現になると、誤りです。

データから計算された信頼区間$${[1,3]}$$には、95%の確率で母数が含まれていると推定できる。

間違った「解釈

教科書第10章の説明と、上に書いた「間違った「解釈」」は、いったいどこが決定的に違うのでしょう。

確率変数か、その実現値か

違うのは(おそらく)、確率変数の話をしているか、実現値の話をしているか、と言うことだと思います。

教科書第8章や第10章で説明されている「信頼区間」は、確率変数です。
標本平均の信頼区間を求めているという背景を仮に設定して書くと、「データ」という確率変数をもとに「標本平均」という確率変数、「標準誤差」という確率変数を計算し、それをもとに(標本平均±1.96×標準誤差、みたいな式で)「信頼区間」という確率変数を計算していることになります。清水先生の名言によると、信頼区間は確率変数ですから、
幅を持ったままぷるぷる震えている
やつです(「やつ」とか言ってしまった…)。ぷるぷる震えているわけですから、その「幅」の中に母数が含まれているときもあれば、含まれていないときもある。
入っているか入っていないかわからないって? そんなもの信頼できるのか? はい。「95%の信頼度で」信頼できます。なんだそれ?

そう、ライフル銃で射撃体験したことありますか? 私はないです。でも、透明の窓の中に十字の印があって、十字の真ん中に、撃ち落としたいもの(目標物)が来た時に引金を引くと、見事命中する。そんなイメージ、伝わるでしょうか。(ライフル銃とか物騒なたとえで申し訳ないです…)
あの透明の窓が、確率変数としての信頼区間にちょっと近いかもしれません。撃ち落としたい目標物が母数。目標がちょうど真ん中にくるときもあれば、ほんのわずかな力の入れ具合で、窓の端の方に行ったり、反対の方にずれたり、あるいは、目標が窓から完全に外れてしまうこともある。でも、ほとんどの場合、窓のどこかに目標が入っている。「ほとんどの場合」? そう、だいたい95%くらいの確率(信頼度)で。ここまでは確率変数の話。

ここからは、確率変数の実現値の話

いま、上のような状況で(上のような状況を映した映画があるとして、それをDVDかなんかで再生していると仮定して)、再生を一時停止したとしましょう。一時停止したとき、窓の中に目標物は入っていますか? 入っているときもあれば、入っていない時もあるでしょう。でも、「ほとんどの場合」窓のどこかに目標が入るように狙いをつけているのですから、「ほとんどの場合」入っているでしょうね。でも、「必ず」入っているとは言い切れない。運悪く、目標を外してしまった瞬間にポーズボタンを押してしまうことだってあるかもしれない。

実現値とはポーズしたときの静止画のこと

上のたとえ話で、ポーズしたときの静止画状態が、確率変数の実現値です。本来、幅をもってぷるぷる震えているのですが、実際にデータをとり、その値がわかり(確率変数の実現値が得られました)、標本平均値が実際に計算され(標本平均の実現値が得られました)、標準誤差も計算され(標準誤差の実現値が得られました)、そして信頼区間が実際に計算されました(信頼区間の実現値が得られました!)。
たとえ話を思い出してくださいね、たまたまその瞬間にポーズボタンを押して得られた、「静止画」がそれです。このとき、静止画(信頼区間の実現値)の中に、目標物(母数)が入っているかどうかは、「入っている」「入っていない」のいずれかです
「95%の信頼度で母数が含まれる区間」を求める式の通りに計算しているのですから、「まあ、たいてい入っているでしょ?」と思いたいのは人情です。しかし、母数は未知の定数ですから、母数が計算された区間内に入っているかどうかは誰もわからない。「入っている」「入っていない」か、どちらかだ、ということしか、確実にわかることはないのです。
そして、実際に計算された実現値(静止画)について話しているときに、「~%の確率で母数(目標物)が入っている」などという言い方はできません。
想像してくださいね。実際に静止画を見ているのですから(そして、窓の中に目標物が見え隠れしているのも確認しているのですから)、そこに目標物が入っているか入っていないかは、一目瞭然です。なのに、「うん、目標物は95%の確率で入っているね」なんか言ったら、「何言うてんの!」と思われるだけでしょう。通じました?
信頼区間の話が、このライフルの透明の窓の話と違うのは、ライフルでは目標物がちゃんと見えている(だからこそそこに照準を合わせようとする)のに対して、信頼区間では、母数は絶対に見えないことです。だから、そこに合わせようとする努力はできない(無作為抽出という方法がそれにあたるという考え方もできます。この話は長いのでしませんけど)。

余計にわからなくなったらごめんなさい

この話では、確率変数としての信頼区間について、あるいはその実現値について、たとえ話で書いてみました。ライフルの照準の話は、実は書きながら思いついたもので、適切なのかどうかはわかりません。照準を合わせて(緊張しているせいか)腕がぷるぷるし、それにともなった照準の中の絵がぷるぷるしている様子が、確率変数としての信頼区間がぷるぷるしている様子と似ているなあ、と思ったので書いてみました。
詳しい方、もうちょっとましなたとえ話を教えてください。
あと、問題の正解にたどり着くには、ほとんど役に立たない話でしたね。しかたないですよね、雑談だもの。