見出し画像

確率と統計の美しき相補性 ~離散から連続へ~

『神はサイコロを振らない』

というのはアルベルト・アインシュタイン

「この世界が不確定で
確率的な存在である訳がない」

という一般人からすると至極当然の主張・立場を端的に表現したものです。

(アルベルト・アインシュタイン:1879~1955)

 しかしながら実際には、我々が日々使う電子機器🖥️、それから人体の🫁においても、”確率的な挙動”は観測され、現実は「神はサイコロを振るのだ」と分かってしまったというのが現代物理学の常識です。

※2022年度ノーベル物理学賞の受賞内容

 【確率】とは、とても身近でありながら世界の本質であるのが、非常に興味深いトピックです。しかしながら、一般人にはしきの高い学問であることもまた事実です。

 この記事では、そんな一般人でも確率論・統計学の雰囲気をかる~くつかめることを目的としています。まずは気負いせず、珈琲コーヒーを片手に、ゆっくり読んでみてください😆☕


確率 ⇌ 統計


 天気予報でよく聞く”降水確率○%”は、過去の気象データをちくせきさせることにより算出しています。データを収集してアレコレ議論をするのが【統計】で、【確率】とはえんが深い……どころかズブズブです。

 【統計】から【確率】をさだめるほかに、確率にはもう一つの側面があり、

  • サイコロ(1, 2, 3, 4, 5, 6)

  • コイン(表, 裏) etc.

のような「カジノ・ゲーム等で使うに適した物」に対して、同様に確からしい(=確率はどれも等しい)と【確率】をあらかじめ決めてしまうこともできます。

「このサイコロには、
出る目に偏りがあるか?」

という問題に対しては、

まず、どの目も出る【確率】は等しく$${\dfrac{1}{6}}$$と仮定する。

(離散型:公平なサイコロ)

沢山振りまくってデータを収集する(【統計】を取る)。

(離散型:疑惑のサイコロ)

大量のデータを基に、【確率】の是非を問う(必要なら更新する)。

(VS🤔)

というステップを踏んで課題解決をするのが現代流で、

【確率】⇌【統計】

という相補的な関係はとても重要なのです。

離散 vs 連続


 一般用語としては、

  • 離散・・・「はなれてっているさま」

  • 連続・・・「つらなりつづいているさま」

を表しますが、数値を扱う分野(この文脈)では、

  • 離散・・・「数値がとびとびであるさま」
     例)サイコロの目:1, 2, 3, 4, 5, 6

  • 連続・・・「数値が途切れず繋がるさま」
     例)身長:150cm, 150.001cm, …

を表すため、離散と連続は対立する概念です。

 義務教育+高校数学あつかう【確率】は、【離散】的な場合に限定されており、【連続】的な場合は大学数学以降で微積分を基礎とします。

精度とグラフ


 これから”連続なる確率”を考えますが、残念なことに原理的に無限小数$${140.33333\ldots\text{cm}}$$を計れる器具は存在せず、常に測定精度$${\Delta }$$が付きまといます。

 例えば、

「同年代の身長」を
グラフで表現したい!

という課題を考えます。ここで、

cm単位で計れるものさし”
mm単位で計れるものさし”

という2種類のものさしが支給されたとします。そして中途半端な身長は、最も近い目盛りの値(四捨五入)とします。すると、測定結果は精度の向上に伴い、ドンドンと細分化されていくはずです:

$$
\newcommand{\cm}{\text{cm}}
\newcommand{\mm}{\text{mm}}
\newcommand{\san}{\texttt{\scriptsize{さん}}}
\begin{array}{l|ccccc}
&\textsf{A}\san&\textsf{B}\san&\textsf{C}\san&\textsf{D}\san&\cdots\\
\hline\hline
\raisebox{0.2pt}{\text{\textcircled{\scriptsize{1}}}}:\,\,\cm \texttt{ものさし}
&152\cm&\bm{160\cm}&\bm{160\cm}&172\cm&\cdots\\
\raisebox{0.2pt}{\text{\textcircled{\scriptsize{2}}}}:\mm \texttt{ものさし}
&151.9\cm&\bm{160.2\cm}&\bm{159.7\cm}&171.6\cm&\cdots\\
\end{array}
$$

(①:cmものさし - イメージ図)
(②:mmものさし - イメージ図)

※%表記は一例です。160cmは更に159.5cm~160.4cmの10段階に細分化されます。

 つまりは、目盛りの間隔(=精度)$${|\Delta|}$$をゼロに近づける過程で細分化が進み、

$${x\text{cm}}$$と測定されるヒトの割合$${P(x)}$$

ゼロに近づくということです。これは、精度の向上$${|\Delta|\to0}$$において、$${P(x)\to0}$$となるせいで、確率$${P(x)}$$のグラフは$${x}$$軸にベッタリで使い物にならないことを意味します。

離散から連続へ


 「確率$${P(x)}$$のグラフ」を描くことはかないませんが、先人たちはあきらめることなく次のように思考するでしょう:

$${x\text{cm}}$$に丸め込む(割合$${P(x)}$$を決定する)範囲$${\Delta x}$$を図示する。

(丸め込み範囲Δxの図示)

丸め込み範囲$${\Delta x}$$が$${0<\Delta x <1}$$である条件の下では、

$$
P(x)=f(x)\Delta x\\[7.0pt]
\begin{cases}
\Delta x:\:\:0<\Delta x <1\\
\text{常に、}P(x) < f(x)
\end{cases}
$$

を満たす関数$${f(x)}$$を取ることができ、棒グラフの面積$${f(x)\Delta x}$$で$${P(x)}$$を表現できる。

(割合P(x) = 面積 f(x)Δx)

 面積の総和$${\displaystyle\sum f(x)\Delta x}$$は確率の総和$${\displaystyle\sum P(x)}$$に等しく、$${\displaystyle\sum P(x)}$$は常にである。加えて、丸め込み範囲$${\Delta x}$$は精度の向上$${\lvert\Delta\rvert\to0}$$にともない$${\Delta x\to0}$$であるため、

$$
\begin{align*}
\lim_{|\Delta|\to0}\sum f(x)\Delta x&=:\int_X f(x)\,\mathrm{d}x\\
&\equiv 1\\
\end{align*}
$$

が成り立つ$${f(x)}$$のグラフが描ける。

(総面積が1であるf(x)のグラフ)

 上記のような思考法により、数学の世界に”連続なる確率”$${f(x)}$$という新たな概念を実現することができました。こんにちにおいて$${f(x)}$$は確率密度関数と呼ばれ、【確率】⇌【統計】の相補性に支えられながら、現代科学の発展にしています。

3行まとめ📌


  • 【確率】【統計】相補的な関係性🔄

  • 【連続】の場合には、確率$${P(x)}$$のグラフは描画不能

  • 確率$${P(x)}$$を”面積”で表現しちゃう
    確率密度関数$${f(x)}$$のグラフなら描画可能



スキ、フォロー、コメントなどなどお待ちしております😆
以上、Keshitanでした!


▼たのしい数学をあなたに。▼


私事ですが最近Twitterをはじめましたので、
良ければフォローお願いします🐔

できたてほやほやで正しく表示されてないかも…😅


いいなと思ったら応援しよう!

Keshitan@数学記事
最後までお読み頂き、誠にありがとうございます。記事の内容にご満足頂けましたら、是非ともサポートのご検討をお願いしたく思います! もしご支援頂ければ、細々と書き綴るnote活動に豊かさが生まれます。頂きました支援金は、存続のための活動資金として大切にお使いしたく思います。

この記事が参加している募集