見出し画像

統計的な推測~高等学校で学ぶスキルまとめ

Cover Photo by Christopher Burns on Unsplash

数学B「統計的な推測」の学習内容について、あれこれ書いてきましたが、どのようなスキルを身につけることになっているのかを、まとめておきます。例によって、学研の問題集「よくわかる高校数学B問題集」を参照しています。

確率変数と確率分布

確率変数と確率分布について、次のような下位スキルがあげられます。

  • 問題に示された条件から、事象を正しく数え上げる。(必要に応じて、組み合わせの公式$${_nC_r}$$を使う。)

  • 事象とその確率の対応表(これを確率分布と表現している)を用いて、期待値と分散を計算する。

  • 確率変数をアフィン変換したときの期待値と分散を計算する。

  • 確率変数の和の期待値と分散、確率変数の積の期待値を計算する。

ここで注意したいのは、1つ目の下位スキルからわかるように、基本的に離散的な確率変数だけを扱っていることです。複数種類のコイン投げとか、数字を書いたカードの取り出しとか、多少複雑にはなりますが、事象を正しく数え上げて、全事象に対する割合を求める、という方法自体は、小中学校での学習と同じです。

ただし、大学の統計学の教科書(少なくとも私が勉強したもの)には、確率変数の積の期待値の話は出てきませんでした。数理統計をより詳しく勉強するには必要な内容かもしれないのですが、心理統計を「研究のためのツール」として活用していくときには、重要度のきわめて低い部分でしょう。

一方で、これ以降にも共通していますが、母平均を$${m}$$、母標準偏差を$${\sigma}$$と書き分けているのがやはり気になります。母比率は$${p}$$、標本比率は$${R}$$と、これも、少なくとも心理学界隈の慣例とは異なる表現です。(私がこれまで慣れ親しんできた表記は、母平均$${\mu}$$)、母比率$${\pi}$$、標本比率$${p}$$という表記です。ようするに、母数についてはギリシア文字、標本統計量についてはアルファベット、という区別がありました。高校の問題集が(問題集がこうなっているということはおそらく教科書も同じなのでしょう)どうしてこれを用いないのかは不明です。)

二項分布と正規分布

  • 二項分布の確率分布から期待値、分散、標準偏差を計算する

  • 簡単な確率密度関数から、期待値、分散、標準偏差を計算する

  • 正規分布にしがたう確率変数を標準化する(標準正規分布になる)

  • 二項分布のnが大きい時、正規分布で近似して確率をもとめる

二項分布は実現値と確率の対応表がそのまま確率分布と考えられるので、用語に慣れさえすれば、さほど難しいものではないでしょう。
一方、正規分布は、確率密度関数自体が示されているわけではありません。例の釣鐘型のグラフが示され、定積分の値(xの区間に対応する面積)が確率に対応する、という説明があるのみです。そして、密度関数を$${f(x)}$$とするとき、期待値と分散はこのように計算しますよ、という式(定積分)が示されています。

問題例を、さきほどの問題集から引用します。(問題文を簡略にしています。)

確率密度関数を、$${f(x)=ax^2(0 \le x \le 1)}$$とするとき、$${a}$$の値はいくらか。また、$${P(0 \le x \le 1/2)}$$はいくらか。

確率密度関数の定義域が閉区間になっていますので、この区間で積分したとき、1になっている必要があります。この条件があるので、$${a}$$が定まります。$${a}$$を定めた後、改めて定積分して後半の答えを出します。これは結局積分の問題ですね。実際の確率密度関数が出てきたときには、もっと複雑な積分をしなくてはならないのですが、そのための練習といえます。

別の問題です。こちらはほぼそのまま引用しています。

確率変数$${X}$$が正規分布$${N(4, 5^2)}$$にしたがうとき、確率$${P(-1 \le X\le 9)}$$を求めよ。

実際にはこの後に、標準正規分布表を見なくてもいいように数値が記載されているのですが、大人のみなさんはExcelが使えるでしょうから(あるいはお持ちの教科書の付録に標準正規分布表があるでしょうから)、ここまでで問題は成立しています。要するに標準化した上で、標準正規分布表から必要な数値を参照して答えなさいと言うことです。放送大学の試験にも(選択肢付きで)出そうな問題です。

統計的な推測

  • 全数調査と標本調査について理解する

  • 母集団分布について理解する

  • 標本平均の標本分布の性質(期待値と標準誤差)について理解する(ただし標準誤差という用語は登場しない)

  • 標準誤差を用いて、母平均を推定する(ただし母標準偏差が既知の場合)

  • 標本比率を用いて、母比率を推定する

記号の使い方についてはすでに書きましたので繰り返しません。一見して分かるかと思いますが、区間推定の方法で、t検定は取り上げられていません。あくまでも、母標準偏差がわかっている状態で、母標準偏差をサンプルサイズの平方根で割った値を標準誤差として用い、その1.96倍を信頼区間幅とするやり方です。ただし、母標準偏差が未知のとき、サンプルサイズが大きいならば、標本標準偏差で代用してよい、という注がついている問題があります。「サンプルサイズが大きい」とは具体的にいくつくらいなのか、を気にする生徒もいるでしょうが、どんな指導がされるのか興味があります。
一方、母比率の検定では、標本比率をもとに推定を行っています。

細かいことを気にすると、母集団の特性についての記述にやや違和感があります。次の記述です。

調査対象の母集団の性質を、その母集団の特性といい、数量的に表される特性を変量という。(引用者注:本文では「数量的に表される特性」に注が付いていて、「身長や体重など」とある)

これ、ちょっと間違っていると思います。「変量」という語をわざわざ使っていますが、用語として「変数」と区別することに意味があるとは思えません(他の学習でも「変数」という語を使うからか?)。統計学において変数(変量)とは、個体によって値が異なる対象を意味します。調査に協力してくれる人によって、身長も体重も異なる(異なる可能性が高い)ので、変数と呼ぶのです。
また、「数量的に表される」ものだけが変量(変数)なのではありません。人を対象とするとき、その人の出身地や血液型、支持政党、好きな色なども、人によって値が異なりますから、変数として扱えます。工場で生産される品物であれば、色、大きさ、不良の有無、製造年月日などが変数として扱えます。
計算問題に使うためには、数量的に表されるもののほうが扱いやすいことはわかりますが、誤解をまねく表現だと思います。

仮説検定

  • 仮説検定の用語(対立仮説、帰無仮説、棄却域、有意水準など)を理解する

  • 仮説検定の手順を知り、手順にそって検定する

  • 両側検定と片側検定の違いを知り、指定された方法で検定する

対立仮説と帰無仮説という用語の使い方については、前回も書きました。問題集でも、次のような説明があります。

仮説検定において、正しいかどうかを判断したい主張を対立仮説、対立仮説に反する仮定として立てた主張を帰無仮説という。

まず、「対立仮説」について、「正しいかどうかを判断したい主張」としていますが、この書き方だと何に対して「対立」(英語ではalternative「代替」)といっているのか曖昧です。
また、「帰無仮説」について「対立仮説に反する仮定」としていますが、これだと、片側検定を目指した仮説(たとえば「母平均は100より大きい」)を立てたとき、帰無仮説は「母平均は100以下」になってしまいます。このような曖昧な帰無仮説では、帰無分布が定まりませんから、検定ができません。「母平均は100より大きい」の否定を「母平均は100である」に導くのは無理がある、と私は思います。

「帰無仮説」を、以前「無意味仮説」と勝手に訳しましたが、これは英語のnull hypothesisの感覚をより表そうとしたものです。前回の記事では、たとえば、母平均=100という仮説はあり得ない、という意味でも無意味なのだと書きました。母平均が、100.0001でもなく、99.9999でもなく、ちょうどぴったり100になる確率はほぼ0です。このようなピンポイントの仮定には意味がないのです。それでも帰無仮説を立てるのは、母平均をある値に仮に定めないと、分布が定まらないからです。その分布の中で考えて、「標本平均はたしかに100ではないけど、100じゃないとも主張できないよね。」あるいは「標本平均は100じゃないし、これは100に近い値だ!偶然違うだけだ!と主張するにはあまりにも偶然過ぎるでしょ。」という判断を下します。前者は帰無仮説を保留する、後者は帰無仮説を棄却する、といいます。どちらも、対立仮説の「正しさ」を判断しているわけではありません

まとめ

こうしてみてくると、高等学校数学Bで、標準正規分布を用いた仮説検定や区間推定を扱うことに、なんとなく無理が伴う気がしています。統計学の専門のコースならともかく、数学Bは比較的多くの生徒が履修する科目なのではないでしょうか? だからこそ教えるんだ、という主張もあると思うのですが、だからこそ範囲をしぼってしっかり考えさせる、面白さをわかてもらうことも重要だと思います。

といっても、新しい指導要領は実施されますので、生徒のみなさんは頑張ってください。決して、統計を嫌いにならないでほしいと思います。
教員のみなさんも頑張ってください。こんな文章を書くことしかできませんが、応援しています。