【高校情報授業・共通テスト】二項分布と正規分布/ベルヌーイ試行/Z値・期待値/標準正規分布エクセル(Excel)グラフ作成
二項分布と正規分布/ベルヌーイ試行/Z値・期待値
【資料ダウンロード】
PDFの他、パワーポイント、学習指導案 等の原本も無料提供しています。
情報教育の底上げが目的なので、資料を修正して、学校・塾(営利目的含む)の授業等で利用して頂いて問題ありません。私への連絡不要ですが、利用する際には、YouTubeチャンネル・情報Ⅰ動画教科書・IT用語動画辞典を紹介してもらえると嬉しいです。
■PowerPoint・エクセル資料
https://toppakou.com/info1/download/27_ADVANCE_データの分布と検定の考え方/01_二項分布と正規分布/01_二項分布と正規分布.pptx
https://toppakou.com/info1/download/27_ADVANCE_データの分布と検定の考え方/01_二項分布と正規分布/標準正規分布のグラフ.xlsx
【文字おこし】
今回は、統計関連の二項分布と正規分布について解説していきます。
前回の動画で説明した分散と標準偏差に関する事前知識が必要なので、知識の習得が未だの方は概要欄に貼ってある、分散と標準偏差に関する知識をみにつけてからこの動画を見てください。
まずは、二項分布について説明していきます。
世の中には2つの状態で表されるものが沢山ありますよね。
例えば、コインを投げた時に表が出るか、裏が出るか。
実験を行ったときに、成功するか、失敗するか。
6面体のサイコロにしても、1がでるか、それ以外が出るかと2つの状態に言い換えることもできます。
コインを投げた時に表が出るのは、普通に考えると2回に一回なので、確率は2分の1になります。
コインの表が出たら1点 裏なら0点として、4回投げて合計が1点 つまり表が1回だけ出る確率を求めていきましょう。
左側に分岐のパターン、右側には点数の合計の数 つまり合計の度数分布を表しています。
まず初めの1回目は 表と裏のパターンがあり裏なら0点 表なら1点となります
2回目について
一回目が裏のパターンから裏と表のパターンがあり裏なら1回目の点数も0なので0点、表なら1点となります。
1回目が表の場合も2回目は裏と表があります。
裏の場合は合計値は一回目1点+2回目0点で1
表の場合は、一回目1点 2回目1点で 2となります。
合計の度数の分布は、0点が1つ 1点が2つ 2点が1つとなります。
3回目も同様に分岐させて、表の場合は2回目までの合計に+1点します。
合計の度数の分布は、0点が1つ 1点が3つ 2点が3つと 3点が1つとなります。
4回目も同様に分岐させて、表の場合は3回目までの合計に+1点します。
合計の度数の分布は、0点が1つ 1点が4つ 2点が6つと 3点が4つ すべてで表が出た4点は1つとなります。
つまり、コインを4回投げた時に表が1回だけ出るのは度数が1のパターンで16分の4 を約分して四分の1の確率となります。
この確率はグラフ全体の度数の合計値に対する該当する範囲の度数の割合と同じになります。
試行結果が表か裏、成功か失敗、勝ちか負けか、1かそれ以外かのように2通りしかない試行をベルヌーイ試行といいます。
今回はこのベルヌーイ試行を4回行いましたが
ベルヌーイ試行を複数回行った場合で、ある事象が何回起こるかの確率分布を二項分布といいます。
今度は成功か失敗のパターンで確率を変えて考えていきます。
1回で成功する確率をpとします。
そして、実験した回数(試行回数)をn回とします。
そして、実験で成功した回数をkとします。
n回試してk回成功する確率Pを求めていきます。
このkの値を色々変えていきながらグラフに表したものを二項分布と言います。
P(X=k) はk回成功した場合の確率という意味です。
それを求めていきます
n回の内k回が成功のパターンで
成功の確率はpでそれをk回行うのでpのk乗となります。
逆に失敗の確率は、全体から成功の確率を引けばいいので1―p となります。
失敗の回数は試行回数nから成功の回数kを引いてあげればいいのでn-kとなります。
そしてn回のうちk回が成功するパターンは
例えば3回の内 1回が成功の例だと
成功 失敗 失敗
失敗 成功 失敗
失敗 失敗 成功
の場合があります。
そのパターンの分も掛け合わせる必要があり、それはnCkで表されます。
つまりパターン数×n回の内k回の成功確率×n回の内 失敗の確率 となります。
二項分布のグラフで表すと
縦軸を確率P(X=k) 横軸を成功回数kとすると
試行回数n回の内 成功回数のkが0の時の確率、kが1回の時の確率 kが2回の時の確率というようにkを増やしていき 一番右側のパターンはn=kなので すべて成功したパターンの確率となります。
※さっきのパターン
一番初めに説明したコイン投げのパターンに当てはめてみましょう。
表が出る確率が2分の1なので0.5 試行回数4回で、 表が1回出る確率を公式に当てはめて求めると
4C1×0.5の1乗 ×(1-0.5)4-1乗となり
4 ×0.5× 0.125 =0.25 となり 先ほど図を書いて計算した結果と一致しました。
確率的に期待される期待値というものがあります。
例えば、この二項分布のグラフの場合、5が期待値で、最も確率が高いことが分かります。
期待値の求め方は公式があって 事象が起こる確率×試行回数で求められます。
例えば成功確率が3分の1 試行回数が30回の場合は 3分の1×30で10回が期待値となります。
―――
二項分布のグラフは、試行回数を増やしていくとこのような左右対称の曲線に近づきます。
言い換えると、中央の値の発生頻度が最も多く、それを中心に左右対称で発生頻度が少なくなります。このような分布を正規分布と言います。
平均が0、分散が1 つまり標準偏差が1の正規分布を標準正規分布と言います。
平均が0というのはわかりずらいかもしれませんが
例えば1とー1の平均は0となります。
――
このグラフで囲まれた面積全体を1とすると、
横軸の値をZとして、Zが0と1 の間の面積は 全体の34.13%を占めます。左右対称なので0とー1の間の面積も全体の34.13%となります。
範囲を広げて0~2の間の面積は、全体の47.72%を占めます。左右対称なので0とー2の間の面積も全体の47.72%となります。
つまり、―2~2の間で全体の95.44%の面積となります。
Zが4~―4の範囲は面積全体の100%となります。
横軸をZと言いましたが、あるデータxが平均値(μミュー)からどれだけ離れているかを、標準偏差σ(シグマ)を単位として示した値を Z値 と言います。
Z値の求め方は、標準偏差σ 分の 値x ― 平均μ で求めることができます。
正規分布表と比べながら、具体的な例でみていきましょう。
情報の試験を行ったときの平均点が55点 標準偏差が10の場合
65点の生徒が上位何パーセントの位置にいるかを調べていきましょう。
この試験の得点は正規分布に従うものとする
まずZ値は 標準偏差 10 分の 生徒点数の65―平均値の55をすると1.0となります。
先ほどの標準正規分布の表では、この1から4の間の面積の割合は15.87%
なので、上位15.87%ということが分かります。
最後にエクセルを使って、標準正規分布のグラフを作成していきます。
Zをー4から4の範囲で0.1間隔とします。
はじめのー4とー3.9を入力した後は二つを範囲指定して、右下の黒■の上にマウスカーソルをあてて、下にドラックすれば簡単に4までの数字が自動入力されます。
Y軸の確率の計算は、ノーマルスタンダードディストリビューション関数を使います。
NORM.S.DISTの関数を選んで 第一引数にZ値のセルを選びます。
第二引数をFalseにすると 値がZの時の標準正規分布の値を算出してくれますので今回はFalseとします。
True にすると値がZ以下の範囲の標準正規分布の割合を出してくれます。
1行目について算出されたので、オートフィルを使って関数を下にコピーします。
個人的な感想ですが、
このノーマルスタンダードディストリビューション関数って名前物凄くかっこよくないですか?男性生徒は女子に標準正規分布グラフを教える機会があれば、
ノーマルスタンダードディストリビューション関数使えば簡単だよ と言えば、モテモテかもしれません。
グラフにしたい範囲を範囲指定して、挿入からおすすめグラフで折れ線グラフを選べば、標準正規分布のグラフが描けます。
今日の二項分布と正規分布の授業は以上になります。
最後までご視聴ありがとうございました。
【解説重要用語】
オ二項分布、ベルヌーイ試行、正規分布、標準正規分布、期待値、Z値、正規分布(Excelグラフ)、NORM.S.DIST関数(ノーマル・スタンダード・ディストリビューション関数)
★私の目標
「とある男が授業をしてみた」 の葉一さん
https://www.youtube.com/user/toaruotokohaichi
※Google社に招待頂いた、「YouTube教育クリエイターサミット2020」で
葉一さんと文部科学省・Google役員の対談セッションに感銘を受けて、高校情報講座スタートしています。
【参考サイト・参考文献】
参考サイト(YouTube動画)ソフトキャンパスExcel学校https://www.youtube.com/watch?v=a9uh9s3bQh4
文部科学省 「情報Ⅰ」教員研修用教材
https://www.mext.go.jp/a_menu/shotou/zyouhou/detail/1416756.htm
詳細(情I703 高校情報I Python)|情報|高等学校 教科書・副教材|実教出版 (jikkyo.co.jp) 検定通過版
https://www.jikkyo.co.jp/book/detail/22023322
令和4年度新版教科書「情報Ⅰ」|高等学校 情報|日本文教出版 (nichibun-g.co.jp)検定通過版
https://www.nichibun-g.co.jp/textbooks/joho/2022_joho01_1/textbook/
その他、情報処理技術者試験(全レベル1~4)/IT企業15年勤務(システム技術部 部長)経験から培った知識を交えながら解説しています。
かわいいフリー素材集 いらすとや (irasutoya.com)
https://www.irasutoya.com/