【ステップ1備忘録】ゼロから作るDeep Learning ❺【生成モデル編】ステップ1 正規分布を読む
ゼロから作るDeep Learning ❺【生成モデル編】ステップ1では正規分布をテーマに基礎的な確率論ついて述べています。この記事は、本書を読むための予備知識としてお読み頂ければと思います。
確率変数とは?
確率変数とは、ある事象の結果を数値で表したもののことです。例えば、コイン投げで表が出たら1、裏が出たら0と決めるような感じです🪙
確率分布とは?
確率分布とは、確率変数が特定の値を取る確率を表すものです。つまり、確率変数がどのような値を取りやすいかを示す分布のことです。
確率分布には2種類あります😊
離散型確率分布: サイコロの目のように、とりうる値が数え上げられる場合の分布
連続型確率分布: 体重や身長のように、とりうる値が連続する場合の分布
正規分布について
正規分布とは、確率論や統計学で頻繁に登場する、最も基本的な連続型確率分布のひとつです。自然現象や社会現象において、多くのデータが正規分布に従うことが知られています。
正規分布の特徴
・左右対称の釣鐘型: 平均値を中心に左右対称な形をしています。
・平均値 = 中央値 = 最頻値: この3つの値が一致することが特徴です。
・分散: データの散らばり具合を表します。分散が大きくなると、グラフは平らになり、小さくなると尖ります。
・中心極限定理: 多くの独立な確率変数の和は、サンプルサイズが大きくなるにつれて正規分布に近づくという重要な定理です。
正規分布の式
正規分布の確率密度関数は、平均値をμ、標準偏差をσとすると、以下の式で表されます。
f(x) = (1 / (σ√(2π))) * exp(-(x-μ)² / (2σ²))
この式は一見複雑ですが、重要なのは、平均値μと標準偏差σによって、正規分布の形状が完全に決まるということです。
正規分布図のイメージ
まとめ
正規分布は、統計学の基礎となる重要な概念です。その特徴を理解し、様々な場面で活用することで、データの分析やモデル化の精度を高めることができます。ゼロから作るDeep Learning ❺【生成モデル編】では、更に詳しく解説していますので、ぜひ本書をお読みになる事をオススメします😊