統計 - Statistic 1
これも学生に説明する際の自分用のメモとして書き留めたもの。
平均値 について
平均と言っても、幾種類かある。
Mean(平均値)ー全てのデータを足した合計値をデータ数で割ったもの。
**日本語では平均と一言で表すので、ちょっと混乱するのが、英語でのAverageとMeanとの意味の違い。これは、会話などで平均的という場合にはAverageと使って、Meanとは言うことはない。数学で平均と表す場合には両方使うこともあるが、学術論文などでAvarageと使うことはないと言ってもいいと思う。
Median(中央値)ーデータを昇順、降順に並べた際に中央、真ん中に位置する数値の事。
Mode(最頻値)ー 最頻値:Most Frequent modeとは、最も頻繁に表れる、出現回数が多い数値の事。
標準偏差 について
データの分布のばらつき(広がり)をあらわし、平均からどれだけブレているかを数値で確認する方法に使われる。
標準偏差の数値が大きいとばらつきも大きく、小さいとばらつきが小さい。
標準偏差を計算する際には、Excelの関数式を使い、=STDEV.P()は「集団の総量に対する」ばらつきを計算する際に使い、=STDEV.S()は、「全体の中から一部を無作為に抽出」して算出する。
分散について
データには必ずばらつきが生じる。
これも分散の値が大きければ、ばらつきも大きく、値が小さければ小さい。
分散には、「標本分散」と「不偏分散」の二種類があり、Excelの関数式を使って計算する際の=VAR.P()は「標本分散」、そして=VAR.S()が「不偏分散」となる。