統計学の勉強(おさらい1)
資産運用の一環として統計学を現在勉強しています。
現在読んでいる書籍は「完全独習 統計学入門」、補助として読んでるのは「マンガでわかる統計学」。
「完全独習 統計学入門」の前半のまとめ。何度もノートに書いたりしてるけど難しいですねぇ。
統計学の基本と標準偏差、正規分布
生データだけだと数字の連なりだけで何がなんだかわからない
↓↓↓
縮約する
縮約とは
データとして並んでいる数字を何らかの基準で整理整頓して、意味のある情報だけを取り出すこと
縮約の種類
①グラフ化する(ヒストグラムを作る)
②1つの数字で特徴を代表させる(統計量を求める)
統計量を求める例)
a.平均値を求める
b.散らばり具合の統計量を知る←こっちが重要
データの散らばり具合を理解する(分散)
平均:データの合計値÷データ数=μ(ミュー)
※「計算法にもとづいた名前」
偏差(deviation):平均値からどれくらい大きいか、あるいは小さいかの数値
μ(平均値)ーデータの値
平均からの離れ方
分散(variance):データのばらつき具合を評価できる
偏差を2乗したものの合計値÷データ数
※「計算法にもとづいた名前」
標準偏差(Standard Deviation):S.D. 偏差の二乗平均の量
二乗平均…平均したい数値を2乗して合計して個数で割り、そのあとルートにするもの
分散の平方根、σ(シグマ)
平均値から離れ方を平均化した値
S.D.で何がわかるか
前提
S.D.で測っていくつ分と表すことが重要、偏差や平均だけではデータを評価できない
{(データ)-(平均値)}÷(S.D.)という計算を基準に評価する
1.「1つのデータの中にある1つのデータの持つ意味」がわかる
S.D.±1個分なら月並みなデータ(約7割に入るデータだから)
S.D.±2個分以上離れてたらレアなデータ(両側合わせて5%しかない)
2.「複数のデータのセットを比較して出てくる違い」がわかる
各々のデータセットのS.D.によって同じ数値のデータでも評価が変わる
正規分布と標準正規分布
1.正規分布は最もよく見られる分布である
身長のデータやコイン投げなど
正規分布とは「集めたデータのばらつきが、平均値を境にして前後に同じくらいばらついてる状態)
2.標準正規分布は、平均値=0でS.D.=1である
標準正規分布は「ものさし」、頂点が0で変曲点が±1に調整されている
3.標準正規分布においては
平均からS.D.1個以内の範囲のデータは約70%弱
平均からS.D.2個以内の範囲のデータは約95%強
4.一般正規分布のデータ
変曲点は、頂点μ(平均値)から±σ(S.D.)の場所である
正規分布と標準正規分布はσ倍(1÷σ倍)の拡大縮小の関係
標準正規分布の性質
標準正規分布の性質その1
平均値=0
S.D.=1
標準正規分布の性質その2
(+1)~(-1)の範囲のデータの相対度数は0.6826
(+2)~(-2)の範囲のデータの相対度数は0.9544
こんかいはこれくらいです。今日区間推定のことろで躓いてます。
いいなと思ったら応援しよう!
![ゆう@CADMANIA](https://assets.st-note.com/production/uploads/images/25364550/profile_8189b535bc8b48e106c21074aa04b050.jpeg?width=600&crop=1:1,smart)