Python2年生:11日目
今日は正規分布。
(アイキャッチは相変わらずwrtnの「SDXL_JP」に雑な指示を出して描いてもらいました。「標準偏差のイメージ画像を描いて」で出てきた4種類のうちの1つ。標準偏差とは…)
データのばらつきを数値で表す「分散」と「標準偏差」
平均値が同じになるデータが作ってあるので、それを入力してデータの平均値を出す。
散布図でデータが散らばっている様子を可視化する。
このデータ全体は平均値からどれだけ上下にばらついているかを1つの数値で表す。
どうするか→分散を使う。
各データの平均値の差を2乗する。
計算式は、
分散=(平均力の差)の2乗の合計/データの個数
(IDについてもでた。けど、全ての列データの分散を求めさせたのでそういうものらしい)
標準偏差→分散の値だと大きくなりすぎるから、2乗したものを平方根で元に戻す→分散の平方根で求められる
標準偏差の何が便利か(学生時代にはじめて標準偏差が導入されて、親がめちゃめちゃ怒ってたのを思い出したけど…。いまだになんで怒ってたのかわからんな)
どのくらいばらついているか
ある範囲にどのくらいデータがあるか(分布がある形をしている場合)
がわかるのが便利らしい。(ふーん??)
Aのデータは約68%が29.2〜70.8の範囲にあるという結果(ふーん????68%ってどこからでてきたん??)
ヒストグラムにして比較すると視覚的になった(が、68%ってどこからでてきたん??)
正規分布というものに関連があるらしいのだが(気にもなるのだが)いい時間になったので、今日は手を動かすのはここまで。
ちょっと先の方を読んでおいて、手を動かすのは明日にしておこう。
この記事が気に入ったらサポートをしてみませんか?