![見出し画像](https://assets.st-note.com/production/uploads/images/169955242/rectangle_large_type_2_f9d7a349fbaa49634dd7172269f50586.png?width=1200)
分散(データのばらつき)の正体
データのばらつき方がどんなふうに大事かを前の記事で書きましたが,今回はもう少し掘り下げていこうと思います.
さて,データのばらつきというとどんなものを想像するでしょうか?例えば,同じような数値が多ければばらつきが小さく色々な数値があればばらつきは大きいと考える人もいるでしょう.様々な考えがあってよいのですが,数学では誰もが一通りの考えをしないといけません.これを「定義」とよびます.この定義は絶対守らなくてはいけないルールです.例えば三角形の定義はどんなものだと思いますか?
答えは「3本の直線で囲まれた図形」だそうです.中には内角の和が180度という風に考えた人もいるかもしれませんが,それは三角形の定義ではなく「性質」であり,定義とは異なります.簡単にいえば定義をすることによって導かれるものを「性質」「定理」などとよびます.
少し話が脱線してしましましたが,分散の定義について話したいとおもうのですが,数式を使うと分かりづらいかもしれないのでイメージでいうと,
それぞれの数値が平均からどれだけ離れているかを表す値
です.この分散以外にも,ばらつきを表すものがあります.例えば,「データの範囲」というと,最大値から最小値を引いた値になります.その間にどのように数値が配置しているかはさておき,データの範囲は「数値同士の差が大きい時でこのくらい」というばらつきを表しています.
しかしながら,一般的には,ばらつき=分散だと思います.また分散の正の平方根(ルートってやつです)を計算した標準偏差というものも使われます.
もっと言えば,標準偏差の方が単位がデータの数値と同じで使いやすいです.(難しい話なので分からなくてもOK!)
簡単に,ばらつきについて説明しました.途中で定義や定理について話しましたが,数学の中では「定義と定理」しか出てこないんです.ある定義をして,その定義から導かれるものを探していくことが数学の本質と言ってよいのではないでしょうか.例えば,四則演算(+,-,×,÷)の中では,足し算と掛け算は数を入れ替えても答えは同じですが,引き算と割り算はだめですよね.これを突き詰めていくと四則演算を定義から説明するには大学の数学科で学ぶ必要があるんです.大変ですね...
今回は以上になります.世の中には定義されているものはたくさんあるとおもいますが,みなさんはどんなものを思い浮かぶでしょうか?ふと思ったのが「法律」ってどのくらいぎちぎちに定義されているんだろうと.法律の条文を考えるって難しそうですね.そもそもあれって国会議員が考えるのでしょうか?もしくは官僚さん?
議論は尽きないですね.終わりにします.読んでいただきありがとうございました.