ピアソンの相関係数
※あくまで自分が理解したか、やった範囲のメモです。参考にはなりません。
引っ越して数日立ちましたが、中々部屋が片付きません。荷物も疎らに来るので、外出も好きにできません。引っ越しは大変ですね…
さて、今日はタイトルにもある「ピアソンの相関係数」について書いていきます。
これは高校1年の時に習ったと思います。
無論、数学アレルギーの私は当然のように覚えていませんが。
ピアソンの相関関係は、2つの変数間の関係の強さをと互いの関連性を測定するものだ。
これを求めるには平均、偏差、偏差2乗和、標準偏差、共分散を出す必要がある。
平均は言わずもがな、すべての数を足し、それをデータ数で割ったものだ。
偏差はデータから平均を引いたものだ。
しかし偏差を求めてもプラスとマイナスが足すと0になってしまうため、これを2乗する必要がある。
2乗したものを全て足したのが偏差二乗和。
これをデータ数で割ったものが分散である。
しかし、分散は二乗したデータであるので、数が大きくなりすぎる。
そのため、ルートを使う必要がある。
こうして求められるのが「標準偏差」が求められる。
共分散は、xの偏差とyの偏差を掛けたものの平均の平方根だ。
そうして得られた共分散をxの標準偏差とyの標準偏差を掛けたもので割ると求められるのがピアソンの相関係数である。
難しくはないが、計算が面倒だ。