(3):偏相関係数~三角関係恐るべし

「偏」の字って、ちょっとイメージが悪い

「えー、それって偏見!」と、「偏」の字が言ったかどうかは知らないが、日常生活で、「偏見」以外にこの「偏」の字をあまりつかわないね。でも数学が好きなら思いつくものがあって、それは「偏微分」。そう、あの$${\partial x}$$とかいう、恐ろし気な記号がでてくるやつね。この記号を見て「恐ろし気」とか言っている時点で偏見丸出しなんだけど、そもそも「偏」ってどういう意味なのかな?

漢字辞典なんかを調べると、「かたよった」みたいな意味が出てきて、それこそ「偏見」の意味がここにあるんだなあと思うのだけど、英語では「偏相関係数」のことを「partial correlation coefficient」と言い、「偏」の字は「partial」の意味に使われている。
じゃあpartialって何さというと、まずは「一部の、部分的な」という意味で(だって part の派生語だからね)、completeの対義語として「不完全な」という意味もある。これが第一義。
続いて、「とても好きな」。これは「偏愛」という感じね。
そして、「えこひいきをする、不公平な」で、「偏った=biased」の意味。以上ジーニアス英和で、ウィズダム英和もほぼ同じ感じの説明でした。

「偏=partial=部分的な」とつながると、「偏微分」らしくなるね。偏微分って、片方の変数を固定して(つまり定数と見なして)微分する。「$${x}$$さん、ちょっと待っててねえ。いま、$${y}$$さんのほうだけ微分しますからね~、それまで定数として振る舞ってね~」みたいに部分的に処理してる感じがするからね(数学専門の皆さん、ごめんなさい。もっと上手に説明してください!)。

偏相関係数もちょっと似ていて、「xさんとyさんの相関こうなっているんだけど、どっちもzさんと関係がありますからね、お二人とも、zさんとの関係を清算してから、もう一回計算しましょうねえ」みたいな感じ。xさんとyさんの相関係数から、zさんとの関係分を引き算されてしまって、「あらあ、zさん抜きだと関係薄いのね~」とか[*1]、「あれ! zさんいないと実は仲が悪いんですね!」[*2]みたいになってしまう。三角関係、恐るべし。

[*1] $${r_{xy}=0.4, r_{yz}=r_{zx}=0.6}$$ だとすると、$${r_{xy\cdot z}=0.06}$$になり、ほぼ相関なしになる。
[*2] $${r_{xy}=0.5,r_{yz}=r_{xz}=0.8}$$だとすると、$${r_{xy\cdot z}=-0.39}$$になり、符号が逆転する。

計算式の分子を覚えよう

真剣に計算しようとすると結構面倒なのだが、選択肢から選べばよいので、要するに概算ができればよい。教科書に示されている計算式では、分母に面倒な計算が入っているが、「重要なのは分子」と説明されているので、それを信用して、分子だけを計算すればよい。ただし、分子だけでぴったり計算できるわけではなく、分母の補正が入るので、若干絶対値が大きくなる。

さて、3つの相関係数を使ってどう計算するかというと、こうする(教科書に書いてある)。
XY相関係数)-(XZ相関係数 × YZ相関係数)
Zを統制した偏相関係数」を求めるなら、「Z」がどこに入ればいいかに気をつければいい。「Zを使ってあるやつ(”XZ”と”YZ”)」を掛け算して、それを「Zを使ってないやつ(”XY”)」から引き算すればいい。そして、「これより少し絶対値が大きくなるはず」と考えれば、正しい選択肢を選べるはずである。

上の例だと、[*1] $${0.4-0.6\times0.6=0.04}$$ で、補正した値が$${0.06}$$。少し大きくなるね。もう一つの方も、[*2] $${0.5-0.8\times0.8=-0.14}$$ で、補正すると$${-0.39}$$。zを使っている相関係数の絶対値が大きいと、補正効果も一気に大きくなる(この場合、分母は$${1-0.8^2=0.36}$$)。
計算式をちょっと単純化して早見表とか作ってみたので、それは次回に書きましょう。

計算式はごついが大事な話

といって、こんなごつい計算を実際に手計算するかというと、しない。HADに任せれば一瞬。ではなぜこんな問題を毎回出すのかというと、
「相関と因果は違うよ」とか、
「相関があるって言っても、実は何にも関係ない事があるんよ」
「それを擬相関っていうのさ」とか、
そんな話が、
統計を読むうえでとんでもなく大事だから
なんだな。

計関連の入門書(新書とかの)を読むと、「相関と因果は違うよ」みたいな話が必ず入っている。
なんか、人間って、2つの変数を見せられて、散布図とか見せられると、「こっちが原因で、こっちが結果」みたいに、つい考えてしまうらしい。だって、そのほうが話がわかりやすいし、面白いから。因果関係大好き、それが人間。だから、散布図を描くときも、「原因にあたる変数を横軸にして、結果にあたる変数を縦軸に」描くとわかりやすい、とか説明しちゃったりする。こうするとわかりやすいから。でも、だからといって、そこに描かれた変数は因果関係を表しているわけじゃない! ということは肝に銘じるべき。