品質管理検定 #32-06
【問6】
相関分析および回帰分析に関する次の文章において、$${\boxed{\space}}$$内に入るもっとも適切なものを下欄の選択肢からひとつ選びなさい。ただし、各選択肢を複数回用いることはない。
製造工程で生産される部品の特性 $${x}$$と特性$${y}$$間の関係を把握するため、サンプル$${n=30}$$個をランダムに抽出し、表6.1の対応のあるデータを得た。
① 特性$${x,y}$$間の相関係数を求めるため、サンプルデータについて、
数値変換式 : $${X=(x-1.0){\times}10}$$および$${Y=(y-5.0){\times}10}$$
を用いるとNo.2のサンプルのデータのついては、$${X=\boxed{(31)}}$$および$${XY=\boxed{(32)}}$$となる。
また、特性$${x}$$の平均値は$${\overline{x}=\boxed{(33)}}$$となる。
② 特性$${x}$$と$${y}$$の散布図は図6.1となる。変換値$${X,Y}$$を利用して特性$${x}$$と$${y}$$の変動を計算する。$${X}$$の偏差平方和$${S(XX),Y}$$の偏差平方和$${S(YY),X}$$と$${Y}$$の偏差積和$${S(XY)}$$は次のようになる。
$${S(XX)=242.7,\space \space \space S(YY)=431.2}$$
$${S(XY)=\boxed{(34)}}$$
よって、サンプルデータによる相関係数の推定値は式$${r=\boxed{(35)}}$$で表され、その推定値は$${r=\boxed{(36)}}$$と計算される。よって、特性$${x}$$と$${y}$$には負の相関関係があると判断できる。
③ 特性$${x}$$と特性$${y}$$との関係を回帰直線$${y={\alpha}+{\beta}(x-\overline{x})}$$で表すと回帰直線の$${\alpha}$$は$${{\alpha}=\boxed{(37)}}$$、傾き$${\beta}$$は$${{\beta}=\boxed{(38)}}$$と推定される。
【選択肢】
ア. -214.2 イ. -12 ウ. -0.883 エ. -0.662
オ. 1.19 カ. 2 キ. 3.91 ク. 4.96
ケ. $${\cfrac{S(XY)}{\sqrt{S(XX)S(YY)}}}$$
コ. $${\cfrac{S(XY)}{S(XX)S(YY)}}$$
【正解】
(31) カ. 2
(32) イ. -12
(33) オ. 1.19
(34) ア. -214.2
(35) ケ. $${\cfrac{S(XY)}{\sqrt{S(XX)S(YY)}}}$$
(36) エ. -0.662
(37) ク. 4.96
(38) ウ. -0.883
出題者の意図をよく理解しないとワケ分からん・・・という気もします。まずは何をしたいのかを理解しましょう。
理由はわかりませんが、測定データをそのまま使うんじゃなくて、「数値変換式」なるもので計算して別の値にしています。
数値変換式
$${X=(x-1.0){\times}10}$$
$${Y=(y-5.0){\times}10}$$
(31)に入るものは、No.2の$${x=1.2}$$を計算して
$${X=(1.2-1.0){\times}10=2}$$
引っかけなし😇
(32)は$${X{\times}Y}$$なので、$${Y}$$の値も計算しなければなりません。
$${y=4.4}$$ですから
$${Y=(4.4-5.0){\times}10=-6}$$
$${XY=2{\times}(-6)=-12}$$
特性$${x}$$の平均値$${\overline{x}}$$は表のデータから計算します。
$${x}$$から数値変換した$${X}$$の合計は57です。データ数はn=30です。
$${X}$$の平均値$${\overline{X}=\cfrac{57}{30}=1.9}$$
数値変換式 $${X=(x-1.0){\times}10}$$ を平均値にして変形して
$${\overline{x}=\cfrac{\overline{X}}{10}+1.0=\cfrac{1.9}{10}+1.0=1.19}$$
偏差平方和、偏差積和の計算は試験によく出ます。計算方法は覚えておきましょう。
$${S_{xx}=\displaystyle{\sum_{i=1}^nx_i^2}-\cfrac{\bigg(\displaystyle{\sum_{i=1}^nx_i\bigg)^2}}{n}}$$
$${S_{yy}=\displaystyle{\sum_{i=1}^ny_i^2}-\cfrac{\bigg(\displaystyle{\sum_{i=1}^ny_i\bigg)^2}}{n}}$$
$${S_{xy}=\displaystyle{\sum_{i=1}^nx_iy_i}-\cfrac{\bigg(\displaystyle{\sum_{i=1}^nx_i\bigg)}\bigg(\sum_{i=1}^ny_i\bigg)}{n}}$$
表から
$${X}$$の合計値 = 57
$${Y}$$の合計値 = -12
$${X^2}$$の合計値 = 351
$${Y^2}$$の合計値 = 436
$${XY}$$の合計値 = -237
$${S_{XY}=\displaystyle{\sum_{i=1}^nX_iY_i}-\cfrac{\bigg(\displaystyle{\sum_{i=1}^nX_i\bigg)}\bigg(\sum_{i=1}^nY_i\bigg)}{n}}$$
$${=(-237)-\cfrac{57{\times}(-12)}{30}=-214.2}$$
よって、サンプルデータによる相関係数の推定値は式
「(35) $${\cfrac{S(XY)}{\sqrt{S(XX)S(YY)}}}$$」で表され、その推定値は
「(36) -0.662」と計算される。よって、特性$${x}と$$[y}$$には負の相関関係があると判断できる。
相関係数は
$${r=\cfrac{S(XY)}{\sqrt{S(XX)S(YY)}}}$$
で計算します。これも覚えておくところ。エクセルなどで計算すると$${r^2}$$が計算されることがあります。この場合は負の相関の場合でも正の値になるので注意。
散布図も載っています。
$${x}$$が増加すると$${y}$$は減少しているので、負の相関があります。選択肢の中で相関係数になりえるものは、-0.883と-0.662です。-1〜1のどこかです。
相関係数が0.9付近だともっと直線性が高い分布になります。
散布図と相関係数に慣れていれば、計算できなくても-0.662を選べるかもしれません。
③ 特性$${x}$$と特性$${y}$$との関係を回帰直線$${y={\alpha}+{\beta}(x-\overline{x})}$$で表すと回帰直線の$${\alpha}$$は$${{\alpha}=}$$「(37) 4.96」、傾き$${\beta}$$は「(38) -0.883」と推定される。
傾き$${\beta}$$を求めるには、
$${\cfrac{S_{xy}}{S_{xx}}=\cfrac{-214.2}{242.7}=-0.883}$$
切片$${\alpha}$$以外に数値を代入して、$${\alpha}$$を求めます。
回帰直線は、それぞれの特性値の平均値$${(\overline{x},\overline{y}}$$を通過します。
$${\overline{y}={\alpha}+{\beta}(\overline{x}-\overline{x}=\alpha}$$
変換式を使って$${\overline{y}}$$を求めます。
Yの合計は-12、n=30
$${\overline{Y}=\cfrac{-12}{30}=-0.4}$$
$${Y=(y-5.0){\times}10}$$ですから、
$${\overline{y}=\cfrac{\overline{Y}}{10}+5.0=4.96=\alpha}$$
計算がちょっと分からなくても、散布図の相関係数が-0.662と見破れれば、回帰直線の傾きが残りの-0.883と予想できそうです。
切片はちょっと考えにくいかもしれませんが、$${\overline{x}}$$が1.19なので、それっぽく回帰直線を引いてみれば、$${\overline{y}}$$にあたるところが3.91か4.96かと言えば、4.91ですね。でも、そもそも$${\alpha=\overline{y}}$$が分かっていれば、の話ですね。厳しいかも。
でも、分からなくても何か分かるかもしれない、ということで。類似問題が出るかもしれないし😁
ではー。