QC検定1級過去問の解説(第35回の問2)
第35回マガジンのリンク
自己紹介
QC検定1級, 統計検定2級を持っています。現在は統計検定準1級の合格を目指しています。過去に合格したQC1級の復習として自分なりの解答を共有していこうと考えています。※解答のみで問題は載せません。
読者の皆さんからQC1級の合格者を増やし社会で活躍してもらいたいです。ひいてはQC1級仲間として僕も尊敬されたいです。次回の第39回で3630人目の合格者を目指しましょう!
所感
多変量解析法のクラスター分析の問題です。近年、多変量解析やノンパラメトリック法が毎年1問は出題されています。第34回の問8など。問題文の単語を理解できるかが鍵です。ユークリッド距離とかデンドログラムが分からなかったら、誘導もないので2問捨てましょう。
解説
(1)
求めるのは適切なデンドログラム。ただし、ユークリッド距離で最短距離でクラスター化したもの。考え方としては近い点、つまり距離が短いものを合体させていくイメージで進める。ユークリッド距離は通常の2点間の距離のこと。
最初に点Aと点Dを合体させる。距離は√2です。次に点Cと点Eが近いので合体させる。距離は3です。ここまでは見れば決まる。
ここからは単一の点でなく、(A, D)と(C, E)と点Bの距離を考える。1番複雑な(A, D)と(C, E)の距離を考える。
上の図のように4つの距離を計算する。最短距離法なので、最も距離が小さい点Dと点Eの√10が(A, D)と(C, E)の距離となる。
点Bと(A, D)の距離、点Bと(C, E)の距離も同じように考える。以上より、(A, D)と(C, E)が合体し最後に点Bが合体するアになる。
(2)
求めるのは適切なデンドログラム。ただし、ユークリッド距離で最長距離でクラスター化したもの。(1)と同じで距離が短いものを合体させていくイメージで進める。しかし、距離の決め方が最長距離法なので1番値が大きいものを取る。
例として上の(1)の図のように4つの距離を計算する。最長距離法だと最も距離が大きい点Aと点Cの√41が(A, D)と(C, E)の距離となる。これも同様にして考えていくと、ウになる。
公式過去問の解説は最短と最長が入れ替わっているので注意してください。