ふわっと学ぶコレポン-1 |質的変数の関連性を評価しよう
業務の中で「コレポン」の話が出ると、名前の響きが可愛いなといつも思います。コレポンこと、コレスポンデンス分析は質的変数であるカテゴリを数量化し、カテゴリ間の関連性を確認できる分析手法です。
今回はそんなコレポンのお話を数式を確認しながら説明します。今回は照井先生と佐藤先生の本を参考にまとめていきますね。
最近、同僚とコレポンの話をしたから、コレポンのnoteを書こうと思ったという単純な動機です。1回目はコレポンで得られるアウトプットの例をゆるーく眺めてみましょう。
(※ It's about 1800 words, so you'll be able to read it in 4 minutes. )
1. コレポンで分析する質的変数とは
コレポンでは質的変数を分析すると書きましたが、質的変数がどのようなものであるか、簡単に確認します。下記がデータの分類を簡単に記載したものとなります。
質的変数は名義尺度と順序尺度に分けれられます。名義尺度は名義的に数値を施した尺度、順序尺度は名義尺度に加えて順序にも意味がある尺度となります。こちらの例だと、「好き>普通>嫌い」といったように好き~嫌いの間には順番にも意味がありますよね。一方で、男と女、または血液型や郵便番号などは名義尺度となります。
一方で、足したり引いたりできるような数字のデータの場合は、量的尺度と呼ばれます。こちらは間隔に意味がある場合は間隔尺度、数値の比にも意味がある場合は比例尺度の2つに分けることができます。間隔尺度の例としては時刻や温度などがあります。例えば、温度の場合は25℃から26℃になった時は「温度が1℃上がった」と言えますが、25℃から50℃になった時は「温度が2倍になった」とは言いませんよね。一方で体重などでは25kgから50kgでは「体重が2倍になった」と言うことができ、比例尺度となります。
2. コレポンのアウトプットをRで出力してみる
はじめにコレポンで得られるアウトプットをRを使って確認してみます。「コレポンってこういうことができるんだ!」と雰囲気を掴むところからスタートしましょう。
今回の分析では、「ブランド別のイメージをアンケートで聴取した」という設定で適当にエクセルでデータを作ったものを分析してみます。ブランド×イメージについてコレポンをするというのは、マーケティングリサーチ界隈では見かけることが多い分析パターンですね。
このデータは、「ブランド1×かわいい・・・38%の人が答えた」という読み取り方になります。このような表のことをクロス表と呼びます。
それでは、作成したデータを読み込みましょう。
data <- read.csv("brand_image.csv", header = TRUE)
brand_image <- data[,2:8]
rownames(brand_image) = data[,1]
次に読み込んだデータについて、MASSというパッケージのcorresp関数を用いてコレポンを実施してみます。
library(MASS)
bi_cp <- corresp(brand_image, nf = 2)
bi_cp
コレポンの結果は行と列のスコアとして確認することができます。
このデータをプロットしてみます。
biplot(bi_cp, xlab="Factor 1", ylab="Factor 2")
近くにある項目は相対的に関連性が強いことを意味しています。つまり、
(1) ブランド2とブランド8は似ている・・・?
(2) ブランド1とブランド5は似ている・・・?
(3) かっこいいとワイルドは近い・・・?
(a) ブランド11は真面目なイメージ・・・?
(b) ブランド12は他と比べてかわいいイメージ・・・?
(c) ブランド14は美しくのんびりなイメージ・・・?
といった感じで関連の強さを読み取れそうですね。ただし、ここで注意が必要なのはこのように、(1)~(3)は数理的に解釈できるが、(a)~(c)は数理的に定義することはできません。つまり、(a)のように「ブランド11が真面目というイメージと近い」と解釈するのは誤りになります。コレポンではブランド間(行要素)、イメージ間(列要素)について、それぞれについて分けて距離を判断するようにしましょう。
ではコレポンのメリットは何か?それはクロス表の結果を人間さんが読みやすくすることです。例えば、ブランドの項目が100個あり、イメージも50個くらいあるクロス表がある時、表を眺めて読み解くのは大変ですよね。そのような時にコレポンを使って可視化することで、「近いブランドは何か?」「どのイメージ同士が近いのか」といった判断をすることができます。
3. 結論
「コレポンやピンポンって響きが可愛いので好き」(違うそうじゃない)
今回はコレポンのアウトプットイメージを眺めてみました。コレポンでは質的変数であるカテゴリを数量化することで、カテゴリ間の距離を比べることができる手法となります。次回はコレポンの計算の中身についてふわっと覗いていきます。
以上、ふわっと学ぶコレポン -1 でした。
----------------------------------------------------------
REFERENCE
[1] 照井伸彦. 佐藤忠彦. 現代マーケティング・リサーチ. 有斐閣, 2013, 254-261.
この記事が参加している募集
Thanks for the support !