見出し画像

ふわっと学ぶコレポン-1 |質的変数の関連性を評価しよう

業務の中で「コレポン」の話が出ると、名前の響きが可愛いなといつも思います。コレポンこと、コレスポンデンス分析は質的変数であるカテゴリを数量化し、カテゴリ間の関連性を確認できる分析手法です。

今回はそんなコレポンのお話を数式を確認しながら説明します。今回は照井先生と佐藤先生の本を参考にまとめていきますね。

最近、同僚とコレポンの話をしたから、コレポンのnoteを書こうと思ったという単純な動機です。1回目はコレポンで得られるアウトプットの例をゆるーく眺めてみましょう。
(※ It's about 1800 words, so you'll be able to read it in 4 minutes. )


1. コレポンで分析する質的変数とは

コレポンでは質的変数を分析すると書きましたが、質的変数がどのようなものであるか、簡単に確認します。下記がデータの分類を簡単に記載したものとなります。

画像1

質的変数名義尺度順序尺度に分けれられます。名義尺度は名義的に数値を施した尺度、順序尺度は名義尺度に加えて順序にも意味がある尺度となります。こちらの例だと、「好き>普通>嫌い」といったように好き~嫌いの間には順番にも意味がありますよね。一方で、男と女、または血液型や郵便番号などは名義尺度となります。

一方で、足したり引いたりできるような数字のデータの場合は、量的尺度と呼ばれます。こちらは間隔に意味がある場合間隔尺度数値の比にも意味がある場合比例尺度の2つに分けることができます。間隔尺度の例としては時刻や温度などがあります。例えば、温度の場合は25℃から26℃になった時は「温度が1℃上がった」と言えますが、25℃から50℃になった時は「温度が2倍になった」とは言いませんよね。一方で体重などでは25kgから50kgでは「体重が2倍になった」と言うことができ、比例尺度となります。


2. コレポンのアウトプットをRで出力してみる

はじめにコレポンで得られるアウトプットをRを使って確認してみます。「コレポンってこういうことができるんだ!」と雰囲気を掴むところからスタートしましょう。

今回の分析では、「ブランド別のイメージをアンケートで聴取した」という設定で適当にエクセルでデータを作ったものを分析してみます。ブランド×イメージについてコレポンをするというのは、マーケティングリサーチ界隈では見かけることが多い分析パターンですね。

画像2

このデータは、「ブランド1×かわいい・・・38%の人が答えた」という読み取り方になります。このような表のことをクロス表と呼びます。

それでは、作成したデータを読み込みましょう。

data <- read.csv("brand_image.csv", header = TRUE)
brand_image <- data[,2:8]
rownames(brand_image) = data[,1]

次に読み込んだデータについて、MASSというパッケージのcorresp関数を用いてコレポンを実施してみます。

library(MASS)
bi_cp <- corresp(brand_image, nf = 2)
bi_cp

コレポンの結果は行と列のスコアとして確認することができます。

画像4

このデータをプロットしてみます。

biplot(bi_cp, xlab="Factor 1", ylab="Factor 2")

画像3

近くにある項目は相対的に関連性が強いことを意味しています。つまり、

(1) ブランド2とブランド8は似ている・・・?
(2) ブランド1とブランド5は似ている・・・?
(3) かっこいいとワイルドは近い・・・?

(a) ブランド11は真面目なイメージ・・・?
(b) ブランド12は他と比べてかわいいイメージ・・・?
(c) ブランド14は美しくのんびりなイメージ・・・?

といった感じで関連の強さを読み取れそうですね。ただし、ここで注意が必要なのはこのように、(1)~(3)は数理的に解釈できるが、(a)~(c)は数理的に定義することはできません。つまり、(a)のように「ブランド11が真面目というイメージと近い」と解釈するのは誤りになります。コレポンではブランド間(行要素)、イメージ間(列要素)について、それぞれについて分けて距離を判断するようにしましょう。

ではコレポンのメリットは何か?それはクロス表の結果を人間さんが読みやすくすることです。例えば、ブランドの項目が100個あり、イメージも50個くらいあるクロス表がある時、表を眺めて読み解くのは大変ですよね。そのような時にコレポンを使って可視化することで、「近いブランドは何か?」「どのイメージ同士が近いのか」といった判断をすることができます。

3. 結論

「コレポンやピンポンって響きが可愛いので好き」(違うそうじゃない)

今回はコレポンのアウトプットイメージを眺めてみました。コレポンでは質的変数であるカテゴリを数量化することで、カテゴリ間の距離を比べることができる手法となります。次回はコレポンの計算の中身についてふわっと覗いていきます。

以上、ふわっと学ぶコレポン -1 でした。

----------------------------------------------------------

REFERENCE
[1] 照井伸彦. 佐藤忠彦. 現代マーケティング・リサーチ. 有斐閣, 2013, 254-261.




この記事が参加している募集

Thanks for the support !