見出し画像

データ分析・活用の事例を分析する:小売におけるクロスMDと同時購買分析 (バスケット分析) その3 相手商品の選定

分析屋の下滝です。

本記事のシリーズでは、データ分析・活用だと思われる事例を分析しながら、我々はどのような活動をデータ分析やデータの活用だと呼んでいるのかを考察していきます。

なお、データ分析の各種の枠組みを分析していくという別観点のシリーズは以下を御覧ください。

過去の事例記事の一覧はこちら。

過去の事例分析を整理した記事はこちら。

事例の概要(これまでののおさらい)

前回から引き継ぎ、小売における同時購買分析(バスケット分析)を扱い、そのプロセスをこれまでのプロセスパターンでどのように表現できるのかを確認していきます。

バスケット分析は、小売においては、クロスMD(マーチャン・ダイジング)の施策に使われます。クロスMDは、販売促進施策の一つで、あるカテゴリの商品の購買力を活用して、そのカテゴリと関連性のあるカテゴリの商品をそのカテゴリの近くに陳列することで、買上点数を向上させるというものです[1]。クロスMDの例としては、「カレールー」の売場に「福神漬け」を関連陳列させるのは代表的なクロスMDとなります[3]。

他にもクロスMDの種類と例としては、次のようなものがあります[3]。
・定番系クロスMD:かゆみ止めと殺虫剤、冷却シートと体温計
・気づき系クロスMD:生理用品と貧血改善薬あるいは鎮痛剤
・提案系クロスMD:脂肪燃焼系ドリンクとペットの散歩グッズ

クロスMDを実施検討する視点から考えると、あるカテゴリの商品が買われるときに同時に買われる可能性が高いカテゴリの候補を見つけられると、望ましいということになります。同時に購入されているかどうかは、一つのレシート(バスケット)内にその商品たちが同時に買われているかどうかで分析します。

クロスMDの施策を行うにあたってのID-POSデータ(ID付き購買データ。誰が、いつ、何を、どこで、いくつ、いくらで買ったのか)の役割は以下となります[3]。
・クロスMD企画立案時
 クロスMDの組み合わせ仮説の立案(同時購買率とリフト値の算出)
・クロスMD企画の実施後
 売上実績の評価(POSデータと併用活用)、クロスMD対象商品間の同時購買率の確認、クロスMD反応顧客の店舗購買金額の確認

今回の分析では、1つ目の「クロスMD企画立案時」のプロセスを対象とします。このプロセス内で、同時購買分析(バスケット分析)が行われることになります。

では、例題をもとにプロセスを確認していきます。

クロスMD企画立案

今回の例題は、文献[1]と[2]の解説を組み合わせたものとなります。クロスMD企画立案は、大きくは以下のステップだと考えました。
1.クロスMD施策を行いたい動機の発生
2.軸商品(軸カテゴリ)の選定(仮選定)
3.相手商品(相手カテゴリ)の選定(仮選定)
 3.1.同時購買分析により相手商品の候補を抽出
 3.2.同時購買率とリフト値の基準により候補を選定
4.軸商品と相手商品が同時に買われる理由の解釈

文献[1]によると、まず軸商品を選定し、次に相手商品の選定を行うと計画が立案しやすいと書かれています(スッテプ2と3)。文献[2]では、同時買われる理由を解釈するプロセスが解説されています(ステップ4)。

前々回の記事ではステップ1を扱いました。前回の記事では、ステップ2を扱いました。今回はステップ3を議論します。

ステップ1と2は次のようなプロセスで表現したところで前回は終わりました。

軸商品として「カレールー」が選定された状況からの話の続きとなります。

相手商品の選定

相手商品は、軸カテゴリーの商品とついで買いが発生しやすいカテゴリーであるため、計画率が低いカテゴリーが適しています[1]。

店頭マーケティングのためのPOS・ID-POSデータ分析, 図6-19, p.214

以下では、軸商品のカテゴリーと一緒に購入されやすいカテゴリーをバスケット分析(同時購買分析)を用いて探していくプロセスを紹介します。

以下の図は、バスケット分析のために使う集計結果の例となります。この例は『ID-POSデータ活用検定(基礎・カテゴリー分析編)テキスト』での解説をもとにしています。

『ID-POSデータ活用検定(基礎・カテゴリー分析編)テキスト』, p.47をもとに作成

図でのバスケットとはレシートのことを意味します。「総バスケット数」とは、ある期間で、2,428,610枚のレシートがあったという意味です。

軸商品名とは、通常、売り込みたい相手商品が売場を間借りする先となる商品となるようです[1]。軸商品の購買力を活用して、関連する相手先商品を販売することは基本となるため、購買率が高い商品や、顧客が計画的に購買する商品が軸商品に向いています。図では、「米飯加工品」が軸商品となっています。相手先商品には、「調理済みカレー」などが出てきています。なお、通常は、単品商品(個々の商品)ではなく、カテゴリーやサブカテゴリーなどの粒度で行うようです。

同時に購買される傾向が高い組み合わせなのかどうかは、同時購買リフト値(以下、単にリフト値)をみて判断します。

リフト値の計算方法を上記の図をもとに紹介します。相手商品としては「調理済みカレー」を例として計算します。

相手商品購買バスケット数
相手商品の購入回数、あるいは相手商品が入ったバスケットの数
「調理済みカレー」のバスケット数は、37,781

相手商品購買率
相手商品購買バスケット数 ÷ 総バスケット数  
「調理済みカレー」バスケット数 ÷ 総バスケット数
37,781 ÷ 24,28,610 = 0.016( 1.6%)

同時購買バスケット数
軸商品と相手商品が同時に入っているバスケット数。
「米飯加工品」と「調理済みカレー」の両方が入ったバスケット数は2,605。

同時購買率
軸商品が入った全バスケット数の中で、相手商品も入っているバスケットの割合。
同時購買バスケット数 ÷ 軸商品バスケット数
同時購買バスケット数 ÷ 「米飯加工品」バスケット数
2605 ÷ 43,439 = 0.06 (6.0%)

同時購買リフト値
軸商品の入っているバスケットに相手商品のも入っている比率が全バスケットに相手の商品が入っている比率よりも何倍高いのか。
同時購買率 ÷ 相手商品購買率
同時購買率 ÷ 「調理済みカレー」購買率
6.0% ÷ 1.6 % = 3.9
この例では、「米飯加工品」が入ったバスケットに「調理済みカレー」も入る確率が、全バスケットの中に「調理済みカレー」が入る確率より3.9倍高い、という意味になります。もし、「米飯加工品」と「調理済みカレー」に何ら関係性がなければ、同時購買率は全バスケットにおける「調理済みカレー」の購買率である1.6%と同じになり、同時購買リフト値は1となります。しかし、実際には、リフト値は3.9となっているため、1.0より大きな数値となっています。したがって「米飯加工品」を買うときは、同時に「調理済みカレー」が一緒に買われやすい、ということになります。

経験則ではリフト値は2以上が目安とされます[2](ただし、軸商品の高倍率が高いとリフト値が低くなりやすいため、リフト値が全体的に低い場合は1.5以上を目安とするとのことです)。

またもう一つの条件として、同時購買率がそもそも低い場合は買い上げ点数の大きな増加が期待できないため、一定以上の同時購買率があるほうが望ましいとされます。同時購買率に関しては特に基準は記載がなさそうです[1][2]。

ここまでをプロセスパターンで表現したいと思います。

ポイントは4つあると考えました。
1.計画率が低いカテゴリーという条件
2.集計するというプロセス
3.リフト値が2以上という条件
4.同時購買率が低くないという条件

プロセスで表現していく前に、クロスMDの施策の観点から整理しておきます。前回の記事までのプロセスは、以下の図のように表現していました。ここで、施策案は、仮説を生み出すプロセスへのインプットとなる要素でした。

また、施策案というのは、テンプレートとして表現できるものだとして議論を行ってきました。

クロスMDの場合は、軸商品カテゴリと相手商品カテゴリという穴(テンプレート変数と呼んでいます)が空いている、という意味でテンプレートと呼んでいます。その穴(変数)には具体的なカテゴリーを入れていきます。ただし、どのようなカテゴリーでもよいわけではなく、条件があります。その点もテンプレートとしての施策案の表現となります。また、条件を探すために各種の分析が行われるとして表現しています。

最終的に穴がすべて埋まった施策案は、具体的な施策として表現されます。もちろん、実行可能な実際の施策とするためには、いつ誰が実行するのかなど、決めなければいけないことは様々残っています。

ここまでを踏まえて、ポイントの話に戻りながら、施策案の観点から考えていきます。ポイント1は、相手商品カテゴリのテンプレート変数に対する条件の一つとなります。以下の図には、相手商品カテゴリーに関する条件を追加しました。

ポイント2は集計なので飛ばします。

ポイント3と4は、軸商品カテゴリと相手商品カテゴリの組み合わせに対する条件です。同じように、条件を図に追加しました。同時購買分析は、この条件を満たす組み合わせを発見するために使われるとみなせそうです。

では、続いてはプロセスとしての表現を考えていきます。

計画率が低いカテゴリーを探すというプロセスは、以下のようなプロセス要素として解釈できると考えました。
・非課題抽出の動機を生み出すプロセス:集計結果をみれば計画率が低いカテゴリーXが存在するかどうかわかるため
・知識を生み出すプロセス
 ・比較のプロセス
  ・非課題抽出プロセス:「福神漬け」は計画率が低い
  ・課題抽出プロセス
・仮説を検証するプロセス:計画率が低いカテゴリーである福神漬け(X)が存在した

ここでは、前回の記事の例の続きのため前述の例題の「調理済みカレー」ではなく「福神漬け」を例として使っています。

また、計画率が低いカテゴリーは、福神漬けのみを候補としたことにしていますが、実際は複数のカテゴリーが候補となると思われます。

以下の図にこれらのプロセスを示します。

前回の記事のプロセスと同様です。

次に、同時購買分析のためのプロセスです。以下のようなプロセス要素として解釈できると考えました。
・集計の動機を生み出すプロセス:集計すればカレールーと福神漬けが一緒に購買されやすいカテゴリーどうかを判別できるため。
・集計のプロセス:ID-POSデータにより、同時購買分析の形になるように集計
・知識を生み出すプロセス
 ・比較のプロセス
  ・非課題抽出プロセス:福神漬けはカレールーと一緒に購入されることが多い
  ・課題抽出プロセス
・仮説を検証するプロセス:カレールーと一緒に購入されるカテゴリーとして福神漬けが存在した

比較の要素の観点からも確認しておきます。
 ・比較対象1:相手商品購買率:カレールーが入ったバスケットに福神漬けも入る確率:1.6%(数値は仮)
 ・比較対象2:同時購買率:全バスケットの中に福神漬けが入る確率:6.0%(数値は仮)
 ・知識:「カレールー」が入ったバスケットに「福神漬け」も入る確率が、全バスケットの中に「福神漬け」が入る確率より高い。つまり、福神漬けはカレールーと一緒に購入されることが多い。

以下の図にこれらのプロセスを追加した図を示します。

次に「リフト値が2以上という条件」というプロセスです。これは、上記の図での集計結果から得られる別の非課題知識だとして表現できると考えました。

一つ表現として追加したのは、リフト値の目安となる知識です。これは、外部から得られた知識であるとみなしました。実際に、どのようにこの目安が算出されたのかはわかりませんがこれもまた何かの集計により得られたものではないかと考えられます。ただし、非課題知識としての意味合いを満たすのかどうかはわかりません。この点は考察の節で議論します。

・知識を生み出すプロセス
 ・比較のプロセス
  ・非課題抽出プロセス:福神漬けとカレールーと一緒に購入されるときのリフト値が経験則より高い
  ・課題抽出プロセス
・仮説を検証するプロセス:福神漬けとカレールーとが一緒に購入されるときのリフト値が経験則の条件を満たした

比較の要素の観点からも確認しておきます。
 ・比較対象1:神漬けとカレールーとが一緒に購入されるときのリフト値
 ・比較対象2:リフト値の目安
 ・知識:福神漬けとカレールーと一緒に購入されるときのリフト値が経験則より高い

「同時購買率が低くないという条件」のプロセスは同様です。

・知識を生み出すプロセス
 ・比較のプロセス
  ・非課題抽出プロセス:福神漬けとカレールーと一緒に購入されるときの同時購買率が低くない
  ・課題抽出プロセス
・仮説を検証するプロセス:福神漬けとカレールーとの同時購買率が低くなかった

比較の要素の観点からも確認しておきます。
 ・比較対象1:神漬けとカレールーの同時購買率
 ・比較対象2:同時購買率が低くくないとする値
 ・知識:福神漬けとカレールーと一緒に購入されるときの同時購買率が低くない

今回は以上です。

考察

以下の点に関して考察します。
・仮説の更新と施策案との関係
・外部の非課題知識と施策案との関係

仮説の更新と施策案との関係

今回の分析では、仮説の要素は非常に多くの要素で構成されているものとして扱いました。
・n週目に需要期となりかつ購買力が高いカテゴリーYが存在し
・カテゴリーXがYと一緒に購入されるのであれば
・クロスMDすることでカテゴリーXの買い上げ点数を向上させられる可能性があるのではないか?

これら要素からなる仮説は、集計のプロセスと集計結果から非課題知識を抽出するプロセスにより、部分的に検証されていくと表現できそうです。

そしてこの検証が行われていく過程は、施策案のテンプレートを埋めていくプロセスとも関係します。各条件を満たす値(商品)が存在するのかを検証していくプロセスです。

外部の非課題知識と施策案との関係

今回「リフト値の目安として2以上(ただし、軸商品の高倍率が高いとリフト値が低くなりやすいため、リフト値が全体的に低い場合は1.5以上を目安)」という条件は、外部から与えられた非課題知識だとして扱いました(実際は異なる性質の知識かもしれません)。

この「2(や1.5)」の数値はどこから出てきたのでしょうか。経験則ということで詳細はわかりません。しかし、何らかのデータをもとにしていると考えられます。このことは以下を意味します。
・集計結果から非課題知識を抽出する際に、その集計結果ではない別の集計結果から得られた非課題知識(Xと呼ぶ)を使う
・ローカル性:その非課題知識Xは、その施策案の中でローカル(閉じた、局所的な)な知識である。
・再利用性:その非課題知識Xは、その施策案を具体化していく個別の状況(施策案インスタンスと呼びたいと思います)で再利用されるように使われる。
定数性:その非課題知識Xは、必ずしも定数ではないが、定数のように扱われる。

さらに別の疑問も生みます。
・ある施策案の中でローカルでなく、異なる施策案でも使われるようなグローバルな非課題知識は存在するか?

まとめ

今回は、前回から引き続き、小売における販促手法の一つとしてのクロスマーチャンダイジング(クロスMD)施策における、バスケット分析(同時購買分析)でのプロセスの詳細を、プロセスパターンで表現できるかどうかの検証を試みました。

今回は、相手商品となる商品選定のステップまでを分析しました。

次回は、軸商品と相手商品が同時に買われる理由の解釈の分析を行います。続きはこちら


参考文献

[1] 店頭マーケティングのためのPOS・ID-POSデータ分析, 2016
[2] ID-POSデータ活用検定(基礎・カテゴリー分析編)テキスト, 2023
[3] 改訂版 「マーチャンダイジング」と「マネジメント」の教科書, 2015
[4] 52週マ-チャンダイジング: 重点商品を中心にした営業力強化と組織風土改革, 2004 
[5] インストア・マーチャンダイジング 第2版, 2016

株式会社分析屋について

ホームページはこちら。

noteでの会社紹介記事はこちら。

専用の採用サイトはこちら。

求人情報はこちら。

【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。