見出し画像

確率思考の戦略論の数式でSNS・広告・PRの効果を把握@テーマパーク

森岡毅氏、今西聖貴氏の共著「確率思考の戦略論」を読んでお二人のことを知り、マーケティング精鋭集団の「刀」に憧れて「秤」という会社を設立しました。

マーケティングに関わる方で、この書籍に影響を受けた方は多いと思います。

「プレファレンス(消費者の選好性)」によって市場構造が決定する法則や、NBDモデルという数式などが紹介されました。このnoteでは、消費者調査から需要の構造とSNS・広告・PRによる集客効果を把握する方法を紹介します。自らの「秤」を持っていただくヒントになれば幸いです。題材にしたのはテーマパークです。

先に書くと、たとえば近畿エリアのTVCMによって、ユニバーサル・スタジオ・ジャパン(以降「USJ」)の来園を増やした効果(2022年正月前後の1か月)の推計金額は3.14億円でした。

2024年6月26日更新

新著「その決定に根拠はありますか?」Amazonでの販売を開始しました!

はじめに

テーマパークは2020年から休園や入場制限が行われてきました。平常に戻ることを願うばかりです。2022年お正月までは、感染者数も落ちついていたので対策をして出かける機会も多かったのではないでしょうか?

私は東京在住の43歳です。USJは、2019年に一度だけ行ったことがありますが、その後に出来たニンテンドーエリアが気になって仕方がありません。TVCMや番組の特集を見るたびに心を躍らせています。東京ディズニーランド(以降「TDL」)に最後に行ったのは2018年でした。

このnoteは森岡毅氏らが再生させたUSJと、「顧客理解サイクルの作り方」というマーケティング講義を一緒に行っている山本寛氏が以前リサーチャーとして勤務していたTDLを分析対象として、消費者行動の確率を計算する分析で需要とSNS・広告・PRによる貢献を把握します。

森岡氏は著書で首都圏の方をUSJに呼び込むため、東京大阪の往復の新幹線料金約3万円を払ってでも行きたいと思わせなければいけなかった「3万円の川」に言及されていました。

近畿からTDLに行く人が多いのか、それとも関東からUSJに行く人のほうが多いのか?それを調べるために、2022年1月中旬に20歳から69歳男女を対象に関東と近畿それぞれ1万人ずつ調査をしました。

3万円の川を渡ってUSJ、TDLに行く人はそれぞれ何人いたのか?

20~60代男女を母集団とした対象エリアの人口は関東1都6県27,934,640人、近畿2府5県13,668,936人(令和3年住民基本台帳データ)です。

関東と近畿それぞれ、2022年1月中旬までの1か月で「3万円の川」を渡った人がエリア人口に対して何%になっているか割合の多い少ないで見ていきます。

「あなたは最後にいつ〇〇しましたか?」という設問から分析することで、消費者行動の回数や人数を把握することができます。

まずは3万円の川を超えてそれぞれのパークに行った方の人数です。

関東からUSJに行った方は0.69%です。もっとも多いのは20代女性(1.90 %)、次いで20代男性(1.51%)です。

近畿からTDLに行った方は全体で0.55%。関東からUSJに行く方より若干少ないです。20代女性が1番(1.23%)で次いで20代男性(1.14%)の傾向は同じです。

次は「インターネットの検索やホームページを見るなどして調べた」人数です。

こちらはわずかに近畿が多くなっています。さきほどと似た傾向ですが、近畿からTDLについて調べる20代男性(4.79%)よりも関東でUSJを調べる20代男性(6.42%)が多くなっています。

ネットで調べた方はパークに行った方の約4.5倍(USJ)と約6倍(TDL)です。調べた人の何割がパークに行くなどの目安にもなるかもしれません。検索データを含む時系列データ解析で、検索と来園の関係を把握する方法もあります。

私は小さい子供がいるので、家族や友人とテーマパークの話題になることが多いです。そうした会話や、友人や知人のSNSの投稿が行きたくなるきっかけになると思います。

クチコミの実態を数字で把握する

次は、それぞれのパークを調べたことがある方のうち、話題にした人数です。

近畿でTDLを話題にした方は9.33%もいました。20代女性が突出しており16.82%です。関東は6.93%です。

続いて、それぞれのパークを調べたことがある方のうち、SNSに投稿した人数です。

SNSに投稿した方は全体の1%を下回っています(関東0.81%近畿0.80%)。

パークに行った人数を少し上回る程度です。話題にする人数は投稿する人数の10倍程度です。SNSで投稿する方は男性が若干多くなっています。

SNSは投稿せずに見るだけという方も多いので、テーマパークに限らず多くの業種の分析でこの傾向(話題にする人数>SNS投稿する人数)です。

次に、話題にした方ひとりあたりが話題にする確率から導いたMという値を見ていきます。

話題にした方の回数の平均は大きな差はありませんが、Mの値はかなり違います。近畿→TDLの20代女性が0.28と突出しています。

MNBDモデルという消費者行動の確率分布の数式に関わる値で、プレファレンス(消費者の選好性)に対応するものです。

確率統計の専門用語で表現すると消費者1人あたりが購買などのアクションをする回数の期待値です。たとえばサイコロは1から6の目がありますが、出る目の平均は3.5です。これがサイコロの目の期待値です。

サイコロを振るとそれぞれの目の値が出る確率は均等で1/6です。その確率に1から6までの値を掛け合わせます。

1の目・・・ 1×1/6=1/6
2の目・・・ 2×1/6=2/6
3の目・・・ 3×1/6=3/6
4の目・・・ 4×1/6=4/6
5の目・・・ 5×1/6=5/6
6の目・・・ 6×1/6=6/6

これを足しあげた数字21/6=3.5がサイコロを振ったときの目の値の期待値です。

NBDモデルでは、ある一定期間に消費者が買う、調べるなどのアクションを行う人が何%になるか?確率を求めます。これをアクション回数別の市場浸透率(Pr)といいます。

確率思考の戦略論で紹介された数式が以下です。左辺のPrを求めるものです。

確率思考の戦略論 P58より引用

Prと購買回数を掛け合わせます。サイコロの目と違い、Prは一定ではなく、NBDモデルが前提とする法則に従って変化します。(以下は説明用に抽象化した例です)

Pr(0)   0回買う人が60%→0
Pr(1)   1回買う人が20%→0.2
Pr(2)   2回買う人が10%→0.2
Pr(3)   3回買う人が5%→0.15
Pr(4)   4回買う人が2.5%→0.1
Pr(5)   5回買う人が2%→0.1
Pr(6)   6回買う人が0.5%→0.03
Pr(7)   7回買う人は0%→0※8回以上も同様に0

太字の数字の合計0.78Mです。消費者1人あたりの購買回数の期待値です。購買回数を人数で割った値です。1.2億人の市場で1ヶ月に1,200万回購買される商品の月間のMは0.1です。1人あたり0.1回の購買が期待できます。

近畿でTDLを話題にするMのうち、20代女性のMが0.28で突出していました。人数は113万8,197人です。これに0.28を掛け合わせた31万8,695回が、関東の20代女性が2022年1月中旬以前1ヶ月にUSJを話題にする回数の推計値です。

近畿→USJ、関東→TDL、地元の需要の分析結果も記載します。3万円の川を越える結果と見比べると発見があると思います。

私が気になったのは、3万円の川を渡る分析では来園した人数を投稿した人数が上回っていましたが、地元の分析では、投稿した方の人数が、来園した人数を下回っていたことです。

3万円の川を渡ってパークに行くのは宿泊して行く方が多いと思います。なかなかできない体験です。2019年の人生初USJ(未だ1回きりですが)の時は、私も全力で浮かれてSNSにたくさん投稿しました。3万円の川を渡った時のほうがSNSにシェアする人数が多くなるのも納得です。


SNS・広告・PRによって、来園と調べる回数はどれだけ増えたのか?

マーケティングにおいて、消費者とのコミュニケーション手段としてSNSに期待している方は多いと思います。来園または調べる行動にSNSはどれくらい貢献しているのでしょうか?

ブランド好意度や利用意向の変化とMの変化からマーケティング施策の効果を把握する方法で、各社が行っているマーケティング施策【TVCM・ネット広告(広告)/TV番組(PR)】と横並びで把握します。

まず来園回数への貢献回数です。

関東→USJはTV番組による貢献がもっとも多いです。私もバラエティ番組でニンテンドーワールドの取材を何度も見て心を躍らせました。

近畿→TDLはTVCMが1番で次いでSNSです。SNSの貢献数はどのカテゴリもネット広告を上回っています。投稿する人は、話題にする人の1割程度でしたが、SNSは来園に貢献しているようです。

近畿→USJはTVCMの貢献が全カテゴリーでもっとも多くなっています。3万円の川を渡る必要がない地元はTVCMが効きやすいのでしょうか?

関東→TDLは4カテゴリのネット広告のうち、貢献がもっとも多くなっています。関東近畿でネット広告を比較すると関東のほうが貢献が多いようです。

次は「調べた」アクションの回数に対する貢献比率です。

各エリアとも調べた回数の10%前後が、対象にした要因(TVCM、TV番組、ネット広告、SNS)による貢献となっています。

テーマパークの様に、数年に一度くらいの利用頻度の方が多い商品やサービスは、TVCMなどの施策が、調べるアクションを増やしているかを把握することが重要だと考えます。

分析法の解説を進めながら、その理由をご説明します。

どんなデータから分析結果を導いたのか?


関東、近畿、それぞれのエリアで20代から60代男女1万人に行った消費者調査データです。Freeasyというセルフリサーチツールを使いました。

比較対象として、刀社が支援した関東の西武園ゆうえんちと近畿の神戸ネスタリゾート、パンダを見ることができる関東の上野動物園と近畿のアドベンチャーワールドも加えています。

ここから紹介する結果は、年代性別と居住県の人口を考慮した重み付け集計値です。

まず1問目は調査対象者のカテゴリー関与度を知るための旅行の年間投資金額です。

関東、近畿ともに1人あたりの年間投資額が3万円未満の方が4割強です。感染症の影響で自粛を踏まえた回答もあるかもしれません。3万円の川のハードルは高いようです。

2問目はブランドの助成想起です。

知っていると回答した方がUSJとTDLと東京ディズニーシー(以降「TDS」)と上野動物園は関東近畿とも100%近いです。和歌山県のアドベンチャーワールド(以降「ADW」)は近畿では100%近いですが、関東では50%です。埼玉の西武園ゆうえんちと神戸ネスタリゾートは地元では8割くらい認知されていますが、3万円の川を渡るとあまり知られていません。

3問目はそれぞれのブランド認知者に直近で行ったタイミング(または行ったことがない)を聞きます。このデータをリーセンシーデータといいます。これがあればアクション回数の分布を把握することができます。

Q4は利用意向です。多くのケースで好意度と利用意向を両方調査します。いずれかの指標に対する効果を推計する際、もう一方の指標を効果検証の分析で起こるバイアスを補正するために活用します。

Q5は最後にいつ調べたか?のリーセンシーデータです。
購買頻度が少ない商品やサービスではインターネットの検索やホームページを見て調べたかを聞いて分析しています。

Q3で関東でTDLに行ったことがない方は、わずか6.3%でしたが、Q5で関東でTDLを調べたことがない方は、44.0%もいます。

テーマパークに行くことは、計画を考えるのが好きな人と受け身で行く人がいることの表れだと思います。

休日にどこに出かけるかを考えるのは、我が家では家内です。いつも色々とスマホで調べて私に聞いてくれます。テーマパークのマーケティングの対象は受け身な私ではなく家内です。TVCMなどの施策を行うのであれば家内のように調べる人(≒能動的に計画を考える人)の態度変容を数字で把握することが重要です。

テーマパークのような行楽や旅行、家電や自動車、不動産やBtoBのサービスなど、購買決定を1人で完結せず、家族や会社で相談するような商品やサービスの購入はキーマンの態度変容が重要です。

マーケティング施策それぞれによる調べる人のアクションの増加数は、投資判断を行うための重要な指標になるはずです。

Q6は好意度です。今回紹介する分析では、好意度が高い人を増やすと来園や調べる回数はいくつ増えるかを推計しました。利用意向やブランドへの興味などの指標を基準にすることもあります。


Q7は今回、効果把握の対象とした4つの施策の集計です。より細かな分析も行えるように、実際は10項目で、直近1年間で見た内容を聞いています。

Q8は、対象メディアの利用時間が多い人ほど対象広告に接触しやすく、購買しやすい(または購買しずらい)という影響が効果検証のバイアスになることを調整するための質問です。

Q9とQ10は、話題にした回数と、SNS投稿をした回数をそれぞれ推定するためのリーセンシーデータの設問です。今回は調べたことがある方にだけ聞いていましたがブランド認知者全員に聞いてもよいと思います。


消費者調査から、TVCMなどの要因ごとにアクション貢献数を推計する方法

マーケティング施策による購買や調べるアクションの増加を把握して、投資判断に活用する分析法をこのパートで紹介します。すこし専門的な内容もありますが、noteの最後に紹介する動画でわかりやすく解説します。

ブランド好意度の変化とMの変化から効果を推計するために、因果推論と確率モデルの分析を併用します。

近畿エリアのUSJのTVCMの効果検証を例に解説します。

傾向スコア・マッチング(因果推論の分析)

TVCMなどのマーケティング施策によってブランドの好意度がどれだけ増えたかを推定する際に、TVCMを見た人々(介入群)と見なかった人々(対照群)の好意度の平均値を単純比較して、その差分をTVCMによる効果と判断することがマーケティングの現場で行われています。しかし、

TVをよく見る人や、ブランド関与が高い人のほうが、TVCMを記憶しやすく、かつ好意度も高い傾向にあるなど、原因(TVCM)と結果(好意度)の双方に影響を及ぼす要因によるバイアスが発生していることがほとんどです。

単純比較の介入群と対照群の好意度の平均値の差分は、「TVCMによる効果」だけでなく、原因(TVCMを見る)と結果(好意度)の両方に影響を与えている要因の影響を含んでいます。

こうした原因と結果の双方に影響する要因を交絡因子または共変量といいます。

これによるバイアスへの対策が必要です。無作為抽出によるランダム比較実験ができれば、介入群と対照群の偏りがない状態で比較できますが、お金と手間がかかります。

そこで、分析によって実験に近い状態を作ってバイアスを調整する、因果推論の分析手法のひとつが傾向スコア・マッチングです。

介入群となる確率を予測する分析(ロジスティック回帰分析)を行い、それぞれの調査モニターに介入群となる確率(傾向スコア)を付与します。


近畿→USJ20代男性のTVCM効果検証用データ

このスコアを元に共変量が同じくらいの対象者を介入群と対照群のそれぞれから抽出し共変量のバランスを取った2つのグループで好意度を比較します。

Freeasyモニターの基本属性(世帯年収/職業/結婚/持ち家か賃貸か/子供有無/年齢)と、推定したい効果(好意度)と別のブランドロイヤルティ指標(今回は利用意向)と、TV、またはインターネットを1日に何時間見ているか?を共変量として2つのグループのバランスをとって、好意度を比較します。

近畿→USJのTVCMの効果検証(20代男性)の際に行った共変量のバランス。マッチング調整前後の介入群対照群の共変量の差(標準化)のプロット。TVCMの介入のあったグループとなかったグループの元データとは違い、マッチング後は共変量の差がほとんどなくなっています。

※専門知識を持つ方向けに記載する傾向スコア・マッチング分析時の設定です。EZRでロジスティック回帰分析(ステップワイズ無しの説明変数固定で実行)を行います。エクセル統計で傾向スコア・マッチングを行います。(コモンサポートを除外/ロジット変換はしない/キャリパーは傾向スコアの標準偏差の0.2/マッチングの順番は乱数でシード100)300回以上、このモデルでマッチングの試行を重ねた結果、前述した共変量を用いたモデルでマッチング後の2群の共変量のバランスがとれやすい傾向があると判断し、この設定を基本としています。


近畿→USJのTVCMによる好意度UPの効果検証で、TVCMを見た人と見ない人の「好感が持てる」回答率の差分です。

近畿→USJのTVCMによる態度変容の差分

単純比較と傾向スコア・マッチングでは大きな差があります。このケースでは、単純比較は効果の過大評価の可能性が高くなります。

傾向スコア・マッチングを年代性別ごとに行い、広告接触者のうち何%が態度変容したかを推計し、接触人数にかけ算して態度変容した人数66.6万人を把握します。

ガンマ・ポアソン・リーセンシー・モデル(確率モデル)

あなたは最後にいつ、○○しましたか?と聞くことでNBDモデルの式にあてはめた予測値と実績値(期間別浸透率Pn)の予測誤差を最小にするMと、Kという分布の形を決める係数をExcelの計算ツールのソルバーで計算します。確率思考の戦略論で紹介されていた分析です。

※正確には予測誤差を2乗した値の合計値(平方和)を最小化する計算をExcelソルバーで行います。最適解の保証がない非線形な問題をソルバーで解きますが、初期値の違いで解が変わります。初期値によっては計算エラーになります。私が体系化した分析法では計算エラーや過大または過小な推定を避けるための設定(制約条件の追加)をルール化し、最適化な初期値を探してから複数の計算をVBAで自動実行しています。

Mは1人あたり、一定期間でブランドが選ばれる確率であり期待値でした。

これを年代ごとに明確なブランド好意がある方(好感が持てると回答)と、それ以外の方に分けて推計し、2つのMの差分をとります。

近畿→USJの来園の「M」の分析結果

この2つのMの差分が、好意度が高い人を一人増やした際に、期待できるアクションの増加数です。

態度変容した人数に、差分Mを掛け算することで月間で何回アクションが増えるかを推計します。

近畿→USJのTVCMによる来園効果の推定結果(2022年1月中旬以前1か月)


右下の補正係数(2倍)で掛け算した22,873回が、TVCMによって増えた2022年1月中旬以前1か月の来園回数の推定結果です。ここで2倍にしている理由を説明します。

同伴者のアクション数を考慮

この方法で考慮できていないのが同伴者の来園回数です。これまでの分析では、施策の接触者本人の態度変容によって増えたアクション数を推計しています。

仮にTVCMで態度変容した方が来園した場合、TVCMの影響をうけていない同伴者を連れていったとしたら、その回数は推計に含まれません。そこで、今回は平均1人同伴者がいるとして2倍の補正係数を掛け算しました。

なお、わが家の場合は、家内が何かの懸賞で優待チケットを当てて、友人と子供、私と子供の大人2名と子供2名の1泊2日分のUSJ関連需要を創出しました笑。

これを精緻に導くには自社の分析の場合は、会員データなどをヒントにします。競合ブランドの場合は、「あなたは最後にいつ、どなたかに誘われてパークに行きましたか?」など調査して分析し、受け身なスタンスでのアクション回数を推計します。全体の来園回数のうち、何割が受動的なアクションかを把握して補正係数を決めます。

あとは来園時に使用する1人当たりの金額をかけ合わせて効果を金額換算します。

前述した近畿→USJのTVCMの場合は、1人あたり13,642円として月間1.41億円です。単価は東京ディズニーランドを参照しました。(2021年OLCグループダイジェストのゲスト1人当たり売上高を参照)

効果の金額換算は、

・その施策にどれだけの人数が影響されたのか?(接触者数※消費者調査による施策を記憶していた人数)

・どれだけの割合の人が態度変容したのか?(ここでは好意度5段階尺度のTOP回答)

・ポジティブな態度変容によりアクションは何回増えるのか?(消費者行動の確率分析より)

以上の3つの係数と同伴者を考慮した補正係数(暫定で2倍)と購買単価13,642円を掛け算して推計しています。3万円の川を渡る場合はさらに平均1泊で2日遊ぶとして、さらに2倍で計算します。

以下は、今回対象としたエリアとブランドと要因の軸で、来園回数と調べる貢献に関わる指標をまとめたものです。

※この分析では傾向スコア・マッチングでマッチング後のサンプルサイズが80〜100を下回ると2群の共変量のバランスが不安定になる傾向があります。今回、各年代性別ごとのサンプルサイズ1,000からエラー回答を削除した後の介入群のサンプルサイズが100以上あるとマッチング後のバランスが安定しやすい傾向です。各エリアで接触者が3割から7割あるTVCMとTV番組はバランスが安定した分析ができましたが、リーチ10%前後のネット広告ではターゲット年代性別の一部で不安定な2群のバランスによる結果を含みます。不安定な2群による過大な推計が疑われる場合とマイナス係数の場合は係数を0として集計しています。

導いた効果をどのように解釈するか?


導いた効果の解釈は、理論上は、「調査時点から直近1年間で認識された各要因(TVCMなど)による調査以前1ヶ月の効果」です。

理論上としたのは、調査(Q5)では「直近1年に見た記憶がある施策」と聞いていましたが、実際には1年より前に広告などを見ていたが、1年以内に見たと勘違いしている回答を含む可能性が多くあるためです。

直近1年ではなく、これまでユーザーが見てきたTVCM、TV番組、ネット広告、SNSの情報の累積効果による調査以前1ヶ月の効果と捉えるほうが現実的かもしれません。

確率思考の戦略論では森岡氏がガンマ・ポアソン・リーセンシー・モデルによってUSJ最大の需要期だったハロウィーン時期の売上を2倍以上に伸ばせる余地があると予測し、その時期に注力する戦略から行きついたハロウィーン・ホラー・ナイトという施策によって前年7万人だった集客が40万人まで増えたエピソードが紹介されました。

最後にいつ○○したか?の調査結果は聞く時期によって変化します。繁忙期の直後の調査では直近でアクションした方が増えます。その結果によってMも変化します。

森岡氏がハロウィーンに注力したように、月次での需要の変化を捉えることができます。マーケティング施策による効果の変化も捉えることができます。季節性とマーケティング施策による市場のダイナミックな変化を構造的に捉えることが、この分析の真骨頂だと思います。

まとめ

消費者調査を行う際に、最後にいつ○○しましたか?の設問を加えることで年代性別ごとのアクション数を把握できます。

好意度が高い方とそうでない方のMの差分をとり、傾向スコア・マッチングで導いた態度変容人数とかけ算することで、マーケティング施策によるアクション数の増加を推計できます。

TVCMなどの広告を見た人と見なかった人を単純比較して、利用意向や好意度を比較したときの差分はTVCMによる効果だけではありません。ブランドのロイヤルティが高い人ほど、TVCMを記憶しやすく、購買回数が多い傾向にある、こうした交絡または共変量による影響を含みます。このバイアスを調整するために、傾向スコア・マッチングが有用です。

今回の調査では、USJとTDLを話題にしている方は来園者の10倍程度もいることがわかりました。SNS投稿をする方はその1割でしたが、SNSはネット広告よりも来園に貢献していることがわかりました。また、テーマパークに行ったことはあるが調べたことがない方が多いことがわかりました。

テーマパークの来園を増やす起点は、ブランドのことを能動的に調べる人と回数を増やすことです。

テーマパークに限らず、自動車や不動産などの耐久財やBtoB向けの商品やサービスなど、利用頻度が少なく、複数の方と相談して決めるような商品やサービスの購買を増やすためには、調べるアクションを増やす効果を把握して、最適な投資を行うことです。

森岡毅氏の著書から引用すると戦略とは、

目的を達成するために資源(リソース)を配分する「選択」のことです。

USJを劇的に変えた、たった1つの考え方 成功を引き寄せるマーケティング入門


購買などのアクションの確率から需要を把握し、季節性とマーケティング施策による市場の変化を捉える

ことがこの分析の真骨頂であり、データドリブンに戦略を描くマーケターのみなさんに共有させていただきたいノウハウです。

明確な数字から戦略を導くために、

まずは、消費者調査に「最後にいつ○○しましたか?」という設問を加えてみませんか?


分析方法を共有するオンライン講義

ExcelとEZR(イージーアール)の演習で分析の内容を体験しながら理解してみませんか?

傾向スコア・マッチングもガンマ・ポアソン・リーセンシー・モデルも年代性別ごとに分析しているので、やり方を工夫しないと膨大な時間がかかってしまいます。ExcelVBAなど活用して、分析をスピーディに行う手順を体系化しています。その方法を共有する確率モデルで効果把握という講義を開催しています。

時系列データ解析による答え合わせ

2018年に発売した拙書「Excelでできるデータドリブン・マーケティング」では時系列データ解析による効果検証のマーケティング・ミックス・モデリング(以降「MMM」)をExcelでアドストック効果や投下量による飽和する非線形な影響を考慮した分析を行えるようにしました。相応の難易度のため、さらにハードルを下げて使いやすくするために、MMMの分析を体験できるようにした「統計モデルで効果検証」の講義では、映画「天気の子」の検索数やツイート数などの時系列データをオープンデータから整形した演習データで、売上を説明する中間変数としての検索データの活用が重要であることを演習しながら学ぶことができます。

「統計モデルで効果検証」講義テキストより


テーマパーク、自動車や不動産などの耐久財やBtoB向けの商品やサービスなど、利用頻度が少なく、複数の方が相談して決めるような商品やサービスでは、調べるアクションを増やすことができているか?検索データの時系列データ解析でも答え合わせをすることをオススメしています。

購買頻度が多い商材の場合は

購買頻度が多い商材の分析は、調べるアクションを介さずに、売上を直接推計する分析を行っています。飲食チェーン(マクドナルド、丸亀製麺、他5ブランド)の調査分析例をnoteにまとめました。


おまけ(確率モデルによる来園者数の推計の答えあわせ)

NBDモデルを活用する際は、調査で起こりえる様々なバイアスやExcelの最適化計算で起こりえる問題を調整して、実態に即した推計値になる様にキャリブレーションしています。

今回、正解データとしたのはTDLの来場数(2022年1月中旬以前1か月です)の推計値です。弊社で活用している人流データPapilioのデータを参照しました。(同社に開示許諾を得て掲載しています)

Papilioは全国の駅や観光地などの時間帯別の滞在人口や、居住エリア別来訪者人数などを時系列で観測可能なWebサービスです。

観光地のデータとして記録されている「東京ディズニーランド(画像の範囲)」の人流データを調べました。1か月の粒度で平日、休日と全日の24時間ごとの人流の推計値などを知ることができます。

執筆時に参照した最新(2022年12月)のデータでは、平日のピークは正午12時で31,244人。休日のピークも正午12時で31,717人でした。分析対象期間2021年12月16日~2022年1月15日までの31日間のうち、(正月休みを29日~1月3日として)13日間を休日、18日間を平日として計算すると来園数の推計値は974,713人でした。

山本氏にオープンなデータから考えられる推計値のヒントを教えて頂きながら以下のように考えていきました。

・TDLの過去最高入園者数は最高1,746万人(1998年度)※同社HPより
・1月のテーマパークの入園者数は年間の6.63%(特定サービス産業動態統計調査の全国テーマパーク入園者数/「長期時系列データ」2019年入園者数1〜12月の合算値7,946万人のうち1月527万人より

上記を掛け合わせて、ピーク時のTDLの1月の来園数の目安が115.7万人と推計しました。人流データを参考に算出した年末年始を含む1か月の来園者の推計が97.4万人にはキャスト分も含まれると思います。準社員も含めたキャストの総数が21,719人(2020年※同社HPより)という記載はありますが、1日キャストが何人稼働しているかは分かりません。ざっくり2~3千人と考えて、人流データからキャスト分を除いた分の、のべ来場数を90万人と考えました。そう考えると、ピーク時(115.7万人)の集客の77.7%ということになります。妥当な数字だと考えました。

今回私が行った調査の対象は20~69歳までで19歳以下と70歳以上を対象外としていました。OLCファクトブックには大人(18歳以上)が80%で2020年は移動の制限によって首都圏が全体の85%という記載がありましたが2019年は62%でした。それ以前の年も概ね60%強でした。2021年末から2022年の1月にかけては感染状況が落ち着いていたので暫定で首都圏の顧客の割合が70~80%だったと考えた場合、首都圏の18歳以上の来園者数は50.4万人~57.6万人です。70歳以上は0ではないがおそらく少ないと考えます。この範囲に収まるようキャリブレーションの設定を決めて推計した首都圏のTDLの来園数53.5万人(20~69歳男女)で、その設定で近畿エリアとUSJの関西近畿を分析しました。

※実態数値とのキャリブレーション、過大過少推定や計算エラーを避けるためのソルバー計算時の設定
・消費者調査の回答者が日本全体の1.3倍テーマパークの来園率が高い人に偏っていると想定(その逆数と県の人口比率で重みづけしたリーセンシーデータから分析し、回答者の偏りによるバイアスを補正)
・直近の期間、31日以内の利用の予測値が実績値の80%~120%の範囲で収まるように計算(Mの過大または過少な推定結果を回避しやすく)
・Kが0.000000001以上50以下/Mが0以上365以下(ソルバー計算時のエラーとなるリスクを減らす)
・月間で12回以上利用する方が全体の1億分の1以下の制約(過大推定を防ぐ)

調査に起こりえる様々なバイアスを調整し、正解と思われるデータとの照合を経て活用することが重要です。確率モデルで戦略仮説の演習では、キャリブレーションのやり方の例についても解説します。

マーケティング意思決定を確かなものにしたい、ご自身が学びたい、またはご自身が管轄する組織の知見にしたいという方はぜひご検討頂けますと幸いです。

追加情報(2023年12月18日更新)

クッキー規制で目減りする効果計測の課題を解決法をnoteにしました。無料で使えるMETA社の高機能なMMM(マーケティング・ミックス・モデリング)ツール「Robyn」を徹底解説する2時間強のYouTube講義を公開しました。

2024年6月26日更新

新著「その決定に根拠はありますか?」Amazonでの販売を開始しました!

MMM活用支援

マーケティング投資予測モデル支援例のPDF資料です。1クリックでダウンロードできます。※資料は適宜更新します。

参照文献
確率思考の戦略論 USJでも実証された数学マーケティングの力
USJを劇的に変えた、たった1つの考え方 成功を引き寄せるマーケティング入門
ブランディングの科学 誰も知らないマーケティングの法則11
ブランディングの科学 [新市場開拓篇] エビデンスに基づいたブランド成長の新法則
Excelでできるデータドリブン・マーケティング

参考文献
プロペンシティスコア(Propensity score; PS)(1)-PSの正しい使い方
「原因と結果」の経済学―――データから真実を見抜く思考法
岩波データサイエンス Vol.3
データ分析の力 因果関係に迫る思考法 (光文社新書) 新書
できる! 傾向スコア分析: SPSS・Stata・R を用いた必勝マニュアル