確率モデルで解き明かすリテンションレートとチャーンレートの本質
リテンションビジネスやサブスクリプションビジネスで必ず測定する指標がリテンションレート、そしてチャーンレートです。
しかし、一向に改善の気配が見えないこれらの指標は、混沌としており、複雑に感じます。
本記事では、一見すると複雑に見えるこれらの指標がある1つの「確率モデル」で説明できることを提唱しています。また、このモデルの構造の解説と応用的な活用法の提示を試みます。
リテンションレートやチャーンレートの秘密に迫りましょう。
改善しないリテンションレート
ライフタイムバリュー(LTV)の重要性はよく論じられます。私たちはLTVを改善するために努力を注ぎますが、その指標となるリテンションレートやチャーンレートは往々にして改善が見られません。
例えばある企業がリテンションレートを改善するためにさまざまな施策を実施します。休眠してしまったユーザーをセグメンテーションしてメールマーケティングを行う。ユーザーを活性化させるためにテックタッチ施策を実施する。などなど。しかし、これらの努力にもかかわらず、リテンションレート(およびチャーンレート)は改善されないことがほとんどではないでしょうか。
一体なぜでしょう。
実はリテンションレートは、企業努力によって向上が約束されるものではなく、ユーザーの行動パターンに起因するものなのです。
つまりユーザーの行動パターンに目を向けることでリテンションレートやチャーンレートの構造が理解できるようになります。
ユーザー行動はコイントス
リテンションレートとチャーンレートの背後にある構造は驚くほどシンプルです。
ユーザーは無意識のうちに、サービスを続けるかどうかを選択しています。
それはまるでコインを投げて、その結果によって意思決定するかのようなものです。*1 *2
コインの表が出ればユーザーはサービスを利用し続けます。一方、コインの裏が出た場合はユーザーはサービスを解約、あるいは利用を辞め休眠します。
そして、このコインの確率は50:50ではありません。
例えば、95%の確率で表(サービス継続利用)が、5%の確率で裏(離脱・解約)が出るコインです。ユーザーはこのコイントスを毎月、あるいは毎日繰り返し続けるのです。
B2B SaaSプロダクトの場合は毎月コイントスをするかもしれません。B2Cウェブサービスの場合は毎日コイントスをするかもしれません。
例えばB2B SaaSでは、このような毎月の頻度でコイントスを繰り返し続けても基本的には95%の確率で表(継続利用)が出るので、ある程度の期間はリテンションし続けてくれるでしょう。しかしどこかのタイミングで必ず裏(解約)が出てしまいます。その瞬間が訪れたとき、ユーザーは離脱・解約に至るのです。
これがユーザーがチャーン・離脱してしまう瞬間です。
次に、2種類のコインを投げるケースを考えてみましょう。
コインA:5%の確率で裏(解約)が出る
コインB:30%の確率で裏(解約)が出る
例えば、コインAを投げ続けるユーザーは5%の確率で裏が出て解約してしまうユーザーです。10回コイントスを続けても生き残っている可能性が高いでしょう。
他方、コインBを投げ続けているユーザーは30%の確率で裏(解約)が出てしまうユーザーです。このユーザーは10回もコイントスが続くでしょうか?
4回程度コイントスを続ければすぐに解約の目が出る可能性が高いことは容易に想像できます。
ではサービス全体として、コインA(5%の確率で解約)を投げるユーザーとコインB(30%の確率で解約)を投げるユーザー、どちらが多いのでしょうか?
コインAユーザーが大半を占めていればリテンションレートは高いでしょう。
しかしコインBユーザーが大半を占めていればリテンションレートは低くなってしまいます。
そう。このコイン保有ユーザーの分布*3によってリテンションレートの形状が決定づけられるのです。
すなわちリテンションレートの正体は「コイントスであり、様々な確率のコインを保有するユーザーの分布」であることが分かります。
リテンションレートを説明するsBGモデル
納得感のある答えです。
しかし正体がわかったとは言え、コイントスのパターンはランダムに見えます。一体どのように実務に落とし込めばよいのでしょうか?
この問いに答えるのが確率モデルです。
一見ランダムに見えるコイントスも、確率的な法則性に従っています。コインの裏表の確率があらかじめ決まっているコイントスを表す確率分布を「ベータ分布」と呼びます。
そしてこのベータ分布を顧客行動に当てはめるように適応させたモデルをShifted-Beta-Geometric model(シフトベータ幾何学モデル)、通称「sBGモデル」と呼びます。*4
sBGモデルで計算したリテンションレートは、高い精度で実測値と一致することが知られています。
言い換えると、あらゆるサービスのリテンションレート、チャーンレートはsBGモデルというたった一つの数式で説明が可能なのです。
リテンションレートやチャーンレートの正体は、確率的なコイントスのユーザー分布であり、sBGモデルと言えます。
それではsBGモデルの実践的な活用例をご紹介します。
活用例1:顧客の解約率予測(あるいはオンボーディングの重要性)
sBGモデルを用いることで、顧客の解約確率(離脱確率)を予測することが可能です。*5
とあるサブスクリプションサービスを利用して1ヶ月経過したユーザー群の解約率(離脱率)を求めてみましょう。
2ヶ月目に継続してくれるユーザーは何%いるのでしょうか。
SBGモデルの計算式にt=1を代入するだけです。残存率rを求めることができます。
残存率r1の結果は67%でした。したがって解約確率は33%になります。
次に10ヶ月目の解約率を求めてみましょう。
10ヶ月間も長く利用してくれたユーザー群は11ヶ月目にどの程度継続してくれるのでしょうか?
t=10を代入して計算します。
残存率r10の結果は92%でした。したがって解約確率は8%になります。
以上をまとめると以下のようになります。
このように時間が経過するほど解約率が下がっていくことが分かります。この事実は私達にオンボーディングの重要性を教えてくれます。初期のユーザー群は解約確率が高いのです。だからこそオンボーディングの最適化が必要不可欠なのです。
反対に、10ヶ月も利用しているユーザー群の解約率を改善する余地が少ないことも分かります。ここから分かることは、ロイヤルユーザー層をさらにロイヤル化させる施策は成功の余地が少ないということです。
活用例2:現状数値から将来のリテンションカーブを予測する
sBGモデルを利用すれば現状の数値から将来のリテンションカーブを求めることができます。
例えばローンチ間もない新規サービスを考えます。このサービスはまだ運営して6ヶ月しか経っていないためその先のデータがありません。その先のリテンションレートのカーブはどのような推移をたどるのでしょうか?
サービス存続の命運がかかっている一方で、1年経過しないと年間データが取れません。重要な意思決定のためにあと半年待たねばなりません。時間を溶かしてしまいます。
しかしこの問題もsBGモデルで解決できます。実測値を用いてsBGモデルにフィッティングさせることで理論値を出力することができるのです。
これにより将来リテンションレートがどこに着地するのか未来予測をすることが可能になります。
事例:Lingokidsのリテンションレート未来予測
Lingokidsは幼児向けの英語学習アプリです。
CEOのクリストバル氏は、年間定期購読モデルから月間定期購読モデルに切り替えた後、キャッシュフローの計画目的や、月間に切り替えてユニットエコノミクスが実際に改善されたかどうかを評価する目的で、顧客リテンションを予測する方法が必要でした。
そこでsBGモデルを使い未来を予測したのです。リテンション予測の結果は完璧でした。上述でプロットしたグラフのように、実測値と理論値が完璧に重なり合っていたのです。
そこからクリストバル氏と彼のチームは、製品から成長、財務に至るまで、様々な機能領域で予測を使用することができました。Lingokidsは今日までsBGモデルを活用し続けています。*6
活用例3:歯抜けのデータからリテンションカーブを予測する
他社のリテンションレートのデータは貴重な一方で、丸々精緻なデータを手に入れることは困難を極めるでしょう。
頑張って収集できても「1日後リテンションレートは約67%、6日後は約20%、12日後は約6%らしい…」という歯抜けのサンプリングデータしか得られないかもしれません。
ここでもsBGモデルのフィッティングが利用できます。このような歯抜けのデータサンプルから見事に理論値カーブをはじき出すことができるのです。
事例:他社コミュニティのベンチマーク調査
数年前、私はユーザーコミュニティの立ち上げを担っていました。しかし、業界水準が分からず、どの程度の数値を目標値にすべきか悩んでいました。
そこで様々なオンラインコミュニティやオンラインサロンを調査してベンチマーク数値を収集しました。
数多くのコミュニティに入会して新規参加者と退会者の数を泥臭くカウントし、実測値のリテンションレートを算出しましたが、サンプリングデータのバラツキが大きく正確ではありませんでした。
そこでsBGモデルを使用したのです。sBGでフィッティングさせ理論値カーブをはじき出しました。
その結果、「確からしい」ベンチマーク数値を収集することができ、業界カテゴリーごとの傾向分析に成功しました。
これによりコミュニティローンチ前に「当社のコミュニティはだいたいこの程度のリテンションカーブになりそうだ」という事前予測をすることができました。
以上、3点の活用事例のご紹介でした。
1. 解約確率を算出する
2.将来のリテンションカーブを予測する
3.歯抜けのデータからリテンションカーブを予測する
sBGモデルが解き明かす4パターンのリテンションレート
さて、ここからがsBGモデルの真骨頂です。
sBGモデルにはαとβのパラメータが存在します。
したがってαとβの値がリテンションレートのカーブを決定づけていると言えます。
そしてこのパラメータは、世界に4種類のリテンションカーブが存在することを私達に教えてくれます。
パターン1:バケツの水漏れ
1つ目のパターンは典型的なバケツの水漏れです。流入したユーザーの大半がものすごい速度で抜けていき最後には誰もいなくなる様子が伺えます。
事業として成立していない可能性が高いです。事業撤退か抜本的な対策が必要です。
パターン2:コアファンだけが溜まる
次のパターンも多くのユーザーが早期に抜けてしまっていることが分かります。しかし先ほどのパターンとは異なり、少ないながらも着実にユーザーが溜まっています。
ほとんどのユーザーには刺さらないが、刺さる人には刺さる。
コアファンだけが溜まる形状であることが読み取れます。
パターン3:理想的なカーブ
次のパターンは理想形です。多くのユーザーがサービスに定着している様子が伺えます。急速に抜けていく様子は見られません。徐々にユーザーが少なくなり最終的には安定した水準に落ち着いています。
ユーザーが着実に溜まる、理想的なカーブです。
パターン4:緩やかに抜けていく
最後のパターンは一見すると理想系に見えます。パターン1、2のように急速にユーザーが抜け落ちる様子は見られないからです。
しかしよく見ると時間経過しても傾斜が水平にならないことに気が付きます。右肩下がりでカーブが続いているのです。
これはユーザーが完全に定着することはなく、緩やかに抜け続ける傾向にあることを意味しています。
以上のように、リテンションレートには4種類のパターンが存在していることが明らかになりました。
一般的に、私達は「リテンションレートを上げる」「リテンションレートが下がる」などと口にすることが多いです。しかし実際には「上げ下げ」というよりも、パターン変化と言うほうが正確です。
リテンションは4パターンのいずれかに(グラデーションをもって)変化するものなのです。
まずは自社のリテンションがどのパターンに該当するか把握することが有効です。sBGモデルで計算してみましょう。
市場調査で相対的な自社のポジションを分析する
現状理解のためにも、自社のリテンションカーブを把握することは有効です。
しかし、他社や他業界のリテンションカーブまで把握できると尚良いでしょう。自社の立ち位置(ポジション)を相対的に把握できるからです。
市場調査として活用することで、sBGモデルは更に強力な武器になります。
具体例を見ていきましょう。
以下は、様々な業界カテゴリーのサービスをαβの二軸でプロットした散布図です。(※すべてGPT-4 Code Interpreterで生成したダミーデータです。しかし分析イメージは掴めると思います。)
このような散布図を分析すると業界カテゴリの差異に気が付きます。
業界カテゴリーごとにプロットのまとまりが存在します。
例えばLINEのような毎日数十回利用されるSNSカテゴリと、ユニクロのような月に数回使われるかどうかの小売カテゴリでは傾向が全く異なります。
まずは自社が所属するカテゴリー状況を把握することが有効です。市場調査においてカテゴリー把握からスタートさせることが重要なように、まずはカテゴリー分析を行いましょう。*7
その上で、
業界カテゴリーの中で自社がどのようなポジションにいるのか?
競合他社がどのようなポジションを取っているのか?
その相対的な立ち位置を比較分析することで、自社が取るべきポジション戦略のヒントが得られます。
ポジションを変えることでリテンションカーブを変えることができるからです。
ポジション戦略事例:Duolingo
ポジション変更を考える上で学びになるのがDuolingoの事例です。
Duolingoは英語を中心に40種類の言語を学べるサービスです。洗練されたゲーミフィケーションと、可愛いフクロウキャラ(Duo)の応援によって、ユーザーは楽しく語学学習を続けることができます。
Duolingoは熱狂的なファンを排出するサービスであることも特徴的です。
私の知人にも1200日以上も毎日欠かさずアプリを利用し続ける猛者ユーザーがいるほどです。(「Duolingoの悪魔」と呼ばれています…。)
そういった背景もあり、他の学習サービスよりも高いリテンションレートを誇ります。
このようにユーザーに長く愛される素晴らしいサービスはどのようなポジションを築いているのでしょうか?
Duolingoを分析してみましょう。
まずはDuolingoが所属する「学習サービスカテゴリ」を分析します。
すると前節で類型した4パターンのうちの「パターン4:緩やかに抜けていく」に該当することが分かります。
ここから、学習サービスカテゴリが「学び終えるとニーズがなくなり離脱する」「学習に挫折しやすく、つまずきやすい」という特性を持つことが分かります。
カテゴリ特性を分析できたので、個別ブランド分析に移ります。
Duolingoはどこにプロットされるのでしょうか?
驚くべきことに学習カテゴリ以外の位置にプロットされたのです。
Duolingoが所属しているカテゴリは「ゲームカテゴリ」でした。
Duolingoは「楽しい学び」を提供するゲームとしてユーザーに愛されていることが分かりました。もはや学習サービスではなく、ゲームアプリなのです。
Duolingoが高いリテンションレートを誇る秘訣は、このようなポジショニングにあると考えられます。
リテンションを改善するとは
Duolingoの事例からも分かる通り、高いリテンションレートを目指すにはsBG散布図におけるポジショニングが重要であることが分かります。カテゴリーの枠を越えた相当な大移動です。この大移動によりαとβが変わり、リテンションが改善されるのです。
すなわちリテンションの改善とは、サービスコンセプト開発でありサービス開発そのものであることが分かります。
非常に難易度が高いです。リテンションが小手先の施策で改善できる余地が少ないのはこのためです。
しかし、必ずしもプロダクト開発が必要なわけではありません。ユーザーコミュニケーションを改善することでサービスコンセプトを変え、ポジションを大きく変更できる余地があると考えられます。
例えばファブリーズの事例が典型的です。ファブリーズは「臭ったときに消せる」という便益から、「快適に過ごせる」という便益に変更しそれを打ち出しました。これによりファブリーズの使用確率は大幅に改善され、市場シェア拡大に成功したと考えられます。
またDuolingoも「ボーッとしながら外国語が学べる」という便益を打ち出したことでユーザー数を急成長させることに成功しました。実際この取り組みはDuolingo社内でも「グローバルで最高クラスに成果の出た施策だった」と言われています。*8 Duolingo特有のゲーム的便益を打ち出すことに成功したと考えられます。
リテンションを改善するには、sBGプロットにおけるポジション変更が重要です。それはサービス開発そのものであり、サービスコンセプトの再開発という大移動であり、難易度が高いです。しかしコミュニケーションの改善でポジションを変更させる余地は大いにあると考えられます。自社サービスの価値や魅力を効果的にユーザーに伝えリテンション、ひいてはLTVの改善を目指しましょう。
まとめ
本noteでは一見複雑に見えるリテンションレートやチャーンレートがシンプルな確率モデルで説明できることを示しました。リテンションの正体は確率的なコイントスであり、そのコインを保有するユーザーの分布でした。その構造を説明するモデルがsBGモデルです。sBGモデルを活用することで1.解約率予測2.将来のリテンションカーブ予測3.歯抜けデータからリテンションカーブを予測することが可能である旨を提案しました。またsBGモデルのパラメータαとβでプロットすることでリテンションカーブが4パターンに類型されることを明らかにしました。最後に、sBGモデルを市場調査で活用して自社の相対的な位置を把握し、ポジション戦略に活かす考え方を事例とともに提案しました。
このような確率的な考えを活用し、自社のLTV改善につなげて頂けたら幸いです。
発展:リテンションレートを支配するもの
リテンションレートの正体は確率的なコイントスであり、そのユーザーの分布です。つまり、5%の確率で表(解約)が出るコインAを保有するユーザーと、30%の確率で表(解約)が出るコインBを保有するユーザーどちらが多いか?その分布はどうなっているか?という問いがリテンションを決定づけます。
より専門的には、個人の解約確率をθとすると、解約質量関数f(θ)による全体の解約確率分布が以下のようにプロットされます。
例えば右下を見ると解約確率が高いユーザーが大半を占めていることが分かります。このため類型パターン1のバケツの水漏れ状態に陥ります。
反対に左上を見ると、ほとんどのユーザーが解約確率の低いユーザーで構成されています。このため類型パターン3の理想的なカーブが実現するのです。
この確率分布の形状がリテンションカーブを支配していると考えられます。
なお、本noteではsBGモデルの紹介に限定していますが、sBGモデルはビジネス担当者がExcelで簡単に計算できるように開発された限定的なモデルであるため、より高度で専門的な活用を目指したい方にはBG/NBDモデルの活用が推奨されています。なおBG/NBDモデルはPareto/NBDモデルの簡易版として提唱されたモデルと言われているようです。*9 つまり本稿の蓋然性はそれなりに高いと考えられます。
参考文献
*1 ユーザー1人1人のコイントスはまるでランダムであるかのような事象であり、ポアソン分布に従うことが知られている
Goodhardt, G. J., Ehrenberg, A. S. C. and Chatfield, C. (1984), “The Dirichlet: A comprehensive model of buying behaviour”
*2 一般消費者だけでなくB2Bにおける企業の意思決定でも確率的なランダム性が確認されており、ポアソン分布に従うことが知られている。
John W. Wilkinson, Giang Trinh, Richard Lee, Neil Brown. (2016). "Can the negative binomial distribution predict industrial purchases?"
*3 各種コインを保有するユーザーの分布はガンマ分布に従うことが知られている。これをサービス全体としての購買者行動モデルに捉え直すとパレート/NBDモデル(Pareto/NBD)に従う。
PeterS.Fadera, BruceG.S.Hardie. (2009). "Probability Models for Customer-Base Analysis"
*4 FaderとHardieは顧客残存率やCLV(LTV)計算に特化したモデル「sBGモデル」を開発した。このモデルはαとβをパラメータに含む簡単な計算式であるため、実務家がExcelで容易に計算できるようになった。
PeterS.Fadera, BruceG.S.Hardie. (2009). "Probability Models for Customer-Base Analysis"
*5 一般的に顧客残存率は 残存率 = 1 / 離脱率(解約率)で計算されるが、この計算は現実を正しく反映しない。sBGモデルを活用するのが適切。
PeterS.Fader, BruceG.S.Hardie. (2006). "How to Project Customer Retention"
*6 Lingokidsの事例
How to Superpower Your Retention Analysis
*7 市場調査では、まずカテゴリーを分析し次にブランドを分析するステップが重要。
Jenni Romaniuk. (2023). Better Brand Health: Measures and Metrics for a How Brands Grow World
*8 Duolingoの事例
世界で四半期の売上120億円「Duolingo」の日本展開の裏側。ユーザー理解を起点にテレビCMを成功させた方法、テスト受講率を2倍に改善したABテスト。
*9 FaderとHardieは、Pareto/NBDの変種であるBG/NBDモデルを開発した。このモデルは「顧客の死」を可視化する優れたモデルだった。(また、この翌年にFaderとHardieによりsBGモデルが提唱される。)
Fader, P. S., Hardie, B. G. S., & Lee, K. L. (2005). “Counting Your Customers” the Easy Way: An Alternative to the Pareto/NBD Model.