【後編】クレジットカードカード取引の分析プラットフォームSecond Measureの起業当初と拡大期について

YコンビネーターによるPodcast: "On Starting and Scaling Second Measure" の翻訳記事です。前編と後編にわけて掲載します。

追記:2020年12月24日、BloombergがSecond Measure買収を発表。オールド・メディアが、オルタナティブ・データを真に活用するスタートアップを新たに取り込むという非常に良いストーリーだと思います。おめでとうございます。前編は、こちらから読めます。

画像1

Michael Babineauは,Second Measureの共同創業者兼CEO。Kevin HaleはYCのパートナー。YCに勤務する前は、Wufooを共同創業しています。

(前編からの続き)製品開発の方向性をどのように決めているのか?

Craig Cannon [27:34] - 製品開発をする場合、なんらかの方法でデータを取り入れているのでしょうか?

Kevin Hale [27:44] - 製品を改善する為、バックログに仕様を積み上げるにはいくつかの異なる流れがあります。

1つは社内主導ですね。これは、我々がアプリケーションをどこに持っていきたいかという思想に基づきます。また、それに加えて、積極的に顧客と話し、ユーザー・リサーチを行い、顧客のユースケースを真に掘り下げて、どこにギャップがあるのかを見つけ出しています。そういった要素も取り入れています。

もう一つは、先ほど申し上げたように、特定のお客様のために、カスタム・リサーチを行っています。これはプロ・サービスのようなアプローチだと思ってください。これもまた私たちのバックログに役立ちます。これらのバックログは基本的に製品に追加すべき要望なのだと思います。

最後に、データの編集面ですが、これこそが私たちにとって目指すべき最高の形です。なんらかの壁にぶつかった際、私たちのアプリを使用して質問に答えることができるようにする。

もちろん、まだ完璧ではないですし、きっとできないでしょう。ただし、我々もできる限り、この点を掘り下げて取り組んできました。今後は、さらなる質問に答えるためには、その背後にあるデータの改善にも取り組んでいかないといけないでしょう。

これこそが、私たちが構築すべきものがなんであるかを示す素晴らしいシグナルです。

Michael Babineau [29:03] - 最近Insight Data ScienceのJay Klinka氏と話をしました。興味深いのは、あなたの会社の話を聞いていると、データ・サイエンティストにとって、これは夢のような仕事ではないでしょうか。

編集委員会と一緒に、興味深い問題や疑問に取り組んでいること。私にとってそれは魅力的な仕事に思えます。それが顧客のための解決策なのか、会社の宣伝のためなのかはさておき、問題は取り組む価値があるもののように思います。ちなみに、人材は、どうやって探しているのでしょうか?今も積極的に採用しているのでしょう

Kevin Hale [29:38] - はい。

どうやって良いデータサイエンスを見つけているのですか?このような漠然とした仕事に適していると思われる人材の特徴は何ですか?(Michael Babineau [29:39] - )

Kevin Hale [29:47] - ええ、とても良い質問ですね。データ・サイエンティストという言葉は、過剰に使われすぎているような気がします。私たちが特に求めているのは、「S」の頭文字をとった科学者で、非常に強力な量的背景を持ち、さらに解決しようとしている問題を第一原理から理解できる人だと思います。

データ・サイエンスに興味を持っている人は、多くのツールを学んでいても、基本的なことを読み飛ばしていることが多いのです。しかしながら、このような人は、本当にデータ・サイエンスに興味を持っていると言えるのでしょうか?

Michael Babineau [30:26] - 第一原理から考えることができるというのは、良いエンジニアや製品の管理者などを探している人にも共通したテーマだと思います。具体的にはどういった意味なのでしょうか?

Kevin Hale [30:37] - このように考えてみましょう。我々の会社の場合、3分の1は博士号を持っています。基本的にはフラットな組織なので、チームのほとんどが技術系と言えるでしょう。

Michael Babineau [30:49] - チームの規模は?

Kevin Hale [30:49] - 60人です。チームのほとんどが技術系で、エンジニアとデータ・サイエンティストが半々。データサイドでは、統計遺伝学、認知神経科学、文字列理論、地球科学、気候科学など、様々なバックグラウンドを持った人たちが集まっています。本当に様々です。

共通しているのは、全員が統計学に非常に優れているということです。統計学的な基礎があり、その上にすべてのものが成り立っていると私たちは考えています。

私たちの考えでは、数学的な基礎をしっかりと身につけていれば、ツールを学ぶことができます。ツールはあとからでも教えることができますよね?私たちは、Pythonを使えるようになるのを喜んでサポートします。また、Jupyter Notebooksに乗り換えるための学習のお手伝いをします。でも、私たちは、数学のやり方を教えるつもりはありません。

Michael Babineau [32:01] - それを第一原理にどのように変換するのでしょうか?私は誰かにタスクを与えますが、時には戻ってきて、こう言います。「このタスクの背後にある理由は何なのか?ということを掘り下げてみて。」タスクの代わりに、実は、私たちが調べる必要がある質問自体を改善できることがあると思います。

Kevin Hale [32:22] - これは、私たちが解決しようとしている問題の種類の性質と関係していますね。トランザクション・データに関連した問題に対処するためのベスト・プラクティスのプレイブックがないようなものですよね?消費者の消費行動に焦点を当てた分析プラットフォームを構築するためのプレイブックはありません。

私たちがやっていることの多くは、誰もしたことがないこと、単に初めてのことなのかもしれません。このような漠然としたオープン・エンドの大きな問題にアプローチできる人に頼っているところです。問題をどのように構造化し、分解していくかを考え、それを一つ一つ丁寧に進めています。

Craig Cannon [33:10] - あなたはそのための訓練をしていますか?つまり、解くべきテストとは何か、というのが私の質問です。なぜなら、それは本当に「ここに問題がある」というようなものだからです。でも、問題に圧倒されてしまう前に、「AかBのルートを取れ」と言われてしまうことがよくありますが、まず、なぜなのかを問う必要があります。面接でもトレーニングでも、どのようにして従業員からその理由を聞き出すのでしょうか?

Kevin Hale [33:36] - 私は、これはトレーニングというよりも、採用プロセスでのスクリーニングのような、採用するためのものだと考えています。私たちは、面接プロセスの設計には細心の注意を払っていますし、実際に面接プロセスの改善を行っています。

データサイエンティストの場合、私たちが行っていることの一つは、大きな乱雑なデータセットを提供して、自由に使えるようにしておくことです。そして、次のように言います。調査をして、それを私たちに提示してください。何を探していたのか、何を見つけたのかを教えてください。

調査がうまくいかずに終わってしまう場合に、よくある間違いは何ですか?本当に優秀な応募者はどのようにやっているのでしょうか?(Michael Babineau [34:19] - )

Kevin Hale [34:31] - 人が犯してしまう第一の間違いは、データを鵜呑みにしすぎることです。データが完璧だと思い込んでいるのです。我々が提供するものを「ああ、これは簡単だ」と思い込んでしまうのです。"何でもいいから" パンダにロードしたり、データベースにロードして、クエリを実行して答えを得て、それをスライドに放り込んで終わり。それでは実際にはうまくいかないんですよね。

データの世界では、必ずどこかにドラゴンがいます。ですから、このエクササイズの大きな部分は、ドラゴンを探し、問題を予測して、どれだけ勤勉に取り組んだかということが占めています。必ずしもすべての問題を解決する必要はありません。しかしながら、実際には発見を歪めてしまう可能性があるので、それらの問題に対しても注意を払う必要があります。

あなたがそれらを特定して、たとえ無効な発見であったとしても、「おい、これを見つけたんだけど、合理的な時間で完成させるために、わざと単純化した仮定をしたんだ」ということを言い特定できればそれでいいのです。

Michael Babineau [35:49] - 優秀な人たちが得意とするのは、自分の仮定から始めるのではなく、実際に自分が作業している仮定が何であったかを調べて把握しようとすることですよね。

Kevin Hale [35:59] - そうですね。それがデータの中にあるのか、質問の中にあるのかなど、それがわかれば、結果として私の最終的な結論がどれくらい強いのか、あるいはどれくらい弱いのかを理解するのに役立ちます。

それがわかれば、家を建てるのと同じようなものですよね。もしあなたが家を建てるために建設業者を雇ったとしたら、彼らは現場に出てきて、壁を建て始めただけで、鍵を渡して、あなたが玄関のドアを叩いて、全体が倒れたとしたら、それは不安定な基礎の上にあったからです。

私たちは、基礎を理解している人を見つけるのが好きです。その為、家を建てるときに基礎がしっかりしているかどうかを確認しようと仕事をしている人を見つけるのが好きなのです。

クレジットカードのデータを扱うプロジェクトを経験したことはありませんが、Mintのようなツールを使うと、一貫して間違った分類がされているデータが存在するという話を聞きました。なぜデータが正規化されていないのか説明してもらえますか?また、なぜそれらのデータをすべてきれいにしなければならないのですか?(Craig Cannon [36:38] - )

Kevin Hale [37:02] - 一番簡単なことは、あなたの最後のクレジットカードの利用明細書を考えることだと思います。あなたのクレジットカードの明細書を見た時のことを考えてみてください。

そこに記載されているトランザクションを見てみると、「Sバックス」のようなことが書かれているかもしれません。また、「MWサンカルロス」、「メンズウェアハウスサンカルロス」のように書かれており、「(正)Men's Warehouse」とは書かれていないし、「(正)スターバックス」とも書かれていません。

目を細めて少し頭を掻いてみれば、人間には何か分かるようなことが書いてあるでしょう。つまり、問題は、いろいろな会社が、また、それぞれの会社が何かの設定を独自に入れているということです。

実際、ここでの根本的な問題は、ある人間がクレジットカードの明細書でその店をどのように表現するかを決定したということです。彼らは限られたスペースの制約の中で働いています。限られたスペースの中で作業をしています。 限られた文字数の中で、何かを入力しなければなりません。また、それを人間に伝えます。しかし、それは機械が読めるようには設計されていません。その結果、このような結果となってしまうのです。つまり、1つの加盟店に対して数多くの異なるバリエーションを持つことになります。私たちの仕事の一部は、すべてのバリエーションを特定し、それを単一のマーチャントにマッピングすることです。

Craig Cannon [38:39] - サンノゼやサンカルロスのMen's Warehouseに関連した複数の文字列があるということですね。

Kevin Hale [38:46] - そのとおりです。私たちは、データセットの中に500億以上のトランザクションを見ています。そのなかには、10億のユニークなトランザクションの説明があります。ちなみに、米国には10億の加盟店はありません。

Craig Cannon [39:05] - なるほど。

Kevin Hale [39:07] - 例えば、Macy'sだけでも300万通りの表現があります。問題には基本的に2つのレイヤーがあります。一つは人間ですね。どこかにいるある人が、あるMacy'sの店舗の決済端末やPOSシステムを設定しています。

ちょっとマクドナルドの話をしましょう。マクドナルドはフランチャイズを持っていますよね。誰かがフランチャイズを設立するとき、彼らは販売店のプロバイダーと協力して、販売店の設定を行います。"これは何にしようか?" マクドナルドみたいに F139みたいにしよう! "よし、いいね" 。これで一箇所になった。

問題は、取引の処理方法によっては、マクドナルドの’(アポストロフィ)が_(スペース)になったり、*(星)になったり、削除されたりすることがあります。

基本的に2つの問題のように、1つは人間の問題で、異なる人間が異なるものを記述することでおきます。彼らは自分の会社の名前をタイプミスしてしまうことさえもあります。そして2つ目の問題は、処理連鎖の中で起こる様々な摂動です。

Michael Babineau氏 [40:37] - 修正の一部はMintのユーザーによって行われなければなりませんでした。そして、人間はそのデータを熱心に修正したいとは思わないのです。もしそれが判明した場合、人間は本当にイライラして、これで50回目の修正をしなければならなかった。マクドナルドからのものだということを修正しなければならなかった。だからもう修正したくない、というようなことになってしまうと思います。

問題は、実際にはすべてがあまりにも違うので、人間は分類をあきらめてしまうということです。

Craig Cannon [41:08] - 私には、自分のデータを分類するという限定的なインセンティブがあります。私自身は本当に気にしていません。一部の人は気にしていると思いますが、私は気にしていません。

Kevin Hale [41:15] - ただ、この問題はさらに悪化しますよね?

Michael Babineau [41:17] - たしかに、そうした誤りを知りたくない時もありますね。

Craig Cannon [41:21] - そう、アマゾンがすべて一つのカテゴリーに分類されていたら、それは良くないですよね。

Kevin Hale [41:25] - もしあなたがソフトウェアの考え方を持っているとしたら、どうでしょう?ミールキット宅配業界最大手Blue Apronにはユニークな識別子が必要だと考えるでしょう。でも実際にBlue Apronの取引を見てみると...実はBlue Apronは1つだけではないんです。ブルックリンにBlue Apronの食料品店があるのを知っていますか?

Michael Babineau [41:47] - あ、近いですね。

Kevin Hale [41:49] - ええ、そんな感じです。あるいはユナイテッド航空。ユナイテッド航空はもちろんですが、ユナイテッドの食料品店もあります。そして、それらは場合によってはクレジットカードの利用明細書に全く同じように表示されています。

データのクリーンアップにどれくらいの時間を費やしていますか?永久にノンストップで対応し続ける必要があるのでしょうか?(Michael Babineau [42:03] - )

Kevin Hale [42:08] - 根本的に人間的なものとは考えていません。人間的な要素はありますが、実際には機械ベースのアプローチを使って巨大なレバーとして操作しようとしています。つまり、こういう風に考えています。

基本的には2つの製品を作る必要がありました。1つは、トランザクションの生データをインジェストして、何か有用なものをアウトプットするパイプラインです。このプロセスで私たちが行うことは、先ほど加盟店の話として話したエンティティ問題の解決のようなものです。

また、Uberのトランザクションで「サンフランシスコ」と表示されていても、常に「サンフランシスコ」と表示されているかどうかを把握するなど、他の調査も行います。しかし、明らかにすべてのUberの乗り物がサンフランシスコにあるわけではありません。

Michael Babineau [42:54] - 「これはどこか他の場所から来ているのかもしれない」ということを確認するために、他のトランザクションを見てみるのでしょうか。

Kevin Hale [42:59] - その通りです。他の購入者がどこで購入したのかに基づいて、購入者の位置を把握し、そのギャップを埋めることができます。

そうすると、Uberはこの場所は無視して、代わりにこの計算された場所を使うことができるとわかりました。他にも解決しなければならないことがありました。例えば、それ以外にもデバイスの問題もありますよね?我々は基本的に、こうした縦断的な研究を続けています。

このパネルは、消費者のパネルですが、米国の代表的なサンプルでは全くありません。その為、代表的ではないあらゆる方法を見つけ出し、より大きな人口を代表する結果が得られるように修正を加えます。とにかく、私たちが構築しているのは、このパイプラインです。それに加えて、分析プラットフォームもありますよね?

これは、超特化型のTableauだと思ってください。パイプラインから出力されたクリーンなデータセットを使って、さまざまな分析を行うための機能が組み込まれています。

最近顧客で増えてきているのは、競合分析を行う企業ですよね。なぜそうなったのでしょうか?つまり、企業が競合分析に興味を持つ理由はわかります。しかしながら、あなたのプラットフォームを使って質問に答えようとするときに、彼らは質問に対する見方が全く違うのではないかと思っています。(Michael Babineau [44:12] -)

Kevin Hale [44:35] - 私たちは投資家が企業のパフォーマンスを理解することに焦点を当てたプラットフォームを構築し始めました。これは本当に興味深い旅でした。

Yコンビネータ−は「集中する必要がある」ということを強調します。多くの人が好きなものよりも、少数の人が好きなものの方が良いということです。私たちは本当にそれを心に留めていました。

私たちは長い間、企業と仕事をしたくなかったのです。私たちの考え方を変えたことの一つがこれです。クレイトン・クリステンセンの本があるんですが、彼はHBSの教授で、『Innovator's Dilemma』という本を書いています。もっと最近になって、彼は『Competing Against Luck』という本を出版しましたが、その中で「ジョブ理論」について語っています。

大前提として、自分の製品の代替品を考えるときには、自分の製品に似ているものだけを考えるべきではないということです。そうではなく、根本的に顧客があなたの製品で解決している仕事とは何かを考えるべきなのです。

これにより、「集中」に対する考え方が変わりました。しかし、実際には投資家には様々なユースケースがあります。例えば、ファンダメンタルズのヘッジファンドにおいて、アナリストのグループがエクセルで作業をしています。例えば、Stitch Fixが長期的に成長できる企業かどうかを考えているとしましょう。彼らの場合は、クオンツ投資家とは全く異なるユースケースを持っています。

Kevin Hale [46:26] - 純粋にシステマティックな戦略を持っていて、日次、週次、あるいは四半期ごとに、企業が予想と比較してどこで勝ったり負けたりするかと考えて取引をしようとしている人のようなものです。これらは異なるユースケースです。

ただし、私たちのコアとなるユースケースの一つが、企業のパフォーマンスを理解してもらうことだと考えれば、投資家が企業のパフォーマンスを知りたいと思っているように、企業も同様のことを思っています。

企業は競合他社の業績を知りたがっています。私たちは多くのVCと仕事をしていたので、非常に効果的な方法でこの領域に参入することができました。投資先企業を紹介すると、CEOは手を挙げて、「どうすれば、それを手に入れられるんだ」と言うのです。

興味深い販売戦略ですね。YC出身のスタートアップは消費者向けのサービスが中心だと思われがちです。しかしながら、実際には、そうではありません。皆さんは販売プロセスについてどのように考えていますか?(Craig Cannon [47:23] -)

Kevin Hale [47:40] - そうですね。私たちは非常に幸運なことに、本当に多くのバイラリティに恵まれました。しかし、実際には、まだアウト・オブ・バウンド・セールスは行っていません。既に150社のクライアントがいますが、そのうちのひとつひとつがインバウンドを通じて私たちのところに来てくれました。

基本的に... 誰かがサインアップして、サインアップした人は友人に私たちのことを話してくれました。彼らの友人が手を差し伸べて、彼らが見たものを気に入って、サインアップして、また、友人に話してと。

Michael Babineau [48:18] - まさに、秘密の箱ですね。私にとっては、「これを持っていると、今まで見ることができなかったものを見ることができるんだ」というように感じます。非常に注目すべきもので、簡単に広めることができます。

Kevin Hale [48:31] - その通りです。誰もがUberがLyftより大きいことを知っていますが、どのくらい大きいのか?と思っています。我々のサービスを使えば、実際に数値で見ることができます。それはとても楽しいことだと思いますし、特定の人々にとっては、仕事の新しい方法を切り開くようなもので、テーブルステークスのようなものになっています。これは私たちにとっても素晴らしいことですが、今、シリーズAの資金調達を行ったところです。

Michael Babineau [49:03] - シティバンクからも?

Kevin Hale [49:04] - そうです。

Michael Babineau [49:05] - ゴールドマン・サックスは巨大ですね。資金調達をリードしているパートナーや投資家としては、とても興味深いですね。なぜ彼らは興奮していたのでしょうか?

Kevin Hale [49:13] - 理由はそれぞれ違うと思います。ですから、私たちはこの一般的なカテゴリーに分類されます。投資の世界では、オルタナティブデータ企業として一般的に知られているカテゴリーに入ります。

オルタナティブデータとは、基本的には、従来報告されていたファンダメンタルズや株価などではなく、企業がどのようにパフォーマンスを発揮しているかを理解するのに役立つ新たな情報を指します。クレジットカードのデータ、衛星画像、ウェブ・トラフィック・データ、モバイル機器のジオ・ロケーション・データなどです。

Michael Babineau [50:01] - 分かりました。

ゴールドマン・サックスはオルタナティブデータの分野に大きく進出しています。しかし、クレジットカードのデータを扱う会社には投資をしていませんでした。(Kevin Hale [50:02] -)

Michael Babineau [50:18] - 素晴らしい。

Kevin Hale [50:19] - 彼らは驚異的でした。ここベイエリアでは... 伝統的な大手VCとの提携に注目が集まっていますが、私たちは実際に、あまり期待されていないプレイヤーとの提携で大きな成功を収めています。

私たちのシード・ラウンドはジェフリーズという投資銀行が主導しました。ジェフリーズもゴールドマンも、ニューヨークや東海岸では、投資家だけでなく、投資銀行であるがゆえに企業とのつながりが非常に強いということが分かりました。彼らのおかげで、私たちが求める顧客のタイプをより多く獲得することができるようになりました。

シティの場合は、もちろん大量のトランザクションデータを持っていますが、これが社内での悩みの種になっています。先ほど説明したように、トランザクション・データが乱雑になっていることについては、彼らもすべて理解しているのです。

Michael Babineau [51:33] - 彼ら自身がすでにこの問題に対処していないというのは、私には奇妙に思えます。

Kevin Hale [51:39] - 本当に、本当に難しい問題です。それを十分に理解することはできません。

Michael Babineau [51:44] - なぜ彼らはそんなに悪いのか?なぜ他のみんなもそんなに悪いのか?

Kevin Hale [51:47] - 私は、他のみんながそんなに悪いとは言いません。それはただ...

Michael Babineau [51:52] - あなたがたが、そんなに上手いのか?

Craig Cannon [51:53] - あるいは、彼らの製品がどの程度の利益を上げているのかということですか?

Kevin Hale [51:55] - 皆、それぞれ特定の問題を解決することに集中しているからだと思います。だから、Mintが取引の特定や理解が下手だとは言いません。我々とは異なる問題を解決することに焦点を当てているだけです。

mint.comにおいて、 彼らは問題を解決しようとしています。この取引が何であるかの最善の推測が必要だが、すべての取引についてそれを行う必要があるという問題を解決しようとしているのです。

我々はその問題を全く別の角度から見ています。つまり、こういうことです。我々はほとんどの取引には関心がない。私たちは5,000社ほどの企業を追跡し、成長している企業だけを対象にしています。もし間違っていたら、誰かが何百万ドルもの損失を被ることになるからです。

Michael Babineau [52:39] - 制約のおかげで、すべてのことに集中しなくてよくなり、結果的に楽になりますね。

Kevin Hale [52:44] - その通りです。私たちはそれに焦点を当てているので、私たちが発見しているのは、この非常に特殊なユースケースのために構築したものに、驚くほど興味深いアプリケーションがあるということです。

突然、「ああ、これはこういう会社に役立つかもしれない」ということが分かってきました。他の企業に販売を行っている会社で、急成長している企業を見つけて、その会社に販売できるようにしたいと考えています。これは、私たちの旅の中で興味深い部分の一つだと思います。

会社として抱えている大きな問題の一つであり、厄介なことの一つは、Second Measureが、人々の秘密兵器であり、テーブルステークスになってしまうことだと思います。「ゲームの先を行きたいと思うのであれば、使わないといけない。」「これを使うにはブルームバーグに登録しないといけない。」というようになってしまうことです。(Michael Babineau氏 [53:30] -)

多くの投資家にとって、Second Measureは、容易にこのカテゴリーに入ってしまうと思います。厄介なことは、突然誰もがSecond Measureを使うようになった場合、どうやって製品を更に進化させるのか?面白さをいかに維持していくのか?ということです。

Kevin Hale [54:03] - そうですね。

Michael Babineau [54:04] - 他の船に飛び乗るか、他の解決策を見つけようとするのではなく、どうやって船に留まってもらうかということです。

Kevin Hale [54:08] - これは投資家にとって本当に良いポイントです。投資家は、情報のエッジで儲けようとしているからです。投資家は、他の人が知らないことを知ることでお金を稼いでいます。私たちは、この問題にどのように取り組めばいいのか、実際に多くのことを学びました。

「ああ、ここに非常に興味深いものがある」と、トレーディング・シグナルを送信しています。でも、顧客が増えれば増えるほど、それぞれの顧客に対する価値が著しく希薄になってしまう。

取引データは、取引データの所有者が一人ではないと考えることができるのではないでしょうか。実際に何人がアクセスできるかをコントロールする方法はありません。いつか誰もがアクセスできるようになると仮定して、より創造的な質問に答えるためのツールを作ることに集中されてはどうでしょうか。

誰もが同じデータにアクセスできるとしても、より良い質問に集中すれば、自分たちの強みを見つけることができるだろうと考えています。しかし、それは投資家にとっての話です。企業側は、他の誰がその製品を使っているのかという事実が重要なのです。

Michael Babineau [55:41] - それは嬉しいですね。どの大手企業も、競合分析に使わなければならないと言っているようなものです。

Craig Cannon [55:47] - 最悪のシナリオが、ブルームバーグだったら大丈夫ですね。

Kevin Hale [55:52] - ブルームバーグはうまくいっていますよ。

Craig Cannon [55:54] - 素晴らしい。Mike、来てくれてありがとう。

Michael Babineau [55:56] - もちろんです、ありがとうございます。


いいなと思ったら応援しよう!