書評: データ活用のための数理モデリング入門
サイバーエージェント 秋葉原ラボの高野雅典さんよりご恵贈いただきました。
さまざまな数理モデリング手法(回帰、クラスタリング、協調フィルタリング、時系列解析、etc.)が、ビジネス課題にどのように応用されているのかを良く知る方々による共著です。個々の数理モデリング手法の解説については簡易的なレベルにとどめ、あえていくつかのビジネス課題を深く掘り下げ、数理モデリングとビジネス課題の俯瞰的なマッピングを試みた構成となっています。数理モデリングをビジネスの現場で試し始めたものの、いまいち効果が出せていない、あるいは周囲から理解が得られない、といった悩みをお持ちの方にお勧めの内容です。
数理モデリングをビジネス応用するときの落とし穴
scikit-learnや各種のクラウド上のデータ分析サービスの普及、Kaggleなどのデータ解析コンペティションの登場により、さまざまな高度な数理モデリング手法を気軽に試して学べる環境が整いつつあります。
ただ、そうして学んだ数理モデリング手法を、いざ目の前のビジネス課題に応用しようとするときには、いくつも落とし穴があります(私も何回もそれで痛い思いをしました)。本書には、こうした落とし穴がどこにあるのか、落とし穴を避けるにはどうしたらよいのかのエッセンスが、随所にちりばめられています。
「そのコストに見合うだけの成果がそのモデルにあるのか」というのは、特に本書の読者のようなモデリングをゼロからはじめるような環境においては厳しく問われるでしょう。そのような場面においては、まずは単純な計算で算出できる予測よりもモデルに基づく予測の方が著しく優れていることをしめさなければなりません。(p. 66、2.6 購買予測による注意点)
しかしながら実務で意思決定を行う際に最も重要な観点は、ほどよく当てはまり、ほどよく推定がうまくいき、ほどよく最適化できるモデルを、周囲の合意をとった上で使うことです。(p. 112、4.4.3 モデル選択)
数理モデリング手法になじみ始めた時期は、どうしても目の前のすべての問題を数理モデリング手法にあてはめてしまいたくなってしまいます。
「ハンマーを持つものにはすべてが釘に見える」(p. 244、おわりに)
しかし、実際のビジネス課題に取り組む際には、高度で精度の高いモデリング手法よりも、単純でおおざっぱなモデリング手法の方が有効なことも少なくありません。
意思決定に用いるモデルの選択は直感的な納得度が重要
知っておきたい数理モデリングの経験則
本書で解説されている各種のモデリング手法は、どれも基本的なものばかりで、ある程度数理モデリングになじんでいる方には物足りないと感じるかもしれません。数理モデリングを実装する具体的なノウハウについてはほとんど触れられていないので、そういうノウハウが得られると期待しているとがっかりするかと思います。
しかし、ビジネスの現場で不可欠なステークホルダー(マネージャーや担当者、エンジニア)の説得にあたっては、基本的なモデリング手法がさまざまなビジネス課題にどのように応用されてきたかをしっかりと押さえることは、大きな武器になります。自分が直面しているビジネス課題の章だけでなく、一見あまり関係ない章にも触れてみることで、新たな発見が得られるでしょう。
本書では、ピアソンの相関係数、Jaccard係数、収益逓減の法則、べき乗則など、ビックデータを扱う上で効果的であることが経験的に知られている法則がいくつも取り上げられています。副題の「『問題』に対する正しい『技術』を選ぶために」という問いに答える上で、こうした経験則が、具体的なビジネス課題にどのように活用できるのかを知っておくことは重要だと思います。