
データサイエンス(DS)とビジネスインテリジェンス(BI)の違い
データサイエンスブームが2010年代に発生して以降、この言葉はたびたびAI、DXというバズワードとともに使われてきた。それに伴いデータサイエンティストを雇用しようという企業も増えた。
しかし、機械学習やAIができると思ってデータサイエンティストになったのに、やってることはデータの集計・可視化やダッシュボードの構築、データクリーニングなどかけ離れたことばかりやらされる、という声も聞く。また求人サイトを見ると、データサイエンティストというタイトルなのにそういった仕事が責任領域になっているのもしばしば目にする。
実を言うと、データ集計・可視化やダッシュボードの構築といった仕事は、ビジネスインテリジェンス(BI)と言う名前で、データサイエンスが流行する前から確立されている分野だ。
「機械学習や統計学といった高度のなテクニックを使わないので、データサイエンスに劣っている」と思われることもあるが、少しBIについて学ぶと、そもそもBIとDSは分野として異なった考え方を持っていることが見えてくる。この2つの考え方の違いを理解することが、「ビジネスデータ分析」にたいする解像度を高める助けになるはずだ。
ビジネスインテリジェンス(BI)とは
BI、と言うとTableauやPower BI、QuicksightといったいわゆるBIツールを思い浮かべる人も多いかもしれないが、この言葉が指す領域はもっと広く、「データを分析してより良い意思決定を行う仕組みやプロセス(意思決定支援システム)」を指す。ここで言うインテリジェンスというのは頭が良いと言うよりかは諜報(スパイ)の意味に近く、戦略的に重要な情報を得る、といった意味合いがある。
具体的に言えば、意思決定の助けになるデータをデータウェアハウスに蓄積し、ダッシュボードやレポートを使ってデータを意味のある形式に変換する。その情報をもとにビジネス意思決定を行う、という形態をとることが多い。具体的なイメージとしては、マーケティング担当者が広告運営をしているとして、広告のチャネル別コンバージョンレートをダッシュボードで見て、それをもとに今後の出稿戦略を練る、といった感じだ。
人間が意思決定を行うことを前提として、その意思決定をデータで支援・高度化することが主眼にある。
データサイエンス(DS)とは
データサイエンスというのは、データを用いてより優れた意思決定を行うという目的をBIと共有する。一方で、いくつかの点でBIとは異なった特徴を持つ。例えば、高度な機械学習モデルや統計モデルを用いたり、過去のデータを振り返るだけでなく未来のデータを予測したり、といったところだ。こういった特徴を持つ背景として、データサイエンスはこれから行う意思決定そのものを機械にやらせようとしているという点が重要である。先ほど例示した広告運用でいえば、データサイエンス的アプローチをとれば、「どのチャネルにどれくらいの投資をして、どれくらいの量の広告を出稿する」かを決定する機械学習モデルを作るということになるだろう。そこにはもはや人間の意志が介入する余地はなく、機械が意思決定を最適化する。この最適化というのがキーワードで、色々と無駄の多い人間の意思決定と比較して、データサイエンスの力でより優れた決定がなされますよ、という表現の仕方をされることが多い。
どっちが優れているのか?
ここまで読んだ読者なら「意思決定を人間にやらせるBIより、意思決定まで機械がやってくれるDSの方が優れている」というふうに思うかもしれない。しかしながら、必ずしもそうとは限らない。
1) そもそもの話だが、BIの仕組みービジネスに役に立つ数字をデータベースに蓄積し、必要に応じて集計して可視化する仕組みーがうまくできていない会社は、DSの導入もうまくいかないことが多い。なぜなら、DSの肝となる機械学習モデルの構築には高品質のデータが多量に必要だからだ。訓練データを用意することもままならないなら、DSの導入はまだ先になってくるだろう。この意味で言うと、BIはDSに先立つべきものと言える。
2) DSに対するニーズはBIに対するニーズと比較するとあまり普遍的ではなく、小さくなりがちである。ほとんどの会社は、売り上げや顧客数利益率など、ビジネスを支える基本的な数字の集計、可視化業務にBIを必要とするだろう。しかし、機械学習モデルを使って売り上げ予測をしたり、マーケティング活動の最適化を図りたいかというと、それは企業によって違ってくる。そもそも業態がアナログで機械学習を使った最適化が難しかったり、会社の考え方によってはマーケティング活動の計画は機械ではなく人間が決めたい、と思うかもしれない。
一般論として、BIはより普遍的に(薄く広く)価値を発揮するが、DSは局所的に(狭く深く)価値を発揮する。BIのコアになるデータの集計と可視化は、あらゆる会社の、会社内のあらゆる部門で価値を発揮する。営業だったら成約率の可視化、マーケティングであればキャンペーン成績の集計、工場であれば稼働率やリソース状況の可視化といったように、同じ手法があらゆる場所で汎用的に利用できる。しかし、あくまでデータを提示するにとどまり、意思決定そのものは代替しない点で経営への貢献は限定的とも言える。一方でDSは例えばマーケティングに使用するのであれば、「マーケティング予算の最適化」という特定のテーマのために時間をかけて機械学習モデルを構築する必要がある。うまくいけば完成したモデルは最適な予算配分を吐き出し、経営に大きく貢献してくれるだろう。
BIは多くの分野でデータの可視化という普遍的・汎用的な価値を提供するのに対し、DSは特定分野にフォーカスしたソリューションを提供し、BI以上に高いビジネス的価値を出すイメージだ。BIに比べると特定のテーマにリソースを集中させるため、失敗のリスクが大きい一方で成功した時のプレミアムも大きいという特徴がある。
個人のキャリアとしてはどっちを選ぶか?
ここまで、BIとDSの違いを組織内でのデータの使われ方という観点で述べてきた。では、個人のキャリア戦略としてどちらを選べばいいかと言う質問にはどう答えれば良いだろうか。これは、個人の価値観や今後の市場に依存するところがあるので、ここでは筆者の体験談を語ろうと思う。
筆者は学生時代DS寄りの分野(計量経済学)を専攻しており、因果推論や統計モデルを駆使してビジネスに貢献してやるぞ!という野望を抱いていた。しかし、実際に現場で働いてみると、高度な統計モデルを使った分析や機械学習モデルの構築よりも、まずは「欲しいデータを簡単に見たり、自分なりに集計したりしたい」という需要の方が大きいことを肌で感じた。また、今後機械学習モデルの構築はDataRobotのようなツールに代替されていくということも知った。
そんな中で、自分の関心は「いかに高度な手法を使ってデータ分析を行うか」から「いかにビジネスが欲しいデータが自動的に流れてくる仕組みを作るか」にシフトしていき、ダッシュボード構築やデータパイプライン構築といったBI的な仕事を続けていきたいと思うようになり、こちらの道を選んだのである。
おわりに
筆者はDSよりもBIに造詣の深い人間なので、少し贔屓目な記事になってしまったが、今後データ分析のキャリアを考えていたり、社内のデータ分析について意思決定をする立場にいる方がいれば、参考にしていただければ幸いである。