〈問い〉なぜ、その問題を解くことが必要なのだろうか。

武田邦敬｜Kunihiro TAKEDA

2023年11月16日 18:30

📓ビジネスデータサイエンスの問題設定力を高める問い…その1

データサイエンティストやアナリストの役割は、ビジネスの問題をデータを使って解決することです。社内・社外を問わず、クライアントから何かしらの相談が持ち掛けられたときに仕事がはじまります。

たとえば、以下のような相談です。

データから見積の誤りを見つけられないか。
人の配置を最適化したい。
エンゲージメントの予測を行いたい。
営業をしてくれるAIを作ってほしい。
施策の効果を検証したい。

ここで、「データと条件次第ですね。いつまでにやったらいいですか？」と前のめりになりたい相談事もあれば、「そんな夢見みたいなこと言わないでください」といいたくなるような相談事もあるかもしれません。

定常的にレポーティングしているような分析タスクであれば、特段疑問に感じることもないかもしれません。しかし、そうでない新しい仕事の場合は、クライアントの話に耳を傾けて、本当に解くべき問題は何なのか探ってみることが大切になります。

これについて掘り下げて考えてみましょう。

「相談事」の背景を探る

クライアントからの相談事は多種多様ですが、同じような相談であってもその背景もまた様々です。

例えば、「データから見積の誤りを見つけられないか」という相談事に関して考えてみましょう。

ある程度経験があるでしたら、このリクエストに対して以下のような疑問が頭に浮かぶのではないでしょうか？

「異常検知か…。大変そうだよな」
「どんなデータかな。見積というくらいだから何かの概算かな」
「誤りデータはどのくらいあるだろう？」
「正解が多いと分類でいけるんだけど、やっぱり教師なし型だよな」

やったことがある方は分かると思いますが、異常検知は何かと大変なので聞きたいことも多くなりますし、リスクヘッジしたくなるものです。

しかし、その一方で、そもそもなぜ見積の誤りを見つけたいのか？ ということを改めて考えてみることもできます。

私は過去に「見積の誤りを見つけたい」という相談を何度か受けたことがあるのですが、その背景は常に違うものでした。

あるケースでは、誤りがあると非常に大きな損害があるから少しでもミスを減らしたいということでした。
一方、別のケースでは、誤りを見つけるためにコストがかかっているので軽くしたいというご相談でした。

これら二つのケースは似て非なるものであり、タスクの位置づけが全くかわってしまいます。

大きな損害を避けるための異常検知であるなら、これまで人が見逃していたようなケースも拾うべく、再現率（Recall）を上げる、もしくは偽陰性率（False Negative）を下げるようなアプローチが求められるでしょう。また、この場合にオペレーションとしてAIによる人作業の置き換えは望むべきではありません。なぜなら、確率的に動作をするAIに完全性を求めるのは難しい話だからです。

一方、コスト削減のための異常検知であるなら、人の作業プロセスを細かく分解し、自動化できる箇所を詳しく見ていくべきでしょう。
また、このケースではしばしば完全自動化を求められますが、そもそも今現在、何人で何時間かかっている作業であるか冷静に確認しておく必要もあります。極端な話、もし一人の人員が月50%の工数をかけてチェックしているものであるなら、AIのシステム構築コストよりも安上がりかもしれません。

更に他のケースでは、話をしていくと見積作業の大部分を占める情報検索を効率化したいという課題にたどり着いたこともありました。このケースでは解くべき問題が変わっているのがわかりますね。

このように、解くべき問題は表面的な相談事とは異なっていることが多いのです。そして、解くべきでない問題に取り組んだ場合、概ね徒労に終わります。それはいくら精度のよいモデルを作れたとしても変わりません。

したがって、問題設定で最も重要な点は「解くべき問題を見極める」ということになります。そして、それに近づくために根本的に重要な問いは

「なぜ、その問題を解くことが必要なのだろうか」
「今の話題はなぜ提示されたのだろうか」

というものなのです。シンプルにいうと「なぜ？」と問いかけるのですね。

このシンプルすぎる問いはとても強力なものです。
しかし、強力で根本的であるがゆえに、まず自分に向けられるものであるべきものだとお考え下さい。まずは自分が気づくということですね。この点については、最後のセッションで解説します。

最適化という言葉の裏にあるもの

次に取り上げるのは、「人の配置を最適化したい」という相談事です。

最適化。とてもいい響きですよね。
もしITによって人の配置が最適になったら、みんなハッピーになることでしょう。

ところで、「最適化」というのはどういう意味でしょうか？
全体が最適になっていることでしょうか。
であれば、「最適」とはなんでしょうか？

情報工学やデータサイエンスに詳しい方であれば、最適化というと数理最適化を思い浮かべるかもしれません。そして、「最適化をしたいなら、目的関数と制約条件を教えてください」とクライアントに尋ねるかもしれません。

しかし、この時点でクライアントの多くは言葉に詰まってしまうのではないでしょうか。クライアントのいう最適化とは、必ずしも数学的な話ではないからです。

このように、専門用語と一般用語としての語感が変わる場合があることを、私たちデータサイエンティストは知っておかなくてはなりません。関連するワードとして、「予測」という言葉も最適化と同じく警戒すべき用語と考えておく方が得策です。

話を戻して、今回の「人の配置の最適化」というテーマを考えてみます。
このとき、まず考えるべきは、なぜ最適化をしたいのか？ということです。

素直に考えてみると、今現在「最適な配置」を実現できていないから改善したいのか、それとも配置作業自体にコストがかかっているから自動化したいのか、気になってきます。

どちらの道を歩むとしても、そもそも何をもって「最適」であるのかという問いと向き合わざるを得ません。ということで、つい「最適の定義を教えてください」と聞きたくなってしまうのですが、これはHowに踏み込んだ問いになっていて、議論の幅が狭くなってしまうリスクがあります。

この段階で優先すべきは、やはり業務上の課題の根っこを捕まえることであり、そこで考えるべきは「なぜ最適化したいのか」ということになります。

その昔、とある企業のクライアントから人の配置の最適化についてご相談を受けたことがありました。そして、私は技術チームの一員として文字通り制約条件と目的関数を確認するためのヒアリングを行ったのです。

しかし、話せば話すほど課題がぼやけてしまい、制約条件を聞いている場合ではなくなりました。どうやら配置の作業効率化を求めたいわけでもない。また、配置のマッチングを改善したいという話でもありませんでした。

そして、長い対話の末に、「配置するための人員を確保できない」という問題にたどり着きました。これは最適化以前の話です。このため、技術チームの出番は一旦ペンディングとなったのです。

このエピソードにおいて、もし配置作業を効率化するAIツールを作っていたらどうなっていたでしょうか？

おそらく誰にも使われないものになっていたでしょう。
もしくは、人不足を解消する取り組みだと聞いていたのにどういうことか？というクレームがステークホルダーから出たかもしれません。

このように、データサイエンスの技術的なタスクをダイレクトにリクエストされた場合は、一度話を深く聞いてみた方がよいでしょう。それは、関係性が浅いクライアントであるほどなおさらです。

突拍子もない相談事にも原石がある

さて、最後に取り上げるのは「営業をしてくれるAIを作ってほしい」というものです。これはChatGPTが登場する遥か前に、実際にクライアントからリクエストがあったものでした。

お話を伺うと、人型ロボットのようなものをイメージされていて、「ハイパフォーマーには敵わないだろうが新人よりもワークするだろう」とお考えのようでした。最近は囲碁でも人に勝てるというしね、と。

さすがに人型で顧客訪問ができるようなロボットはまだないのですが……とお伝えすると、「それなら新人営業の横にいてアレコレ指導するとか、商談の場でアドバイスをしてくれたらいいよ」とおっしゃるのです。

当時、私はまだ経験が浅かったので、どうやってそんなAIを作れと言うのだろうか……と悩んだものでした。ピュアだったのですね。

しかし、手練れの先輩データサイエンティストがじっくりとクライアントの話に耳を傾けて丁寧に深掘りしていくと、営業の持つ暗黙的なノウハウを形式知化したいという話がでてきました。ここまでくると人材育成の話や、社内の情報共有の話に繋がってきます。

ここで紹介したエピソードは非常に極端な例ではあります。
AIの実態がわかってきた今、このような相談事は減っているのかもしれません。しかし、バズ的なテクノロジーはいつも出てくるものです。ChatGPT、量子コンピュータ、メタバース、Web3などなど。

新しい技術の風が吹くと、必ずそれにインスパイアされた相談事が発生し、その多くは突拍子もない話に聞こえるかもしれません。データサイエンティストやエンジニアのあなたは、こうした話に戸惑うことでしょう。

しかし、こうした突拍子もない相談事であっても、クライアントの業務、事業、経営の課題にリーチすることができれば、解くべき問題にたどり着くことができるかもしれません。

そのためにも「なぜ」と問いつつ、クライアントに関心を持つことが重要です。

「なぜ」はまず自分に問うべき

このnoteでは、相談事の背景を探るための問いとして、

「なぜ、その問題を解くことが必要なのだろうか」
「今の話題はなぜ提示されたのだろうか」

という問いを取り上げました。これは、問題の本質に一歩でも近づくために基本的なものになります。

しかし、逆説的でありますが、この「なぜ」という問いを会話の初期段階でクライアントにぶつけてもなかなか上手くいきません。

クライアントに「なぜやりたいのですか？」と聞くときには、お互いがお互いのことを理解している状態でないとうまくいかないのです。理解と信頼とでもいいましょうか。もし回答が得られたとしても、表面的な議論になってしまうでしょう。

真の問題に到達するためには、焦らず、対話を通じて少しずつ進んでいく必要があります。その過程でお互いがお互いの状況を理解してこそ、解くべき課題にたどり着けるのです。

ビジネスデータサイエンスの問題設定力を高める30の問いは、そこに至るヒントを与えるものです。

残り29個、頑張っていきましょう！