ドメイン知識

「データサイエンスを現実に適応するとき、ドメイン知識の不足から分析が『絵に描いた餅』になりやすい」というデータサイエンティストの嘆きを聞くことがある。切れる包丁を持っても魚の知識がないと三枚におろすこともできない。
<ドメイン知識って何?>
ドメイン知識なしで分析し、提案を出すなどは普通、考えられないが、ネットや機械計測で自動的に大量データが収集されてしまい、そもそもの手法が、与えられたデータの中からある関係性、構造、仮説をみつけようとするものなので、データサイエンティストはドメイン知識との接点なしでも分析できてしまう。というよりドメイン知識を無視したほうが「美しい分析」ができる。
だが、美しい分析は学問の世界でこそ輝くものであり、現実のマーケティングでは「それ、なに?」になりやすい。
データサイエンティストの言うドメイン知識は業界知識と言いかえてよいと考えるが、違うのか。
ドメイン知識の反対側はデータサイエンスの知識であり、一般的には専門知識(技術知識)と言われるものであろう。
<マーケティングリサーチのドメイン知識>
我々マーケティングリサーチは、データ収集の設計からスタートするので最初からドメイン知識に埋もれている。
データを収集する範囲、つまり分析の範囲を決め、分析対象のサンプルを決め、データの収集の仕方(質問文)まで決めて、費用と手間をかけて、こちらからデータを取りに行く。従って、データ数(サンプルサイズ)は大量ではないし、追加データもない。
ドメイン知識(業界知識)から作った自分の仮説を検証するアプローチが主なので、データ分析とドメイン知識に齟齬が発生することはほとんどない。かえって、ドメイン知識と分析が強く結びつきすぎる弊害がある。
さらに、マーケティングは「売れる仕組みを作りたい」との欲求を直接的に表明しているので、分析目的がブレることも少ない。
<ドメイン知識と専門知識>
我々マーケティングリサーチの専門知識はなにかと問われれば、定量調査は統計学、定性調査は心理学と答えてほぼ間違いない。
心理学と統計学を比べれば統計学が圧倒的に科学的に体系化されている。
収集したデータの平均、最頻、中央、最大・最小などの値は一意に計算され、クライアントの感覚や思いと違っていても揺らぐことはない。
統計学はさらに高度な解析方法が開発され、コンピューターパワーの発展とともに深層学習や生成AIと呼ばれる分野にもデータサイエンスは広がっている。
ドメイン知識(プロンプトor調査票)さえ正しく与えれば、一定の信頼性をもった結果がアウトプットされるシステムができあがっている。
一方、定性調査の専門知識は心理学に基づくとはいえ、定量調査と統計学の関係ほど確たるものではない。
日常生活で使われている会話・言葉を収集・分析するインタビューから科学性、一般性を導き出すのは難しい。
自然言語分析は難しい、困難と言われてきたが2年前のChatGPTの登場以来、生成AIの発展が注目されている。


この記事が気に入ったらサポートをしてみませんか?