データサイエンティストを3つにわけて解説してみる
ヒューマノーム研究所・代表の瀬々です。
今回は、日々需要が高まり続けている「データサイエンティスト」に求められる役割とは何か?について、AIビジネスに携わる者の目線で解説していきます。
世界的にニーズが高いものの、人材が極端に不足しているデータサイエンティスト。国内では、2025年には8.8万人、2030年には12.4万人が不足すると推定されています(※1)。
ビジネスにおいて一層のデータ活用が求められる現在、AI人材は引く手あまたで、新たなAI人材の採用は非常に困難な状況です。データサイエンティストが「不足している」と回答した企業の割合は、なんと55%を超えています(※2)。
この状況を解消するため、社員に人材育成講座を受講させることで、社内にAI人材を増やす取り組みが増えました。同時に、AI講座を受けさせたはずなのに、学習したはずの専門知識が業務に活かされていない、と言うぼやきも聞こえてきます。
これは、組織が期待する教育プログラム内容と、実際受講したプログラムの内容にミスマッチが生じていることに起因します。
ミスマッチ要因のひとつに、経営者・管理者層に存在する「データサイエンティスト万能説」という思い込みがあげられるでしょう。「データサイエンティスト」と言われる職種は大きく3種に細分化され、それぞれ別の役割を持ちます。データを分析することで新しい価値を見出し、これを社会に展開するためには、どの役割も欠かすことができません。三者三様のスキルが要求されるため、これらを全てを担当できるスーパーマンは、世界を探しても極少数しかいません。
「3種」のデータサイエンティスト
以下では、データサイエンスをするために必要不可欠な、3種のデータサイエンティストを紹介します。
1. ビジネストランスレータ
ビジネス(現場)とデータ分析 / 解析チームをつなぐ人。両者が理解し合えるように、双方の意見を翻訳・調整し、DXプロジェクトを成功へ導きます。
データトランスレータ, Analytics translator とも呼ばれます。
データやAIを利用することで解決したい「ビジネスにおける課題」を定義します。
DXプロジェクトが円滑に進み、その解析結果が有効活用されるよう、関係各所の意見調整や、プロジェクト運営のサポートを担当します。
機械学習手法の詳細や実装などの専門知識に必ずしも精通する必要はありません。
その代わり、どのようなデータを実際に活用することができ、またそのデータにはどのような解析が有効かというドメイン(対象分野)知識が必要です。
2. データアナリスト
データ分析の専門家。データに合わせた解析方法や、可視化方法を選び、その分析結果を解釈する人。
データを様々な角度から分析し、解析内容を決めたり、AIによる予測結果を評価します。
DXプロジェクトのゴールに向けて、適切な技術を選定します。
AI・機械学習手法の良し悪しを把握し、データの可視化技術などに精通する必要があります。ドメインの知識から、統計的な解釈やAIの評価まで、幅広い知見を求められます。
3. AIエンジニア
機械学習モデルを実装し、解析を行う人。
分析モデルやAIを使ったプログラムを開発し、これらを実データに適用します。また、AIの予測精度の改善も担当するなど、AIを育てる役割を担当します。
プログラミング・AI・数学の専門知識だけではなく、統計学に対する理解も必要です。
ビジネストランスレータはもっともビジネスサイドの、AIエンジニアは技術開発サイドの役割を担当します。それぞれの業務は一部オーバーラップしつつ、3つの役割の担当者が連携してプロジェクトを進めます。
例えば、データ解析プロジェクトが走る場合は、以下の流れで検討が進みます。
ビジネストランスレータが主導して話し合います。解決すべき課題と、プロジェクトが成功した場合の成果を定義します。
データアナリストが課題を解くために必要となるデータを収集します。社内外から課題解決に向けたデータを集め、目標達成に適した機械学習技術の選定をAIエンジニアと相談して進めます。
AIエンジニアが、選定した技術を利用してAIを実装し、解析を行います。
解析結果が得られたあとは、先ほどと逆に流れます。AIエンジニアが複数の視点で解析した結果をデータアナリストがまとめ、比較し評価します。その評価結果をもとに、ビジネストランスレータは予定した成果が達成できるか、もしできないとすれば、何を改善すべきかを考えます。
それぞれの役割において必要とされる知識を以下にまとめます。
実際には、これらのメンバーを支える、日々改善されるAI手法を生み出すAI研究者や、これらのメンバーが利用するシステムを構築するシステムエンジニアなども必要です。AIエンジニアが兼務することもありますが、プロジェクトごとに異なる場合が多いです。
なぜ「データエンジニア」ではなく「データサイエンティスト」と呼ばれるのか
データサイエンティストが、エンジニア(技術者)ではなくサイエンティスト(科学者)と言われる理由は、データをビジネス化につなげるには、可視化や解析AIのプログラム作成だけではなく、データが示す意図を汲み取り、活用する方策を考えるところまでが必要とされるためです。
一般的なAI入門講座は「Python等の言語の習得 → 機械学習・AIに関する基礎知識習得 → それらの実装」と進みます。しかし、会社によってはAI実装を外注し、社員には、データをビジネスや業務改善に繋げる検討を担当してほしい、と考えているケースもあるでしょう。この場合、開発寄りの授業を受けた社員のスキルと、ビジネス寄りの役割を期待する会社との間に、認識の齟齬が生まれています。
別の例として、AIエンジニアだけがいる現場について考えます。
Kaggle・SIGNATEなど、企業や政府がコンペ(競争)形式で課題を提示し、賞金と引き換えに最も精度が高い分析モデルを買い取るというサイトがあります。これらのサイトで得た優秀者の称号は、AIエンジニアのスキルを評価する指標のひとつとして利用されます。
一般にこれらのコンペサイトでは、最初に明確な課題や最大化すべき指標が提示されており、参加者は精度の高いモデル作成に注力できます。
実際のビジネスでは課題が曖昧であったり、期待ほど高い精度が得られず、課題の方針を変えることもよくあります。このような場合、「データの解析結果をもとに、問題の定義そのものを見直す」というサイエンスにあたる過程、つまりビジネストランスレータやデータアナリストの担当業務への対応が求められるため、AIエンジニアのスキルセットだけでは対応が難しくなります。
繰り返しになりますが、何でもできるスーパーなデータサイエンティストはほぼいません。要求業務に合わせた、適切な人材配置が重要です。
このように、データサイエンティストの社内育成を考える際は、スーパーマンありきの育成計画は避けた方が無難です。今、自社が必要としているスキルを把握し、不足する人材に合わせた育成講座の選択からのスタートをおすすめします。
プログラミングができなくてもデータサイエンティストになれるのか?
結論から言うと「なれます」。
ここまでお話してきたとおり、データサイエンティストが担う役割は大きく3つに別れます。しかし、多くの人たちはその役割としてAIエンジニアの役割を想像します。
しかし、特にビジネストランスレータに必要とされるスキルはプログラミング未経験でも、文系出身者でも習得できるものであり、その門戸は広く開かれています。
DXをはじめとしたデータ利活用のプロジェクトが多くなるほど、いかにして単なる解析からバリューを生み出せるのか、解析の先にある未来を見据える能力が必要となります。ビジネストランスレータの役割は今後ますます重要になるでしょう。
この1-2年で、データ解析ツールはプログラミング無しで使えるノーコード化が進みました。(以下の記事にまとめましたので合わせてご覧ください)
当社は、よいAIの開発にはデータの可視化とAI構築は密接に結びつくことが不可欠と考え、これらを一気通貫で利用できるノーコードツール Humanome CatData を開発しています。
無料でスタートできますので、是非ご利用ください。
関連リンク
今回ご紹介した Humanome CatData の使い方を、実際のデータを解析することを通じて解説しています。
AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい。