日本におけるデータサイエンティストの曖昧さ

前にデータサイエンティストって一体何よ。どういう役割で企業は採用してるの?って気になって調べて、その時は納得したのですが、最近になって日本では「データを解き放つ人材」とか物凄く曖昧なことを書いているビジネスな人が増えている印象です。


これはヤバイなと。


この文章で何を書くかというと、「データサイエンティスト」と大雑把に括るのではなく、9-18時の範囲で現実的に従業員として、職務として安定的にこなせる範囲の分類を書きたいと思います。要はビジネスとして、現実的な職務範囲です。なんでもかんでも任せては疲れてパフォーマンスも落ちますし、データサイエンティストと言っても技術だけでなく、本人の性格的な面もあります。

*よく使う数学の定理が〜とか機械学習が〜とか書きません。でも採用前の「どんなデータサイエンティスト」を採用したいのか?自社ではどんなデータサイエンティストが必要なのか?の職務範囲を書き出す際に参考になると思います。


営業型データサイエンティスト


この人は、データを利用してお客さんのメリットを最大限に引き出す提案をする人達です。要はコンサルタントです。性格は真面目な人が良いと思います。清潔感とか?白い歯!素敵な笑顔!死後裁きにあう!w



ツールを書ける、使えるプログラマ


この人は、積み立て型の職務で、やるだけ進捗がある感じです。自社以外のツールも使いこなせる情報を摂取している人たちです。性格は真面目で、RSSでデータサイエンスの最新ニュースとか読んでる感じのホントに好きな人がやると良いと思います。



自社のサービスに仮説提案や効率的なアルゴリズムを具体的に組み入れるデータサイエンティスト


この人たちは、僕の作っているAIスケジュール管理アプリのようなスタートアップやアプリに必要な人たちです。仮説からアルゴリズムなどの数理モデルの構築、実装までとりあえずできる人です。ただし、ガチで本番のアプリに落とし込む際には別なプログラマやデザイナがいると思います。この人たちはUIの専門家ではないし、Appleなどの会社が提供しているOS提供のSDKを使いこなす人たちとは違います。*最近AppleはCoreMLとか出してますが、それらのツールを使うだけの人材とも少し違います。
データサイエンスを使って具体的にユーザに価値を与えたい、驚かせたいなど、ユーザ中心の人がなると良いと思います。性格は真面目じゃなくても仮説が面白ければ良いと思います。



以上の3つの分類です。

これらを1人の人に全てを任せるのはキツいです。
できないわけではありません。ただし、それは従業員ではなく、時間や職務に縛られない「一定の権限がある人」「役員」などがやるべきことで、9-18時の職務範囲で分けるのなら、現実的に上記の3つだと思います。

ただし、それぞれの職務範囲は分かれていますが、能力的には3つとも全てを「ほどほど」には出来ないといけません。何故なら、根拠をデータなどから導き出す際に、必要な能力がそれぞれ共通しているからです。プログラムも書けないといけないし、ツールの使い方も知識があるから使えます。そしてそれを提案するコンサルタントも根拠を説明できないといけません。何より自分のやっていることにワクワクしないとダメです。続きません。

また、これらはあくまで現場の人達であって、それらを纏める人材は別で必要で、その人達が「本来の目的とデータサイエンティストの必要性と役割」を定義します。それがあるから雇うんです。無意味に「なんかできそうだから」とかって理由で始めると、雇う側も雇われる側もキツいと思います。


以上です。

データサイエンティストを「データを解き放つ」人材というワードを見てしまったので、書きました。もちろんここに書いた分類は参考程度で良いと思いますが、妥当な分け方だと思います。
ユーザに良い体験を届けましょう。