見出し画像

データサイエンティスト必見!【必要なスキルリスト】で実力を有形化せよ。

こんにちは。

今日は最近よく聞くようになった「データサイエンティスト」についてのお話です。

データサイエンティストとは、

データサイエンス力、データエンジニア力をベースにデータから価値を創出し、ビジネスかだに答えを出すプロフェッショナル

とデータサイエンティスト協会プレスリリースにて定義をしています。今日はそんなデータサイエンティストに求められる、もしくはデータサイエンティストを評価する指標についてご紹介していきます。

データサイエンティストの方だけでなく、データサイエンティストと仕事をする人も必見です。

データサイエンティストとは、ビックデータから情報収集・次の一手を埋める人材

データサイエンティストとは、果たして具体的には何をする仕事なのでしょうか。

「データ」はおそらく皆様が思い描いているデータですね。天気の「温度」や会社の「売上」、あげればキリがないほどですが共通項としては「数値化」されているのが大半かと思います。

画像8

データを扱う技術者への注目が高い米国では、データサイエンティストが将来性のある職業1位になっていたりします。

ちなみにアメリカのサンフランシスコ市では、「低所得」とみなされる年収は1,400万だそうです。ITなどのテクノロジーが中心地のサンフランシスコでは必然的に年収が上がっている、という構造になっています。

ソフトバンク会長の孫氏も、講演でアメリカとの「開いた差」については述べていましたね。それほどエンジニア、特にデータを支えるデータサイエンティストには昨今注目が集まっています。

AIなどの台頭により、"膨大なデータをいかに扱うか"が企業の名案を分ける中で、データサイエンティストが活躍の場を広めています。ただ、「データを扱える」というのは非常に抽象的で、何ができるとより優秀なのか、という指標がこれまでありませんでした。

そんな中、データサイエンティスト協会のスキル定義委員会は「データサイエンティスト スキルチェックリスト」第4版を公開しました。

必要なスキルセットの軸を作る団体 スキル定義委員会

このスキル定義委員会という団体ですが、なぜそもそもいるのか。

昨今「データサイエンティスト」という言葉や職種が台頭してきている中で、大企業でもこういったポジションが出てきているように感じます。

そうすると、データサイエンティストの中やデータサイエンティスト自体の「評価」をする必要があるわけです。

画像4

また、相手企業の「データサイエンティスト」が何某かの提案をしてきた際に、そのデータサイエンティストが果たして「本物なのかどうか」ということを見定めていく必要があります。

その中でも、彼らはデータサイエンティストに必要なスキルセットは3つだと言っています。

画像5


データサイエンティストに必要なスキルは大きく3つ

スキルチェックリストはこちらからダウンロードが可能ですが、このスキルチェックリストには、大きく3つの力に分類されます。

<データサイエンス力>
 
統計などの基礎数学を学び、データの理解・検証を実施。データ自体の加工などのクレンジングを行い、その先を予測・推定、グルーピング、さらには機械学習や自然言語処理などAIに関するスキルを身につけ、データに関しての最適化・可視化を可能とする。

<データエンジニアリング力 >
  
データベースやシステム構築における知識を学び、要件定義から実装に至る処理を可能とする。サーバーやネットワーク・ソフトウェア設計におけるプログラミング技術を習得し、さらにはセキリュティを学んで非脆弱性の環境を構築する。

<ビジネス力>
 
1個人としてのビジネスマインドはもちろん、AI開発における倫理や権利保護、プレゼンテーションや組織マネジメントなど実施のデータ分析にとどまらずにビジネス展開における必要なスキル。

この3つの大分類において、中分類が合計36項目、小分類のスキルが合計572項目設けられており、非常に細かくデータサイエンティストについてスキルが定義されています。

画像3

これら3つの力において、それぞれのスキルレベルを4段階に表現をしています。

 ① Senior Data Scientist(業界を代表するレベル) : ★★★★
 ② Full Data Scientist  (棟梁レベル)      : ★★★
 ③ Associate Data Scientist(独り立ちレベル)  :★★
 ④ Assistant Data Scientist (見習いレベル)    :★

「棟梁」と「業界を代表するレベル」というのが面白いですね。星3つ以上からかなり有形化しているレベルと言えそうです。


個人的にはデータサイエンス力の「可視化」はビジネスにおいては非常に求められているものかと思います。

可視化をすることで、ビジネスにおける状況を端的に把握をすることができます。たとえば性別の男女年齢別人口比などは画像にすると国の状況が一目瞭然です。

画像1

さらには、もっと詳細にデータ同士の関係性を見たい、なんて場合には繋がりを可視化するものもあります。私も大学の時に触っていたcytoscapeというソフトですが、「ノード」と「リンク」という線と点で表すことができます。

画像2

スーパーやネットショッピングなどの購買行動で「ビール」と「パンツ」は一緒に買われやすい、なんていう繋がりもこういった可視化から見えたりする戦略だったりします。

必要な工程が一目瞭然のタスクリスト公開

そんなデータサイエンティストにおいて、各工程にて求められるタスクリストをデータサイエンティスト協会でも公開をしています。

画像6

この工程では、たとえばphase3の「データ分析」では、どんな項目が必要なのかをさらに細分化しています。

画像7

これにより、これから自分たちが行いたいことのタスク洗い出しをたたき台として作ってあるため次の一手が生みやすいことになります。

データサイエンティストの優劣が有形化、進化せよ

これまでは特定の技術にフォーカスしてそれぞれが取り組んできたことが、このスキルセットやタスクリストによって体系化されてきています。

これにより、各データサイエンティストは何ができるかの有形化が良くも悪くも明確になってきていると考えられます。

その上で、自他共に一人一人の成長を促していけるような環境構築ができて切磋琢磨していける職種になるといいですね!

では。

この記事が気に入ったらサポートをしてみませんか?