見出し画像

1からデータ系エンジニア採用を始めるあなたへ|データ系エンジニア採用の教科書

こんにちは!ポテンシャライトの峯です!

近年、データエンジニアやデータサイエンティストなど「データ系人材」の採用がますます注目を集めています。私たちポテンシャライトも、スタートアップやベンチャー企業の採用支援を行っている中で、「データ系人材の採用に関する知見を貸してほしい」という相談が増えています。

実際に、わたしが担当させていただいている企業さまでも直近半年以内でのデータ系エンジニアの採用需要が高まり、現在、データ系エンジニアはまさにレッドオーシャンの市場へと変化しました。
ただ、「データ系人材」の採用活動をする上で、不明瞭なことが多いかと思います。

例えば、

・データ系人材は転職市場にどれくらいいるのか
・ネットで調べてもデータ系人材の職域定義が曖昧でわからない
・採用するためにどの媒体を使えばいいのか
・そもそもデータ系人材を採用する必要性に理解が浅い

などという疑問の声をいただくことも増えました。

そこで本ブログは、データ系人材採用に必要な前提情報や採用手法について説明いたします!データ系人材採用をゼロから始める方にも、本ブログを読んで全体感をご理解いただければと思っております!

※あくまで本ブログはポテンシャライトが日々採用のご支援をさせていただく中で感じた内容を書いておりますので、一視点として参考程度にご覧いただけますと幸いです。

では、早速参りましょう!


1. データ系人材採用市場がなぜ注目されているのか?

1-1. データ系人材の市場需要

「データサイエンティスト」という言葉を耳にする機会が増えてきた昨今ですが、実際にどれほどの求人があるかご存じでしょうか?
データ系職種にはデータサイエンティスト以外にもさまざまな役割がありますが、参考までに転職サイトGreenで「データサイエンティスト」という職種で検索してみたところ、「446社から872件」の求人が確認できました。

また、興味深いことは昨年との求人数の比較です。
先ほどの「446社から872件」という数字は去年検索した際のデータから引っ張ってきたのですが、直近調べてみると....

GreenのUIの使用が変わったこともあり、999求人以上はどれほどの求人数が公開されているのかは現在不明瞭になってしまいましたが、とにかく、昨年と比較してかなりの求人数が増えていることがわかります。

1-2. データ系人材が求められる背景

なぜこれほどのデータ系人材の需要が高まっているのでしょうか?一因として、技術の進化によりビッグデータ分析が可能になったことが挙げられますが、最も大きな理由は顧客ニーズの多様化と、それに対応するためのデータ主導の意思決定が注目されていることにあります。

以前は、ある程度可視化されたニーズに対してマス広告を活用できる企業が競争で有利な立場にありました。しかし、現代では便利なものが増え、生活やビジネスにおけるニーズが多様化したことで、従来の方法では経営判断が追いつかなくなっています。いわゆるVUCA時代(変動性、不確実性、複雑性、曖昧性の時代)において、企業はより正確で迅速な意思決定を行う必要があります。そのため、データに基づいた定量的な意思決定を行うデータ系人材が重要視されています。

さらに、近年の技術発展により生成AIやチャットGPTのような自然言語処理技術の進化も、データ活用の幅を広げています。これらのAIツールは、膨大なデータを効率的に分析・解釈し、企業がより迅速に顧客のニーズや市場の動向に対応できるようサポートしています。たとえば、チャットGPTを活用することで、顧客からの問い合わせやサポート業務を自動化し、時間やコストを削減するだけでなく、顧客体験の向上も実現できます。

これらの背景から、単なるデータ分析にとどまらず、AI技術の活用を通じて、より高度な経営判断やサービス改善が求められるようになり、データ系人材に対する需要が一層高まっているのです。

2. データ系人材職種別採用手法

2-1. データ系人材の職種・採用方法を知る前に知っておくべき前提

データ系人材の需要を示す一例として、データサイエンティストの求人数を共有させていただきました。ただ、データによるビジネス上の意思決定は、データサイエンティストのみでは成立しません。

一般的に、データサイエンティストは「分析されたデータから意思決定をする職務」です。データを整備できる人やデータを資料にまとめられる人などがいて、初めてデータサイエンティストの職務が実行できるようになります。データサイエンティスト以外にもデータエンジニア・データアナリストなどのデータ系人材に注目が集まっています。
ただ、これらのデータ系ポジションは最近注目が集まり始めたポジションであるが故に、職域の定義がはっきりしていない印象を持ちます。各社が任せたい業務の幅(職域)によって自由に定義されているケースが散見されます。そのため、市場全体において職域の定義が曖昧になっている実情があります。
上記を踏まえ、本章では以下の代表的なデータ系職種の職域整理をした後に、データ系人材のおすすめ採用手法の紹介ができればと思います。

▼ 紹介するデータ系人材職種とその役割

◆データエンジニア
・SQLやPythonを使った「データ処理」や、「クラウドインフラの設計・運用、ETLパイプラインの開発」を担当します。

◆データアナリスト
「データ分析を通じてビジネス上の意思決定をサポート」します。ダッシュボードの作成や、分析結果のレポート作成も含まれます。

◆データサイエンティスト
データを活用した「ビジネスの課題解決」「予測モデルの構築」を行います。機械学習やAI技術も使用します。

一つずつ解析していきましょう。

2-2-1. データエンジニア

Forkwell上の10件のデータエンジニア求人から、「職務内容・必須要件」の一部を抽出したものが以下です。

▼職務内容

・SQL, Python, node等を用いたデータ処理
・MLライブラリの検証、運用
・データ活用のためのETL処理の開発と運用
・GCP,AWSを活用した大規模なデータパイプライン設計、開発、運用
・Tableau等BIツールを使った、意思決定のための分析環境の開発、運用
・Terraform/Ansibleなどを使った、インフラタスク自動化の設計、開発
・次世代アーキテクチャの検討・計画立案
・データアナリストやデータサイエンティストと話し合いデータ活用の促進
・基盤上のマスタデータ更新、KPIレポーティングアプリケーションの開発
・ETLプラットフォームにおけるMLOps基盤のR&D、開発、実装、性能改善
・SRE事業におけるオペレーション自動化エンジンの開発、実装、性能改善
・CI/CDプロセスの構築と運用
・プロダクトや開発行為に対するセキュリティ要件の定義
・脆弱性診断やペネトレーションテストなどのセキュリティ診断自動化推進
・Pvt/Pubデータ収集基盤の開発・運用
・事業共通データ分析基盤の設計/開発/運用、パフォーマンス改善
・統計解析、機械学習によるモデル実装、自動化
・プロジェクトの社外パートナーへの基盤環境導入支援

▼必須要件

・Webアプリの開発やクラウドソリューション開発の経験(2年以上)
・Python等のLL言語の基礎的な実務経験, jsの実務経験
・Python、Ruby等プログラミング言語を用いたサーバサイドアプリケーション開発経験
・ETL処理の設計・開発・運用経験
・gitなどのバージョン管理ツールを用いた開発・運用
・DBの設計・構築・運用およびSQLのボトルネック解析・チューニング経験
・パブリッククラウドの設計・構築・運用経験
・運用自動化ツールや開発フレームワークの開発・運用経験
・データ分析基盤の構築、運用経験
・インフラエンジニア、SREとしての業務経験・基礎的な統計知識
・SQS, Kinesis, Cloud Pub/Sub等メッセージキュー関連の理解
・DWH/BIツールなどデータ分析基盤の管理経験
・アプリケーションインフラの構築・運用経験
・データ分析・機械学習により実ビジネスを改善したご経験
・機械学習(ML)の経験をお持ちの方
・システム稼働上での技術的課題に対する問題解決能力
・システムの信頼性向上のために必要な最低限のプログラミング能力
・OSに対する基礎的な知識

職務内容・必須要件を抽象化してみると、データエンジニアの職務内容は「データ分析をするための基盤作成」が中心であることがわかります。

また、上記の職務内容・必須要件の中でも頻出したものが以下でした。

・パブリッククラウドの設計・構築・運用経験
・Python、SQL等プログラミング言語による開発経験
・BIツールなどデータ分析基盤の管理経験

パブリッククラウドの利用経験があり、且つPython、SQLでの開発経験・BIツールなどの管理経験がある方であれば、過去にデータエンジニアを経験された方が最も要件に該当する方かと思います。ただ、SREを経験した方でも類似した開発経験があるため、この層はポテンシャル採用になるかと思います。

2-2-2. データアナリスト

Forkwell上の10件のデータアナリスト求人から「職務内容・必須要件」の一部を抽出したものが以下です。

▼職務内容

・プロダクトマネージャーをはじめとする社内メンバーと連携しながら、問題の定式化の段階からプロダクト開発に関係する様々なデータ分析を実行する。また、分析結果のレポーティングについても責任をもって行う
・統計的機械学習に基づく予測モデルを開発/運用し、顧客の行動の予見や社内業務の効率化に役立てる
・プロダクト利用状況を可視化するダッシュボードなどを作成し、社内のビジネスインテリジェンス (BI) を推進する
・KPIの設計/可視化と社内周知施策の考案
・データ面からボトルネックを調査
・各種施策の数値取得設計と統計的評価
・アンケートの実施とその定性評価
・ログ設計/データ分析基盤の設計/構築
・学習用データの収集と管理(チームメンバーで分担します)
・運用後の観測と学習モデルの改善
・データエンジニアと連携してDWHの開発運用
・ダッシュボードの開発運用
・アナリスト向けの分析環境運用
・データに関連するドキュメントの作成/運用
・顧客向け分析ツール(WEBアプリケーション)の分析機能の企画やそれに必要な分析の実施
・データからインサイトを見つけ、顧客の課題を解決するためのデータ分析

▼必須要件

・社内メンバーがもっている課題をうまくヒアリングし、ニーズをもとに解決すべき問題を数理的に定式化できる
・データ分析の結果を正確に記述できる文書作成能力と、非専門家に対しても分析結果をわかりやすく伝えることができる
・統計解析に関する知識を有している(統計検定2級程度)
・Webサービスのグロースのための分析経験
・SQL、R、Pythonなどのツール(いずれかで可)を利用したデータ分析経験
以上に加え、以下いずれかのご経験もお持ちの方
・データ分析を用いたプロダクトの改善提案および検証経験
・仮説検証のための指標およびABテストなどの検証環境の設計経験
・Pythonなどを用いた機械学習エンジンの開発経験(2年以上)
・BIツールを利用したダッシュボード開発運用経験
・ステークホルダーと連携しながら戦略に沿った適切な粒度でコードのモジュール化が行える
・データ品質を担保するためのテストが書ける
・自動化、効率化を進め、トイルの削減を推進できる
・保守性、拡張性を意識したコードの設計が行える"
・データ分析実務経験(3年以上)、SQLもしくはその他のプログラミング言語でのデータ分析業務経験
・統計の基礎知識

職務内容・必須要件を抽象化してみると、データアナリストの職務内容は「ビジネスサイドとデータ開発サイドとのコミュニケーションの橋渡し役やダッシュボード開発」が中心であることがわかります。

また、上記の職務内容・必須要件の中でも頻出したものが以下でした。

・プロダクトマネジャーらと協力して、課題の発見や仮説検証
・データエンジニアと連携してデータベース開発運用
・Pythonなどのスクリプト言語による基本的なプログラミングスキル

様々な求人を拝見しましたが、基本的なプログラミングスキルとビジネスの現場のヒアリングをし、課題解決につながりうる示唆を洗い出すことをデータアナリストに求める傾向があるため、類似経験があるプリセールス・PjMの方はデータアナリスト採用におけるポテンシャル層となりうるかと思われます。

2-2-3. データサイエンティスト

Forkwell上の10件のデータサイエンティスト求人から「職務内容・必須要件」の一部を抽出したものが以下です。

▼職務内容

・エンジニアと協力し、データ分析結果のサービスへの組み込みを行う
・リリース後の効果検証を行い、次の施策へ生かす
・⻑期的なデータの変化による精度の低下を発見してメンテナンスを行う
・営業現場におけるデータ活用支援
・マーケティングにおけるコスト最適化分析
・マーケットの需要に応じた市場予測/最適化
・機械学習による予測モデルの構築
・事業側の分析要望ヒアリング
・ヒアリング結果をもとに分析課題を設定
・基礎俯瞰分析の実施
・分析方針設計
・分析結果からの示唆検討
・分析レポート作成
・分析結果報告
・AIからシステムまで幅広い技術の知識や経験を元に、プロジェクトの課題を解決するための計画や設計を策定
・ 機械学習による課題の解決
・ データの見える化、民主化
・正しくデータ分析をおこなうために必要となるプロダクトのシステム理解や業界・ドメイン知識の獲得、およびそれらに基づく分析のためのデータ加工技術を洗練させる

▼必須要件

・機械学習の基礎知識
・Python、 Rなどを使用した分析経験
・データサイエンティストとして、分析の問題設定から従事されたご経験
・テーブルデータを用いたモデル開発・データ分析のご経験
・仮説構築からデータ分析まで、機械学習や統計学の手法を用いて研究もしくはビジネス課題を改善・解決し価値創出までの一連の経験
・データによる汎用的な解析アプローチの整備・開発推進
・ドメイン知識に基づく考察や事業上の打ち手への繋げやすさを意識して、有効な説明変数を適切に設計できる。
・データ理解力 (データ定義書が揃ってない状況でも、データ構造に詳しい方への質問を通してデータの内容を理解できる)
・課題発見力 (事業内の特定機能(例:Webマーケ)における課題の中で、データ分析で貢献できる課題を自ら発見)
・プレゼンテーション力 (相手の専門知識レベルに合わせて説明の厳密性を調整した説明が可能)
・事業の意思決定支援を目的としたデータ分析の実務経験
・データアナリストとしての実務経験
・需給予測などモデル解析の実務経験
・顧客との要件定義や成果報告などの打ち合わせの経験
・ビジネス課題設計からシステム開発・運用までを一貫で主導した経験

職務内容・必須要件を抽象化してみると、データサイエンティストの職務内容は「データエンジニア・アナリストが分析したデータに基づいたビジネス課題解決・需要予測などのモデル開発」が中心であることがわかります。

また、上記の職務内容・必須要件の中でも頻出したものが以下でした。

・機械学習の基礎知識
・ビジネス課題設計からシステム開発・運用までを一貫で主導した経験
・需給予測などモデル解析の実務経験

データエンジニア・データアナリストに求めるデータ整理に近しい業務ではなく、どちらかというとビジネス課題解決をデータサイエンティストに求めている傾向があるようです。ビジネス課題解決という目標を見失わず、専門的な統計分析スキルなどを歓迎要件とする場合、Webマーケ・UXデザインの上流設計経験がある方などがデータサイエンティスト採用におけるポテンシャル層となりうるかと思われます。

2-3. データ系人材のおすすめの採用手法

ここでは、有効求人倍率と、それぞれの職種のユーザーの人数 (前提:直近ログイン1ヶ月以内、転職意欲の高い求職者さま) のバランスで相対的にどの媒体が相性が良いのかを表しています。

※Forkwell / LAPRASは求人倍率は低いものの、
そもそもの登録者数が少ないため、△表記させていただいています。

データ系人材を採用する際の採用媒体は、それぞれに特性があり、採用ターゲットとなる職種や企業のニーズに合わせた媒体選びが重要です。
以下では、「データサイエンティスト/機械学習エンジニア」「データアナリスト」「データエンジニア」の3つの職種に対して、各媒体の有効性を分析しました。

2-3-1. データサイエンティスト / 機械学習エンジニア

この職種は、高度なスキルセットを持つ専門人材であるため、需要が非常に高くなっています。たとえば、WantedlyやGreenのような媒体では比較的掲載費や採用経費を抑えられるメリットから、多くの企業が掲載していることから求人倍率が非常に高い傾向にあります。登録者数に対して求人数が多いため、競争が激しい市場であることがわかります。そのため、これらの媒体での採用は、特にリソースの少ないベンチャー企業にとっては少々チャレンジングな領域になるかもしれません。

一方、ビズリーチやFindyなどの媒体では、求人倍率が比較的低いことがわかりました。掲載している企業に対して登録者数がまだ少ない状況のため、より効率的な採用活動が期待できます。特にビズリーチは、ハイレイヤーの人材をターゲットとした求人が多く、データサイエンティストや機械学習エンジニアのようなポジションの登録者数も多いことから現状穴場な媒体といえます。Findyはスキルに基づいた評価システムを持ち、エンジニアの技術力を可視化できるため、精度の高いスカウト活動が可能です。

2-3-2. データアナリスト

データアナリストは、ビジネスサイドとデータサイドの橋渡し役としての役割が求められます。前提として、データアナリストとして活躍している母数がそもそも少ない上に、現在在籍している企業さまから「転職しよう」と動いている方も少ない傾向があります。

その前提がある中で、WantedlyやGreenなどの媒体ではあまり掲載にお金をかけられないベンチャー/スタートアップ企業が掲載しやすい媒体であることから求人倍率が非常に高く、企業の需要に対して登録者が少ないため、このポジションでもやはり少々チャレンジングな領域になります。これらの媒体を利用する場合、企業は競争力のある求人条件を提示する必要があります。

ビズリーチでは、データアナリストの求人倍率は低く、求人数に対して適度な登録者が登録していないため、比較的効率的な採用が見込めます。また、Findyでは求人数に対して登録者数が豊富であり、他の媒体に比べて競争が少ないため、採用の成功率が高いと言えます。特に、Findyはデータ分析のスキルを客観的に評価するシステムがあり、企業が適切な人材をスムーズに選定できる点が強みです。

2-3-3. データエンジニア

データエンジニアは、インフラの設計やデータのパイプライン構築を担う技術的役割が強い職種です。この職種も、特に高い技術力を求められるかつ、これは想像ですが、データエンジニアの需要が現在高いことから現在在籍している企業さまから転職しよう、というユーザーがあまりいらっしゃらないことも現状あるかと思います。

とはいえ、WantedlyやGreenはそもそも掲載している企業さまが少なかったのは意外な結果になりました。故に、求人倍率が比較的低いですが、他媒体に比べ登録者数が多いため、企業にとっては多くの候補者にアプローチできる可能性があります。しかし、Findyは求人倍率が最も低く、登録者数と求人数のバランスが非常に良いため、精度の高い採用活動が行える可能性が高いです。Findyのスキルベースのマッチングシステムは、データエンジニアの技術的適性を評価する際にも非常に有効です。

また、ビズリーチはハイレイヤー人材をターゲットにした媒体であり、データエンジニアの採用にも適していますが、他の媒体に比べ掲載している企業さまも多いことから少々採用競合の割合が高い傾向の可能性があります。

2-3-4. まとめ

今回の分析から、データ系人材の採用には各媒体の特性を理解し、求人数と登録者数のバランスを見極めることが重要であることがわかります。特に、データサイエンティストやデータアナリストの採用においては、求人倍率が高いため、ビズリーチやFindyのようなマッチング精度の高い媒体を選ぶことが成功の鍵となります。

また、データエンジニアに関しては、技術的なスキルセットが重要であるため、Findyのようなスキルベースの採用システムを活用することで、より良い結果を得ることができるかもしれません。

ここでは、これからデータ系人材の採用を考えるベンチャー企業の皆さまに向けて、弊社のクライアントさまがよく直面される課題を簡単にまとめました。特に「データ系人材の採用が本当に必要か?」とお考えの企業さまにも、ぜひ最後までご覧いただければと思います。

3. ベンチャー企業におけるデータ系人材採用のポイント

3-1. 売り手市場の現状

リーマンショック後の10年以上、IT業界の採用市場は非常に活発な状態が続いています。以下のようにさまざまな領域で、ITやデータ系人材のニーズが高まっています。

・ソーシャルゲームを支えたGREEやMobage
・ネイティブアプリをリードしたCygames、コロプラ、ガンホーオンライン、Mixi
・メルカリ、Gunosy、スマートニュースといった非ゲーム系スマートフォンアプリ
・DELISH KITCHENやクラシルなどの新しいWebサービス
・SaaSやエッセンシャルテック(産業廃棄物管理や水・空気関連技術)
・ロボットや宇宙産業

このように多くの分野で「データ系人材」の需要が増加しています。実際に、データ系人材はこれからも必要とされることが予測されています。

みずほ情報総研の調査によると、先端IT人材(データ系人材を含む)はすでに2万人以上不足しており、この不足は年々増加しています。また、日本データサイエンティスト協会の調査では、データサイエンティストが1人以上いる企業は全体の約29%にとどまっていることもわかっています。このような背景から、データ系人材の採用には時間とコストがかかることを理解していただければと思います。採用はすぐに実現するものではなく、長期的な取り組みが求められます。

3-2. 大手企業との競争

市場におけるデータ系人材の少なさに加え、大手企業との採用競争も課題の一つです。大手企業は多額のIT投資を行い、年収面での優位性を持っているため、ベンチャー企業がその面で競争するのは難しいかもしれません。
このような状況でも、年収以外の部分でデータ系人材を惹きつけることが可能です。データ系人材は、次のような要素に魅力を感じやすい傾向があります。

・扱うデータの希少性
・データ分析における自由裁量
・優秀な同僚との協働

そのため、企業としては自社のデータ環境や任せる職務の内容をしっかりブランディングし、場合によっては外部顧問を招いて優秀な環境を整えることが重要です。

ポテンシャライトでは下記のようなインサイト表を作成しました。
よくデータ系のエンジニアを採用している企業さまやデータエンジニアの方がどんな理由で転職を考えるのかを想像しながら、そのインサイトに沿ったメッセージングで心を惹かせることが重要です。

3-3. 事業成長の停滞リスク

多くのベンチャー企業では、初期段階では売上を優先し、データ系人材の採用やデータの蓄積にコストや工数を割くのが難しいと感じるかもしれません。これは自然な流れですが、データをしっかりと蓄積し、いつでも活用できる状態にしておくことが、後の事業成長に大きく寄与します。

実際に、初期の成長期を過ぎた後、データが十分に蓄積されていないために、有効な意思決定ができず、成長が停滞してしまうケースも見られます。こうした事態を避けるためにも、データ系人材の採用を先行投資と捉え、可能な限り早期から確保に動くことをおすすめします。

4. 最後に

いかがでしたでしょうか。

データ系人材採用に必要な前提情報や採用手法に触れてきました。データ系人材採用に悪戦苦闘している方々に読んでいただき、何かの助けになる資料となっていたら大変嬉しく思います。

私自身、データ系人材採用について勉強中ですし、これからさらにトレンドになってくる領域だと思いますので、引き続き情報をアップデートしていきたい思いが強いです。ぜひデータ系人材採用を主導されている方、データ系人材の方、情報交換しましょう!

長文でしたが、最後までご覧いただき、ありがとうございました!
※当社の採用 / 人事組織系支援にご興味がある方は、ぜひお気軽にお声掛けください📣

新ポテンシャライトメンバーも絶賛募集中です!当社のお仕事にご興味がある方はWantedlyからぜひご連絡ください 💁🏻‍♀️

これからも採用 / 人事系のアウトプットを続けていきます!よろしければ note のフォロー いただけると嬉しいです(左上にフォローボタンがあります🌟


いいなと思ったら応援しよう!