文系未経験の営業が「ビジネス支援型データサイエンティスト」になるまで
2021/03/29:第3版リリース
2020/07/28:第2版リリース
2020/05/20:初版リリース
皆様、初めまして。ヤエリ(@yaesuri_man)です。
嬉しいことに、twitterでお会いした人から私の職業や経歴について聞かれることが増えてきました。
そこで自己紹介を兼ねて
・現在の仕事
・これまでの経歴
をまとめます。
データサイエンスにご興味をお持ちの方に
「えっ?そんなキャリアもアリ!?」
というような、ある種の気づきになれば幸いです。
注意点:
初めにお断りしておきますが、私の経歴は正攻法ではないです。王道の学習順序と比べるとかなり遠回りだと思いますし、そっくりそのまま真似しても活躍できる保証はありません。加えて身バレ防止のために倍半分レベルで創作していますので、話半分で読んで頂けますと幸いです。
また記事内にAmazonのアフィリエイトリンクが含まれています。当ページ経由で書籍をご購入いただいた場合、1冊あたり数十円~100円ほどが紹介料として私に入る形になっています(Amazon側が紹介料を支払ってくれます)。皆様が負担するわけではありませんが、気になる方はリンクボタンではなく書籍名をコピペして検索して下さい。noteやアフィリエイトの収益は中高生にAI関連の本をプレゼントする活動を行っており、そちらに充てさせていただいております。
「ビジネス支援型データサイエンティスト」という職業
「ビジネス支援型データサイエンティスト」は、初代データサイエンティスト・オブ・ザ・イヤーであり現滋賀大学教授(元大阪ガス ビジネスアナリティクスセンター所長)の河本先生が創り出した言葉です。
「データサイエンティスト」と呼ばれる職業の中で、
「機械学習を用いてビジネス課題を解決し、価値を生み出す」
のがミッション。
お客様のビジネス課題やAIに関するぼんやりとしたニーズをヒアリングし、課題を因数分解したり、課題自体を設定した上で
・ある時は人手による分析支援をご提供し
・またある時には分析ツールをご紹介し
・場合によってはお客様自身での解決方法を提示する
というように、課題の解決策を考えるのが私の役割です。
「データサイエンティスト(以下「DS」)」は「AI」や「ディープラーニング」と並ぶ流行り言葉であり、そのキャッチーな響きからも日々便利に消費されています(私も便利に活用してしまっています)。
ですが、この「DS」という言葉は本来多義的なもの。
ひとえにDSといっても、
①アルゴリズム自体を研究するDS
②データ収集・加工・整形など、データの準備を行うDS
③数理統計・pythonなどを駆使してデータモデルを構築するDS
④機械学習とビジネスを結びつけたり、ビジネス課題を解決するDS
これだけの区分け(※1)があり、現在の私の役割は④です。
要は「AIに特化したコンサル」みたいな感じですが、個人的に「コンサル」という言葉がちょっとしっくりこないので、河本先生の言葉をお借りしている次第です。
最近はDS以外にも、プリセールス、営業支援、マーケティング、広報などなど、かなり手広くやらせて頂いています。皆さん「営業出身のデータサイエンティスト」は珍しいらしく、今のところ似た経歴の方とはお会いしたことがありません。
ここからはこれまでの経歴をご紹介します。
学生~若手時代(20代前半)
これといった学歴ブランドを持ち合わせない文系(経済学部卒)です。
大学時代は簿記や計量モデルの勉強をしたような気がしますが、よく覚えておらず、現在のビジネスシーンでは全く活用できていません。
少しだけ役立っているかな?と思うのは、昔から「ログ取り」「ログ分析」が好きという性格。
当時パチンコ・パチスロにハマっていましたが、台の回転数や収益などを細かく記録し分析することが好きで、その結果を元に立ち回ることで、収益としては大きくプラスでした(全く自慢できる事ではないですが)。
就活で、とある中小IT企業から内定をもらい、社会人生活スタートとなります。
下積みの営業時代(20代中・後半)
新卒入社した中小企業は戦略的な営業方針を持たず、売れるものは何でも売る(※2)というスタンスでした。
・PCやサーバ、ストレージ、電話機やFAX、店舗機器全般
・webサイト構築からメール・FAX一斉配信など
・データ分析や開発・運用受託
・ECサイト構築から物流配送業務受託までのフルフィルメント
・基幹系・実行系システムの構築
中でも私が好んで取り扱っていたのが、専門店向けのPoSレジと販売管理システムです。具体的には、各店舗の売上情報をPoSレジで収集し、それをセンター側で集約し財務会計につなげる仕組み。
PoSレジやバーコードプリンタ、ハンディターミナルをリプレイスするとなると、数千万円規模の売上になるばかりか、レジのレシートやバーコードラベル、インクなどの備品の長期的な売上にもつながり、非常に美味しいのです。
但し残念ながら私が所属していたのは中小IT企業。導入における専門部隊や保守部隊などはありません。売った営業本人が納品に駆り出されるのはザラで、本部サーバの立ち上げや店舗のパート・アルバイトの方に向けた集合教育※なども行ったりしていました。
※PoSレジやハンディターミナルが変わると、各店舗の従業員の方にその使い方を覚えて頂く必要があるのです。いくら機器が新しくなり便利になったとしても基本的には変化を嫌う方々なので、「使いにくい」「こんなのでは仕事にならない」など慣れるまで散々文句を言われます。土日の夜間に各店舗から「レジの締め方が分からない」と携帯に直接電話がかかってくる世界です。
そんな現場対応の中で仲良くなったとある店舗の店長から計数管理について相談されたことが一つの転機になります。
その企業では、PoSレジのデータをセンター側に集約し、週末にバッチを回すと一週間分の売上が翌月曜に店舗のクライアントで見られる仕組みでした。が、現場の店長は独自の計数管理をしており、画面に映った一週間遅れのデータを電卓で手計算していたのです。
要は財務会計用の仕組みなので、管理会計業務がないがしろにされていたのですよね。
そこで店舗PCのExcelにセンター側のOracleDBから即時にデータを引っ張って来れるVBを仕組んであげた所、非常に喜ばれました。好きな時にExcelの形式でリアルなデータが出てくるので、それを元に自分で好きなように集計できるわけです。
分析に使うだけですので、仮にデータ収集&分析後に返品が発生して数値が狂ったとしても問題なし。それよりリアルに分析できることの方が管理会計においては重要なのです。
今思うとネットを検索しながら手書きした汚いVBだったと思いますが、それでも大喜びしてくれた当時の店長の顔が、私がデータ分析をビジネス実装することにやりがいを感じるようになった原点だったのかもしれません。
その後、当時の分析ノウハウを元に主体的に取り扱っていたのが、AIならぬBI(ビジネスインテリジェンス)。要は分析システムです。
通常、エンタープライズBIの検討主体はIT部門であることが殆どでしたが、私は敢えてそこには行かず、以下のようなBIを利用する現場部門に直接アプローチすることで、競合他社の営業との差別化を図っていました。
・経営企画部門
・マーケティング部門
・営業部門
・生産管理部門
一般的に上記のような現場はIT部門よりも力が強いもの。彼らから直接ニーズを拾い上げることで、お客様の言葉で語ることができ、響く提案ができるというわけです。
一旦エンタープライズBIを導入すると、その上場企業やホールディングス全体のお金の流れを把握でき、提供側としては中長期的なアカウントプランが立てやすくなります。要は受注が増えるわけです。
30歳前後で別のIT企業へ転職しましたが、新天地でもこの勝ちパターンで次々と大口取引顧客を育て、営業表彰の常連となりました。
機械学習案件を取り扱い始める(30代前半)
世界がリーマンショックから立ち直りつつあった頃、私は機械学習に巡り合います。
当時日本で機械学習はあまり注目されておらず、個人的には「本当にこんなの売れるのかな・・・」という感じでしたが、いわゆるタレントSE(※3)を客先に連れて行くと、機械学習を活用する分析案件をバンバン受注してくれるのです。
私は「彼のトークを身につけたら自分一人でも売れるんじゃない?」と考え、商談やコンサル時のやり取りを全てボイスレコーダーで録音し、全く同じ内容を完璧に再生できるようになるまで繰り返し聞き込んで記憶しました。つまり営業として分析案件を受注する目的で、数理・統計の内容を理解しないまま、表面上の言語の丸暗記を行ったわけです。
この行為の是非は置いておくとして、営業として分析案件を受注する上では効果てきめんでして、機械学習はBIと並ぶ私の主力商材の一つになりました。
更に当時、機械学習に着目してくれるお客様担当者は「お目が高い」実力者ばかりでしたので、そのまま彼らにアプローチすることで付帯案件を次々と受注することができました。「機械学習に興味を持っているかどうか」が、攻めるべき担当者なのかどうかを判断するための材料としても使えたわけです。(※4)
機械学習を学び始める(30代中盤)
機械学習を営業の武器としてすっかり会得した頃、「Harvard Business Review」という雑誌が「データサイエンティスト」という職業を「21世紀で最もセクシーな職業」などと特集し始めました。
当時は「大げさだなぁ」位にしか思わなかったのですが、その後将棋の電王戦が終了したあたりからいわゆる「第三次AIブーム」と呼ばれるようになり、私が取り扱っていた機械学習関連案件がにわかに注目され始めました。
同じ社内の中でも「なんだか凄いモノを売っている営業がいるらしい」というように、注目されるようになったのです。
更に、タレントSEが機械学習コンサルをしている様子を間近で見続ける中で、「意外と自分だけでも出来るのではないか?」という思いが芽生え始めました。
精度向上に必要となるドメイン知識の習得はエンタープライズBI提案時の営業スタイル「顧客業務理解」そのものですし、お客様とのやり取りの中で頻出する統計用語はある程度決まっていましたし(但しこれは大きな勘違いだった)。なによりお客様との密なコミュニケーションはアカウントセールスの得意分野。
というわけで、自分自身のキャリアの幅出しをする意味で、30代半ばで初めて、それまでうわべだけで語っていたデータサイエンスの中身の学習を始めました。
といってもやったことは結構シンプルで、pythonやSQLの基礎、kaggleを経験したあとは、ほぼ実戦。
なお、コンペでAUC=0.001の精度を争うことは、学問としては非常に楽しくタメになります。実ビジネスにおけるモデル構築でも、たまに仕事を忘れてkaggle脳に陥りそうになるくらい、精度向上は楽しいものです。
しかし実際のビジネスの場ではそこまでの精度を求められるシーンは稀。そのため私はkaggleのGetting Startedをやった後は、とにかく実戦で経験を積むことを意識しました。
具体的には、お客様とのやり取りの中で精度向上策を一緒に考えたり、ビジネス課題を機械学習問題に落とし込んだり、などなどです。
また架空のデータセットを元に、仮想ROIを算出するのが好きで、これはよくやっていました。
その訓練を、SIGNATEの練習問題(Airbnbの料金設定)を例に説明します。
例えばこの機械学習問題のROIを考えると、
・Airbnbでは、年間〇%分の不必要な値引きが生じていると仮置き
・予測精度向上で〇%の改善が見込めると仮置き
・宿泊費用の〇%がAirbnbの収益と設定
→自分の予測モデルによる精度〇%向上で〇〇万円のビジネス効果
というような感じで、前提を置いた上で方程式を作る練習です。
これをやると、機械学習の精度向上を実ビジネスの利益に結び付けられるので、結構楽しいのですよね。
当時は遊び半分でやっていましたが、「今自分が書いているpythonコードは一体いくらの価値を生んでいるのか?」を常に意識する癖がつきましたので、何だかんだで今の仕事には一番役立っているかもしれません。とにかくお金に結びつけて考えるイヤな性格は元営業ならではですね・・・。
こうして「ビジネス支援型データサイエンティスト」となった私ですが、今思い返してみると、意外とエンタープライズ営業とデータサイエンティストは必要とされるスキルセットが似ています。
私の場合は、たまたま
・長らくBIや分析案件に携わっていた
・身近に機械学習に詳しいエキスパートがいた
という恵まれた環境で、後付けでデータサイエンスの勉強を始めた形ですが、今後は営業(またはLoB職)とデータサイエンティストの兼務職、みたいなのも出てくるのではないでしょうか。
まとめ
まとめです。
既にお気づきの方が多いと思いますが、要は早い段階で機械学習に目をつけ、一般の方より長期間関わっているという先行者利益を享受しているに過ぎません。
今から未経験でデータサイエンスに参入しろと言われたら、私の能力では恐らく無理。もっと美味しい、他のジャンルを模索していると思います。
実は我々データサイエンティストを取り巻く環境は、ここ1~2年でガラリと変わってきています。
「データサイエンティスト」「AI」「ディープラーニング」のような言葉が有名になったお陰で、単純なpythonコーダーは増え(※5)、企業としては彼らを安く調達できる土壌が整いつつあります。加えて、ここ最近のツールの進化は目覚ましいものがあり、「pythonでモデル組めます」「pythonで前処理できます」だけの人はどんどん淘汰されてしまうでしょう。(※6)
更には「内閣府AI戦略」のもとに、デジタル時代の読み書きそろばんである「数理・データサイエンス・AI」教育を受けた人材が市場に放出され、彼らとも勝負しなければいけません。文中でも触れましたが、大学院でしっかり学んできたDSは本当に優秀。業務終了後の勉強が趣味のような方々ですから、我々常人に勝ち目はありません。
とどめは昨今のコロナの影響。機械学習でビジネス価値を生み出せていないPoC止まりの企業は一斉にAI投資を絞るでしょうし、そうなるとDSの仕事が減るばかりか、投資を絞った事業会社から優秀なDSが市場に放出されます。転職市場での競争率は更に上がるわけです。
上記から、3年後・5年後にはDSが飽和するか、DS自体が不要となる時代が来るかもしれません。そうなった時もうまく生き残れるように、自分をどう変えていくか、何を学んでいくか、時代にどう適応していくかについては、常にアンテナを高くし、先行者利益を享受し続けられるようにしておきたいですね。
以上、最後までお読みいただきましてありがとうございました。
今データサイエンスに興味を持って下さっている方の参考になれば幸いです。
ご質問などありましたらご遠慮なくお声がけください。
おまけ:学習に使用した書籍のご紹介
最後に私が学習した書籍を幾つかご紹介します。
当時は発刊されていませんでしたが、後々読んでみて「これは是非おすすめしたい!」と思ったものも含みます。
いずれも心の底からおすすめできる良書ばかり。是非一度、書店で手に取ってみて下さい。
【全体概要を知るための書籍】※必読
人工知能は人間を超えるか ディープラーニングの先にあるもの
ご存知松尾先生(@ymatsuo)のベストセラー書籍。「人工知能」について誰にでも理解できるように平易な表現で説明してくれている良書中の良書です。データサイエンティストを目指す人だけでなく、「広く『人工知能』を理解したい」という全ての人におすすめ。
文系AI人材になる: 統計・プログラム知識は不要
こちらはzozoの野口さん(@noguryu)の書籍。私が常々考えていた事が全て言語化されており大変な感銘を受けました。青山に押しかけてランチをご一緒した時に貰ったサインは私の宝物。twitterのヘッダー画像に使わせて頂いています。
【データサイエンスのビジネスへの活かし方を知るための書籍】※必読
会社を変える分析の力
最強のデータ分析組織 なぜ大阪ガスは成功したのか
河本先生の著書は、私の中ではバイブルに近い位置づけ。ビジネスデータサイエンスを語る上ではpythonやSQLの勉強よりまずはこちらをご一読頂きたいくらいです。
データサイエンティスト養成読本 ビジネス活用編
ビジネスの場で分析に携わる著名人の生の声が詰まっているムック。データサイエンスは綺麗事ばかりではない事を理解できる良書です。
仕事ではじめる機械学習
「学問としての機械学習」的な書籍が多い(と私は感じる)オライリーシリーズの中で、実ビジネスに特化した珍しい良書です。実データへの機械学習適用方法や、機械学習を適用しないで済む方法、更には大企業にありがちな縦割り組織の中で他部門のデータを入手する際の注意点などなど、実務に特化した内容が満載。必ず読んでおきましょう。
戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック
「仕事ではじめる機械学習」を読んだ上で分析業務に携わり始めた人におすすめなのがこの書籍。和訳がこなれていない部分もありますが、データサイエンスの仕事の全体感を掴むのにおすすめです。※初学者にとってはかなり難しい部類です。書店で立ち読みしてから購入を決めると良いでしょう
【G検定】
基礎を身につける意味ではG検定もおすすめ。以下の書籍は通称「白本」「黒本」と呼ばれて親しまれています。
深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト
徹底攻略 ディープラーニングG検定 ジェネラリスト 問題集
実は受かるためのテクニックがあったりします(すみません、有料noteの宣伝です)
【統計や数学】
「データサイエンティスト=python」なイメージがあるようで、ほとんどのデータサイエンス講座がpython講座だったりしますけれど、私はpythonの学習と並行して高校・大学の数学をやり直すことをおすすめしています。
特に文系卒の多くの方は大学1~2年レベルの数学をやっていないはずので、まずはこちらを身につけましょう。
※「pythonと並行して学習する」がコツ。数学の学習だけだと飽きてしまいますので。
私がお世話になったのは定番中の定番、チャート式シリーズ。
チャート式シリーズ 大学教養 線形代数
チャート式シリーズ 大学教養 微分積分
高校の数学すら怪しいという人はこちら(高1→高3の順)。
チャート式基礎からの数学I+A
チャート式 基礎からの数学Ⅱ+B
チャート式基礎からの数学3
「たかが高校数学のおさらいに、いきなり数冊買うのは嫌だ!」というワガママな人向けにはこちら。
もう一度高校数学
※自分に合っているかどうか、書店で実物を見てから購入しましょう。ものぐさな文系未経験者を食い物にするような書籍が多いためです。
高校・大学の数学を簡単におさらいした後は実戦です。具体的にはExcelアドイン「分析ツール」を導入し、お客様のデータを解析する→分からない単語をwebで調べる・・・というような感じです。
実は古典的統計解析はバカにできなくて(誰もバカにはしていないと思いますが)、このExcelアドインがあれば現場部門からの多くの依頼に対応できてしまったりします。機械学習とうまく使い分けていきましょう。
【python】
pythonはkaggleと実戦で覚えました。
今思い返すと、当時以下の書籍やnoteがリリースされていたら、もっと効率よく学習できたと思います。
機械学習のための「前処理」入門
まずはこちら。これさえあればテーブルデータも画像も時系列も、とりあえずアルゴリズムに突っ込める状態にだけはすることができます(※7)。著者である足立悠さんの経歴を見る限り近しい領域では仕事しているようなので、是非一度お会いしてみたいです。
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
カレーちゃん(@currypurin)と石原さん(@upura0)の共著「kaggleスタートブック」。この一冊でとりあえずsubmitまでは持って行くことができます。
余談ですがカレーちゃんが原宿で開いていたkaggle入門に一度だけお邪魔した事があります。なかなかの熱量で盛り上がっていました。
Kaggleで勝つデータ分析の技術
界隈で話題のkaggle本です。一見kaggleのスコア向上に特化したテクニック本のようにも見えますが、実はビジネスで機械学習を行う際に直面する精度向上への解決方法がふんだんに紹介されています。また過去のコンペの振り返りなどは読み物としても大変興味深いです。
著者の皆様はいずれも界隈で名を馳せた方々。本名とtwitterアカウントを覚えておいて損は無いと思います。
【SQL】
SQLは「知恵の輪」みたいなもので、答えを見れば誰でも簡単に解くことかできてしまいます。そのため書籍を見る際は、まずは自分一人で考え抜いて、自分なりの答えを出した後に参照するのがコツ。
「スマートでなくて良いので望んだ結果を出力できるクエリを作る→書籍で答え合わせをする」ことで、クエリが指に浸透していきます。
おすすめは、ミックさん(@copinemickmack)の「ゼロからはじめるデータベース操作」と、「書き込み式SQLドリル」。ミックさんは神です。
注釈
※1:世間一般のDSのイメージは③であるものの、現在ビジネスの世界では仕事の出来るDSが②③④全てを薄く広く担当しています。この状況はシステム開発手法が確立されていなかったIT黎明期と同じ。当時は仕事のできるITの専門家が、要件定義から仕様への落とし込み、エンジニアリング、H/Wの構築、運用保守まで全てを担っており、その後PM、SE、PG、H/Wエンジニア、CEなど職種が細分化されました。DSに話を戻すと、既に②については「データアーキテクト」と呼ばれ始めていますし、今後は徐々に新たなDS職種が生まれることでしょう。
※2:当時IT営業だった私が販売したものの中で特に変わったものは以下です(上司から呆れられました)
雨傘除水器:雨の日に玄関で傘をバサバサ振って、水気を吸収させる機材です。あまり知られていませんが、これ1台で5万円くらいします。使い捨てのビニ傘カバーが不要になるということで、期末に売上が無い時はよくこれを売っていました。500店舗の小売企業に導入したらそれだけで2,500万円ですからね。構築作業も不要ですし、下手なサーバ製品よりよっぽど手離れが良いです。
フォークリフト:物流倉庫などでパレットを移動する時に使うフォークリフト車です。ECサイト構築業務の流れで物流倉庫にも手を出した際に確か500万くらいで売りました。実はこの手の重機は保守費用が美味しいのですが、フォークリフトのベンダのポリシで、保守契約の商流に入ることはできませんでした(車体のみ販売し、保守契約はベンダ直となった)。
※3:タレントSEは数理のPhD。知識もさることながら顧客のペインポイントをロジカルに捉え、それを機械学習問題に落とし込むのが非常に巧いタイプでした。今でも私の周りにはこのタイプのDSが数多く存在しており、大変刺激を受けております。こういったメンバーに囲まれながら仕事をするのはある種の福利厚生でもありますね。
※4:当時の私の中で機械学習と並んでホットだったのが「RPA」。むしろ機械学習より凄いぞと大感銘を受け嬉々としてローリングをしたものの、残念ながらこちらは全くの鳴かず飛ばずでした。この領域は現場の担当者の汗水で何とか対応してしまっていた部分なので、経営層の投資に対する意識がまだ低かったことが原因。最近で言うと、機械学習の前処理作業と同じような位置づけだったのかもしれません(前処理にお金をかける経営層がほとんどいないので、当時を思い出しました)。あれから数年、今こうして機械学習とRPAの両方が「AIブーム」の波に乗りクローズアップされている事は、なんだか面白いなぁと感じます。当時一緒にドサ周りをしたRPAベンダの営業さんは今や役員クラス。転職の誘いに乗っておけばよかったかなと少しだけ後悔しています。
※5:どうも世間では「データサイエンティスト=pythonのプログラマ」のようなイメージがあるようです。言うまでもありませんがpythonはツールに過ぎず、それをどう活用するかのほうが重要。目的と手段の逆転現象にはくれぐれもご注意下さい。更にはそういう方々を食い物にする「未経験からDSを目指すpython講座」みたな質の悪い講座が乱立していますのでこちらも要注意です。「響く!ウェビナー実践講座」みたいなコンテンツをよくよく見たら単なるzoomの使い方講座だった、というのと同じです。
※6:「pythonでモデル組めます」はAutoML、「pythonで前処理できます」はデータプレパレーションツールにいずれ置き換わるでしょう。スタートアップ企業を中心にしのぎを削っていますので、詳細はガートナーのマジッククアドラントなどを参照すると良いでしょう。
※7:初心者にとっての大きな壁の一つが「前処理に問題があり、アルゴリズムがデータを受け付けてくれない」です。この書籍を参照すれば、まずはテーブルデータ、画像、時系列データについて、アルゴリズムに合う前処理について学ぶことができます。
この記事が気に入ったらサポートをしてみませんか?