
データサイエンスの勉強を始めて2週間で気づいたこと・学んだこと
前回の記事で「生成AIを1から勉強するにはどうすればいいか?」について書きました。すると、データサイエンスを学ぶのが一番良いということでした。
それでやっと重い腰を上げて学習を始めたわけですが、この2週間で新たにわかったことを書きます。
「目的をはっきりしろ」という声
有識者/技術者/機関がデータサイエンスの習得法について無料で解説をしています。共通しているのは「目的を明確にしろ」ということ。全員がそもそも論について注意喚起しています。
おそらく実務で使えるまでのハードルが高く、挫折する人が多いからでしょうね。
たとえば動画制作や文章作成であれば、半年くらい訓練すれば1件数万円の案件くらいは取れるようになる。「稼げるからがんばれる」というのはある。副業的にスモールスタートが切れるので挫折率は高くはないはず。
しかし、データサイエンスの場合、やることが高度な上に、企業の施策に大きな影響を与えるという点で失敗ができない。さらに未経験者が副業的に案件を獲得するのはほぼ無理だという意見も多かった。
1案件の単価が安くて50万円。100万円以上の案件もたくさんあるので、スキルが身について安定的に件数を取れれば、生活に困ることは間違いない。
前回の記事ではこんなことを書いた。

目的がはっきりしてきたので、勉強の辛さには耐えられる気がしてきた。僕のデータスキル戦略について綴りたい。
僕の戦略はマーケティングにデータサイエンスを掛け算していく
これまでの業務も継続しつつ、クロスセルしながらスキルアップ
思ったよりも学習に時間がかかることがわかり(退職前に調べておけ笑)、すべての時間を学習に捧げると、生成AIの領域で仕事をする前にキャッシュが切れる。ということで、引き続きWeb集客、SEO対策の仕事も最低限だけ受けていくことにした。
同時並行的にこれまでExcelでやってきた分析の作業をより広く統計・機械学習を用いて、実務能力も上げていく。
クライアント企業に追加施策として、僕が担当していないデータもいただいてこちらで分析作業を進める(当面、追加部分は無料で提案する)。
分析能力を上げる
僕がいまやっていることは、主にGA4、Google Search Console、計測ツールからデータを集計する、販売データをExcelでまとめて施策を提案するというもの。このスキルはコツコツ調べて身につけたとはいえ、体系的に学んできたわけではない。
SEO対策は変数も多く、アルゴリズムの変化も激しいので、あまりここに頼った仕事はしないようにしたい。記事の制作代行は今後はAIに奪われる可能性があるし、テックにど素人の僕でもガンガン使って業務効率できているので、ここで食うのは時間の問題だろう。
提案力を上げる
打ち手が増えて扱えるデータが増えれば、新しいアイデアも生まれると思う。
僕はユーザー属性/情報については基本的にスルーしてきた。一つは理屈も効果もわからないものには手を出さない。あとは教育業界をメインだったので、ユーザー属性なんてExcelを使うまでもないからだ。今後はこの解像度を上げる訓練もしていく。
多くの企業が作る「カスタマージャーニー」「ペルソナ」がマーケターのお遊戯とし化しているのはおそらく定量的な根拠を示せる人が担当していないからだろう。
ということで、これまでやってきたWebページ上のマーケティングを取っ掛かりにして、企業の課題に応じてデータサイエンスで補強して、提案内容を増やしていきます。
こうすれば過去〜現在やっていることも十分に生かしつつ、ステップアップができそうです。
データ活用のいろんな仕事を見ていて(会社辞める前に調べろよって話ですが)、戦える領域はたくさんあると知れてよかった。
— ノブトウ (@nobutou) December 3, 2024
これまで携わった業界にいた、肩書と駄弁で高単価の案件を取っている会社/コンサル/マーケターの発注元の企業に営業をかけていき、奴らを焼き払えるなとも思いました笑
データサイエンスが人気な理由
データサイエンスがなぜこんなに高まっているのかと言うと、いくつか理由があるが、
①近年のデータ量が急増化して、そのデータから価値を引き出すニーズが高まっている
② DX化などビジネス活用にデータを使いたい企業がたくさん増えているが、いまだに扱える人材が少ない
この二つが上がる。
総務省がデータサイエンティストの育成に力を入れていて、講座などを用意している。その他大学ではデータサイエンスを目的とした学科が作られていたりする。
文科省は2023年度から高校課程に「情報Ⅱ」を加えたが、この科目が扱う領域はデータサイエンスの基礎なのです。
いずれ教材開発に関わることも視野に入れつつ、学習を続けて教育関係者のために役立つ情報をアップしていこうと思う。
【改訂版】データサイエンス学習のロードマップ
たった2週間ですが、データサイエンスの学習方法に詳しくなったのでまとめます。
そもそもなぜPythonなのか?
一番人気の理由は、人気だから。
⇒みんな使っているから、どこでも通用しやすい、情報が多く学びやすい。
簡単にいうと、豪華版Excelみたいなもので、ライブラリ(Pythonを使った便利ツール)も十分に揃っている。
他のプログラミング言語を知らないのでPythonの欠点は知らないけど、とりあえずPythonを学習すればデータ分析の領域なら実務まで行ける。これから勉強する人はPython一択!
まずはPythonの基礎学習文法を学ぶ。
これはProgateでもいいし、PyQでもいいし、Youtubeの無料教材でも十分。「Python入門」でググれば出てくる。大体書いていることは同じ。データサイエンスのどの領域(マーケター、エンジニア、アナリスト)に進むにしても必要となる。
データ分析で活用できるPythonのライブラリーを覚える
拡張機能というかテンプレのようだが、詳しくはわかっていない。表やグラフを作るツールで、機械学習のライブラリも学んでいったほうがいいらしい。
NumPy(演算)
Pandas(表)※特に重要らしい
MatPlotlib(グラフ化)
Scikit-learn(機械学習)
いろいろ見ると、この本がおすすめらしいので、買ってみた。
『Pythonによるデータ分析入門 第3版』
このオライリーというシリーズは定番らしい。本屋に行くと、めっちゃ並んでいて驚いた。過去に数百回は本屋に行っていますが、知らない分野となると、見たことないがないものばかりですね。
数学のスキル
つづいて、数学(理論全般)の勉強。これはいつ始めてもいいが、まずはPythonでライブラリを実装しながら、必要に応じて勉強していくのが良さそう。
微分(偏微分)
線形代数
統計
確率
データサイエンティストとして足場を固めていく
データエンジニアリングも必要になる。会社員なら誰かに任せるかもしれないけど、個人で仕事を取ったり、同業者と仕事をするなら以下のスキルも必要になる。
Git/GitHub
Linux
SQL
クラウドの扱い
ここまで来れば、一人で案件を取っても安定的に仕事ができる(らしい)。もし足りなくても下請けを使える状態になるので、肩書きを「データサイエンティスト」にして活動したい。
実務に取り掛かることができるので、レポート作成、効果検証、モデリングの知識が必要になるので、細かく挙げるとたくさんスキルが必要になる。
と言うことをやっていこうとすると、普通にやっていれば数年はかかるのではないかと思う。おそらく会社員が空き時間でこれを進めるとなると、3年以上はかかるはずである。
「お金もらいながら、責任も取りつつやった方が早いんじゃないの?」
実務を学ぶ上でも、どこかの企業に就職するか常駐の業務委託者になるかもしれない。スキルを身につけるのに組織を利用させてもらい、しっかり価値を提供するのが一番早いことは間違いない。
とにかくこのスキルが身につければ、過去にやってきた仕事をさらに大きくできるので、妙な意思(一人がかっこいいとか)は持たないようにしようと考えている。
これまで通り、広く顧客に貢献できることを第一とする。
この2週間で進められた内容
といろいろ書いてみて、実際の習得した内容は以下の通り。

Pythonの基礎文法をいくつか、データサイエンティストとして案件を取る方法について考えていたら、あっという間に2週間が過ぎてしまった(笑)
これだけなんですが、前回の記事よりもやることが明確になったので、あとはゴリゴリ勉強していくだけです。
多分やってる途中で何度も心が折れることもあるだろうけど、先人は今から勉強する人以上に苦労したはずなので、先人たちの功績や残してくれているものに感謝しつつ、学習を深めます。
プログラミングは独学するのにお金がかからない
ほんと恵まれた時代にいるなぁと思うのが、データサイエンスについて一通りのことを学ぶにはYouTubeでたくさん情報を得られること。さらにProgate(月額2千円)、Udemy(1講義数千円)の投資で勉強を始められる。
たとえばスクールでPythonを習おうとしたら、これくらいの金額がかかる。

どこまでのレベルかはわからないですが、Pythonでデータサイエンスの基礎が理解できるレベルであれば、おそらく数万円の投資で終わる。
スクールの費用の内訳は、①コミュニティ、②講師、③教材。
学生やまだ目的が定まっていない人には有益だと思うけど、やる気がある人であれば独学でできそうです。
初級者の質問対応なら講師は不要かも
Pythonでわからないことがあれば、生成AIに質問を打ち込むと解説してくれます。
たとえばPythonを学んで最初の週で「型」変換で苦労しました。

僕の誤答

これだと回答が出てこないし、エラーが起こるのですが、質問すると、こんな回答を返してくれます。

僕の書き方のミスに沿って、必要な解説を加えてくれることです。なので、もっと良い正解をお願いすれば出してくれます。

日々の学習について
別のブログサービスを始めました。
ここで日報や気づいたこと、知ったことを書いています。

今はまだ役に立つ内容はないけど、今後僕みたいに独学で進めていく人のために足跡を残していきます。
それではまた。