[初心者]実験科学者でも1年でデータサイエンティストへ
AIやIoTの発展により、データを収集・分析し、価値につなげられるデータサイエンティストが様々な分野で求められている。それはリアルな物体を生み出すメーカーの技術者も例外ではない。DXやらインフォマティクスやら会社でも言われ、いざ取り組みたいと思いつつも、中々自分の関連分野に適応するまでに至っていない方が多いのではないだろうか?ここでは一例として、私自身が1年でデータサイエンスの基礎を学び、化学という分野で活用できるまでに至った過程をメモしました。何かの参考になればうれしい限りです!
まずはPython習得
何はともあれまずはプログラミング言語としてPythonの勉強を開始。ノーコードで使えるツールなども発展しているが、やはりデータの収集や整理の際にはプログラミング使えるとかなり便利。機械学習やWebアプリ化にも活用できるPythonの基礎を本で学んだ。ここではとにかく手を動かすことが大事。
参考:やさしいPython (「やさしい」シリーズ) | 高橋 麻奈 |本 | 通販 | Amazon
機械学習の勉強
つぎは機械学習の勉強。Pythonを使った本を一通り学習。またYoutubeも非常にわかりやすいのでおすすめ。
参考:いまにゅのプログラミング塾 - YouTube
同時進行で自身の専門分野(化学)で機械学習を使った本があったので合わせて読み進めた。実際の活用イメージをつかむのが大事であると感じた。
参考:
①化学のための Pythonによるデータ解析・機械学習入門 | Ohmsha
②Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析 | 書籍情報 | 株式会社 講談社サイエンティフィク (kspub.co.jp)
実務で小さくトライ
ここまでで最低限基礎をつかめたので、社内PCにおいて実際のデータを使いながらなんとなく分析してみる。その上で、どんなことに活用できそうか、実務での目的や課題を考える。
アルゴリズムの勉強、データサイエンティスト検定
同時進行で、少し置き去りにしていたアルゴリズムを今一度勉強(ランダムフォレストって何?ガウシアンプロセスとは?)。行列やベクトルがこんな大事であるとは。。
合わせてより広くデータサイエンスを抑えるため、データサイエンティスト検定を受験し、合格!資格自体が使えるとは思えないが、よい勉強にはなったと感じた。
いよいよ本格的に検討開始!
私の場合は、ベイズ最適化による実験点の提案がやりたいことだと考え、実際の業務に取り組んでいます!
データサイエンスは面白い!
データサイエンスはプログラミングやIT関連の知識、統計、数学など学ぶことは多い。一方で他の分野と組み合わせる(私の場合は化学)ことでそこまで難しいことを行わずとも多くの価値を生み出せることが大変魅力的。データは新しい石油であるといわれるこの時代、このエネルギーを武器に新たな価値を生みだしていきましょう!!