データアナリストへの道 #1文系素人の立志
デジテック for YAMAGUCHI 運営事務局 兼 Y-BASEスタッフのハラマルです。段々暑くなってきました。私をはじめ、世の中のハラマルたちには大変な季節です。週末はレノファ山口を見ながら昼間からビールを、と思いますが、この時期、雑草の伸びの速さも半端ないので、こっちの戦いも待っています。絶対に負けられない戦いが続く週末です。
さて、今回から、データ分析にチャレンジしていく記事を書いていこうかなと思っています。
きっかけ
データ分析してみたいな、もっとやってみたいな、と思うようになった直接的なきっかけは、Y-BASEで実施したTableauワークショップです。Tableauの中国地方のユーザー会にも御協力いただき、初心者相手にもご丁寧に説明いただき、データ分析の面白さに触れることができました。
同じデータを扱っても、人それぞれ、違うグラフを作るんです。違うグラフができると言った方が正しいでしょうか?だから、それぞれのグラフから、違う印象や気づきを与えてもらって、とても新鮮な経験でした。
それと、Tableauの、データを地図に落とせるという機能にも驚きました。これは、今までやったことがなかったので、今、ハマっています。データを接続したら、まず、マッピングみたいな。単純のようですが、これを見た方たちは結構驚いてくれます!(そのうち、見せられるのも飽きると思いますが)
また、先日実施した、Y-BASEの宇部ブランチ開設に係る協定締結式で、宇部市さんの人流データを分析するデモンストレーションを見たのも、きっかけの一つかと思います。
単に現状を分析するだけでなく、そこから分かる年齢属性や移動経路、交通手段などから、新たな対策を講じることができ、また、その効果測定ができるというのを目の当たりにしました。
それに感化されて、先日、Tableauを使った記事を書いてみたのですが、無料でこんな便利なツールが使える!というのも、モチベーションが上がっている理由になっています。素人が知らないだけで、世の中、とても便利になっているんですね!
まだ基本もできていない状況ですが、ネットで調べながら可視化できるのはとてもとっつきやすいです。
(今思うと、上も、この記事を書いた後に載せれば良かったですね。)
目指す方向性
実は、このタイトルを付ける際、最初は「データサイエンティスト」としていました。が、よく調べると、「データアナリスト」なる単語も。え?違いがあるの?データを扱うのは全部「データサイエンティスト」じゃないの?
タイトルにするならちゃんと調べてみないといけないということで、慌ててネットで調べてみました。
ざっくり言うと、「データアナリスト」は、データの可視化・分析に軸足を置いていて、「データサイエンティスト」は、データからの将来予測、分析モデルの構築に軸足を置いているようです。アナリストに必要なスキルは統計学で、サイエンティストに必要なのは機械学習ということでしょうか。
ただ、人や企業によっては「データサイエンティスト」の定義が異なるので、「データを使って仕事をする人、価値を生み出す人」くらいのふわっとした文脈で使われると、ビジネスもできて統計も機械学習もできてその実装までできるスーパーマン的な定義になっちゃっている可能性があります。そんなスーパーマンを目指していると勘違いされないようにする必要はあるかなと思います。
良かった、安直に「データサイエンティスト」を目指しますと言わなくて。
野口竜司さん著の「文系AI人材になる」という本の中で、AIは「作る」から「使う」の時代になりつつあり、理系AI人材が担っている「作る」以外の部分(企画・導入・管理)やプロジェクトマネジメントの必要性が説かれています。ここを文系AI人材が担っていかなければならないと。
自費で購入し、職場に飾ってある(飾るというと語弊がありますね。いつでも見返したり他の職員が見ることができるように大事に保管しています!)大事な本です。
これが出版されたのが2020年ですから、既に2年経過しています。データ分析についても、これと同じような状況になっているのかな?と。
つまり、データに関するより深い知識を有していて、モデル構築などをするデータサイエンティストの領域は理系人材に任せて、データを使った課題発見や仮説の設定・検証、効果測定などの分野については、文系人材の活躍の場が広がっているのかな?私も頑張ってみようかな?と思い、「データアナリスト」を目指すことにしました。
かといって、じゃあ、いきなり統計学を勉強するかというと、素人の文系人材には、ハードルが高いです。なので、ツールを使いながら、少しずつデータ分析ができるようになっていければいいなぁと思います。
野口竜司さんも、先述の本の中で、「GUIベース(グラフィカル・ユーザー・インターフェイスの略で、ドラッグ&ドロップやクリックによって扱う操作画面のこと)」のことにも触れ、プログラミングコードが書けなくても使えればいい、と、ハードルを下げる提言をしてくださっていますので、それに甘えてみようかな、と思っています。
いずれ、統計学を勉強しなければ先に進めない壁に当たるかもしれませんが、まずは勉強するよりもやってみることを優先してみようかなと。
プログラミング言語や統計学に疎い文系素人からのスタートなので、どこまでやれるのか、ゴールは設定しづらいですが、少しずつ前進していきたいと思います。