見出し画像

ゼロから始めてデータサイエンティストを目指してみます⑦

ひきつづき㈱キカガクさんの体験コースについてつぶやいていきます。

05.Python&機械学習入門 - 2 

再生時間:8時間
費用:体験のため無料

動画の再生時間は8時間ですが、自分で作業してみたので実際にはもっとかかりました。終了後にブログを書いてみたら、長くなっちゃって先行きが見えなくなってきたので分割しています(笑)。全11単元ありますが、今回は4から7単元目。

単回帰分析

 いよいよ統計学に入っていきます。微分の単元で習った内容が使われます。
 「部屋の広さから家賃を予測する最適なモデルを作成する」というストーリーで、あれよあれよと数式が変形されていくのはまるで「手品」を見るようです。
 どの単元も複数の小単元で構成されていますが、ここは途中の小単元でやめると「手品」が完成したときに、経緯が分からなくなるので、一気に見たいところです。
 どうでもいい情報ですが、先生はたまに「モチベーション」という言葉を使います。統計業界の表現なのかもしれませんが、私たち平民が使う「ワクワクしてやる気がでる」みたいなそんな素敵な意味合いでは決してありません。

この「C」が忘れた頃にまた出てきます

重回帰分析

 家賃を決める要素に、広さだけでなく駅からの距離や治安などが含まれてきて、データサイエンティストっぽい!!とワクワクしたのですが、公式丸暗記でごまかした「線形代数」(データサイエンティストを目指してみます⑥ 参照)が出てきて、開始直後から憂鬱になります。単回帰分析より式変形がヤバいことになって、もはやトランスフォーマー(汗)。データサイエンティストへの道が遠く感じます。説明を聞いている間は「ふんふん」とか「ほえー」とか思うのですが、自分ひとりでは答えをだせそうもありません。
 このタイミングで、高校数学のブラッシュアップをしたらいいかなと思い始めました。で、並行して高校数学を速習しはじめましたが、それはまた別の機会に書く予定です。

線形代数の説明は呪文のようです

Python 速習

 Python はアラフィフが初級者レベルまで到達している(と信じている)ので電光石火で修了です(笑) 
 progateさんやドットインストールさんではブラウザで学習しましたが(データサイエンティストを目指してみます 参照)、こちらではGoogle Colaboratory を使用するので説明に従って環境設定をします。Google Colaboratory の利用はGoogleアカウントが必要ですが無料です。使い方はそもそも簡単ですが、単元の最初にレクチャーしてくれるので問題なしです。
 「速習」というだけあって本当に高速です。しかも、問題が出されて真剣に考えたのに、解答には習っていないコードが使われてた時にはちょっと不信感が芽生えました。
 ・・・と思ったのですが、この Python & 機械学習入門のその後の単元では、統計に必要なコードしか使いません。エンジニア的な仕事をしたいわけでなければ、構文は理解しなくてもいい、という割り切りなのかもしれません。

私が不信感をもった瞬間(笑)

アラフィフは一回で分かるくらいの内容にはあまり興味がわかないので、ちょっと分からない程度のほうが、長続きします。

ということで、不信感をいだきつつ、道はまだまだ続きます。
次から Python を使った分析が始まり、さらにデータサイエンティスト感が高まってゆきます。

#最近の学び

いいなと思ったら応援しよう!

この記事が参加している募集