文系卒ですが、Kaggle始めました。
どうも、大学職員として働きながら統計・機械学習を学んでいるものです。
資格試験や参考書を元に学習を行なっていましたが、実際にデータ分析を行なってみたいという思いが強くなってきました。
ただ、データ分析と言っても何をすればよいか分からない、ということで世界的に有名なKaggleで手を動かしてみることにしました。
この記事はそんなデータ分析に疎い人がKaggleを始めたよという自分の忘備録を兼ねた記事です。
1.Kaggleに登録し、最初のコンペに挑戦
まずはKaggleに登録しました。
英語が多く何が何やら分からないので、Kaggleのスタートガイド等の記事を探し、登録することをおすすめします。
登録後、Kaggle始めたての人におすすめなコンペとしてタイタニックがあったので、挑戦してみました。
しかし…
提供されているデータはあるけど、どのように分析すれば良いか分からない。
統計の学習で決定木分析などの分析手法があることは知っていたが、どういった手順で分析していくかは全く分かっていなかった。
そこで、以下のサイトを参考に手を動かしながらタイタニックの分析を行った。
【データ分析の基本】KaggleのTitanicを体験しよう!
とても参考になりました。
結果、実際にコンペに提出することができました。
最初はハードルが高いと思うので、参考サイト等見ながら手を動かすのも良いかもしれません。
まとめ
最初はデータ分析と言っても何をすれば良いか分かリませんでした。
ただ、手を動かしてみると何をしてるかが少しづつですが分かってきました。
まだまだ長い道のりですが、これからもKaggleコンペに取り組んでいこうと思います。