【Kaggle初心者向け】 タイタニックによるKaggleチュートリアル。爆速でsubmissionするまで。
はじめに
※この記事は、爆速でKaggleのタイタニックに一連の流れの書いたプログラムから作成される提出用のcsvを提出するまでの記事で、Kaggleにとりあえず触れてみよう!的な内容です。また対象読者は、Kaggleにチャレンジしたことがなく、PythonやNumPy、Pandas、Scikit-learnを少しでも触ったことがある方を対象にしています。全くPythonを触ったことがない方は少々理解できない部分がありますので、後述するAI Academy(エーアイ アカデミー)などを利用して勉強して頂けたらと思います。(2019年2月2日現在、ほとんどのコンテンツが無料で利用できます。)
簡単な自己紹介。
AI Academyを開発・運営しております、サイバーブレイン株式会社代表の谷です。最近は趣味でKaggleを通じてデータ分析してたりしてます。
もともと、ベンチャーを大学時代に創業し、CTOとして3年間スマホアプリのバックエンド開発(Web API作ったりAWSでインフラ周り整えたり)や機械学習やデータ収集、SQLでデータ分析などやってました。2016年に、AI Academyを運営するサイバーブレイン株式会社を創業して今に至ります。
創業して2年ほどで個人で2000名の方々にPythonや機械学習などを教えて来まして、以前こんな記事も書いてますので、よければ見てみてください。
【保存版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法
ですが、今では会社を運営したり、AI Academyの開発のためのコードを少し書いたり、機械学習などを教えたりなどがメインなので、KagglerやAIエンジニアが本業ではないので、その点はご了承ください。
Kaggleとは
Kaggle(カグル)は、世界中のデータサイエンティストが機械学習のコンペに参加し、最適モデルを競い合うサービスですが、最近Kaggleが日本でもやっと少しずつ広まって来て、良い流れだなと感じてます。
ですが、まだまだ多くの方が、『挑戦するにはまだはやいかな。。』、『難しそうでまだKaggle出来てません。』などと良く聞きます。
そこで、とりあえずはKaggleのタイタニックをテーマにデータ分析の一通りの流れを掴んでもらい、この記事からKaggleを挑戦してもらえたらなと思います。
今回題材にするのが『タイタニックコンペ』です。
このタイタニックのコンペは、Kaggleのチュートリアルコンペであり、タイタニックの乗船者の生死を予測するというコンペになります。
この記事で学ぶことは、タイタニックの乗船者の生死を予測し、提出ファイルをKaggleに提出することです。
ここから先は
¥ 500
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?