Kaggleのチュートリアル第4版を書きました。pdf版9/20公開、紙版は9/22技術書典で頒布します
Kaggleのチュートリアル第4版書きました🎉🎉🎉
Kaggleを全くやったことがない人のための同人誌です。
メインコンテンツは、初心者向けのタイタニックコンペというコンペのデータの概要を理解して、LightGBMという強いアルゴリズムを使って予測してみるという内容の本。
版を重ねるに連れて付録の内容も増え、今回は付録に私の失敗談を追加し、124Pというページ数になりました。
最近のKaggleのサイトの更新にも対応しています。
pdf版はnoteで9/20公開予定(第3版のページに追加します)。紙版は9/22技術書典で販売します。私のサークルはく14Dという場所ですので、是非立ち読みにもきてくださいね。
以下ではもう少し詳しく説明します。
目次
第1部
-第1章 Kaggleについて
-第2章 コンペのページの翻訳など
-第3章 まずは、サブミットしてみる
第2部
-第4章 タイタニックデータの概要
-第5章 LightGBMでのタイタニック
付録
-A pandas-profilingでのEDA
-B LightGBMについての補足説明
-C Santander Value Prediction Challangeで金メダルを獲得しました
-D HomeCreditコンペ銀メダルを獲得するために行ったこと(寄稿)
-E PetfinderコンペValidationの失敗談
-F Kaggleの称号と用語集
-G データ分析の勉強方法
-H kaggleに9ヶ月取り組んで学んだこと
もっと詳細な目次は次の画像で。
第3版からの更新したこと
・Kaggleのサイトの変更 (KernelがNotebookに変更やUIの変更等) に対応
・第5章と付録Bを更新 (Light GBM Interfaceでの説明をメインにし、scikit-learnを介した使い方は付録B.4での説明に変更)
・付録EのPetFinderコンペでのValidationの失敗談を追加
・まえがき、あとがきを更新 など
技術書典
9/22は技術書典ですが、今回は初めての2フロアでの開催ということで、どのような状況になるのか。
これまでは自分も書いたい本を買いにも回っていたのですが、今回は諦めました。
多分ワンオペなので、ずっと自分のサークルにいたいと思います。
前回は15時に完売してしまったので、今回は多めに印刷したのですがどのようになるのか。
それではよろしくお願いします。