🌟Kaggleのコンペティションと1日1時間の取り組みの重要性について
子育てや普段の仕事があると、どうしても自分のための学習の時間、例えばKaggleなどのコンペや資格の勉強などを独身の時と比べると確保できない実情があり、制限時間の中でどれだけパフォーマンスを出せるか、と言うテーマに興味がありました。
この記事は、Kaggleのコンペティションにおいて、1日1時間の取り組みでどれだけの成果を上げることができるかについての実験報告です。ほぼ原文記事の和訳ですが、備忘録のために記事として残します。ほとんど和訳です。
⏰記事の要旨
目的
- 1日1時間の取り組みでKaggleのコンペティションにどれだけ効果的に参加できるかを検証。
方法
- Humpback Whale Identification Challengeに参加し、1日1時間の制限時間でモデルを訓練。
ツール
- 実験にはW&B(Weights & Biases)を使用し、モデルのトラッキングと可視化を行った。
結果
- 1日1時間の取り組みでも、効果的な学習が可能であることが確認された。ランキングは上位25%に到達。
📝結論
キーワード
Kaggle, コンペティション, 1日1時間, W&B, データ拡張, 転移学習, アンサンブル学習
なぜこの取り組みを開始したのか
ルール
セットアップ
🧮計算リソース
- Google Colab + Kaggleカーネル(~30時間/週のGPU時間(コーディング時間ではありません!)
📓ジャーナリング
- Notionのページ(上の図を参照)には、やることリスト、日々の日記のセクション、参考文献のセクションがある。
🪛ソフトウェアリソース
- PyTorch、FastAI(最終的には)、Weights & Biases
☕その他
- たくさんのコーヒー
- 毎日60分で止めるポモドーロ式タイマー。
各週の取り組み
1週目の取り組み
2~3週目の取り組み
4~5週目の取り組み
6~7週目の取り組み
8~9週目の取り組み
結果
(記事の筆者が)学んだこと
所感
全体的な感想
これだけ頑張って、銅メダルか・・・険しい道のりKaggle
計算リソースの制約はやはりあるらしい。潤沢なGPUを持っていれば削減できる学習時間や試行できるパターンも増える
wandbで効率的な実験管理ができれば、限られた時間でも効果的に成果を残すことができる
1日1時間でも、毎日続けることが重要
自分がやった手順を残して再現性ある形で文書化している点が素晴らしいと思った
新しい論文を読んだり複雑なモデルの実装に挑戦したりというフローは時間効率があまり良くない。既存のモデルで十分試して、時間が余ったらそういう新規性の高いことに時間を使う
手順についての感想
気になったツール
参考文献
chatgptに聞いてみたシリーズ
fastaiをKaggleで生かすためにはどのような使用方法が考えられますか?