悔しー!!【DATA HIKER】への道 第2回、開催報告と次回テーマ
1. 前回の驚き: KaggleのTitanicでの成功
前回、KaggleのTitanicデータセットを使用したとき、私たちは1万位以内という驚きの結果を収めました。
特に中村さんは2000位以内に見事ランクイン。
その成功を受け、今回はSIGNATE提供の弁当需要予測に挑戦を決意。
しかし、第二回の結果は前回ほどの喜びをもたらしてはくれませんでした。
2. 今回の挑戦: Dataikuと弁当の需要予測
SIGNATE提供の弁当需要予測は期日無制限のコンテストで、興味深いストーリーが伴っています。
https://signate.jp/competitions/24
Dataikuはやっぱり、扱いやすいツールであり、ドラッグアンドドロップやPythonコードを利用してデータ整形を行いました。
期待するようなモデルの精度は得られませんでした。
勉強会としての学びはありましたが、スコアが低い結果はやはり悔しい。
3. 学びの深化: ツールの本質とは?
勉強会終了後のディスカッションで気づかされたこと。
そして僕らは知っていたはずなのですが…
ツールが便利でも、それだけでは高い成果は得られないということ。
TableauやSnowflake、BigQueryなどのサービスも同様。
大切なのはそのツールの深い知識、そしてその分野自体に関する学習です。私たちの次のステップは、データサイエンスの基礎知識をさらに深めることが明確になりました。
4. 次への展望: Dataikuを通じてデータサイエンスを学ぼう
次回はコンテスト参加に関する重きよりも、
「Dataiku を通じてデータサイエンスを学ぼう」
というテーマで開催します。
1. KaggleでDataikuを使って、上位を獲得する。
2. SIGNATEでDataikuを使って復習しながら、残念ながら下位となる。
3. やっぱりDataikuを使って、データサイエンスを学んでいきたいね。
となる。運営MTGのディスカッションを行って、
「そういえばあの方、Dataikuを利用して、データサイエンティストとして活躍されてた…!声かえてみよう!」
と不思議にアイデアもどんどん飛び出す。だからUpskillingは面白い。
次回の日程については、リカさんからのアップデートをお待ちください。
最後に、今回の結果は悔しかったですが、その気持ちを力に変えて次回に臨みたいと思います。頑張ろう!
最後に、SIGNATEさんコンペ環境すごく使いやすかったです。
本当にありがとうございました!