見出し画像

悔しー!!【DATA HIKER】への道 第2回、開催報告と次回テーマ

1. 前回の驚き: KaggleのTitanicでの成功

前回、KaggleのTitanicデータセットを使用したとき、私たちは1万位以内という驚きの結果を収めました。

特に中村さんは2000位以内に見事ランクイン。

その成功を受け、今回はSIGNATE提供の弁当需要予測に挑戦を決意。
しかし、第二回の結果は前回ほどの喜びをもたらしてはくれませんでした。

2. 今回の挑戦: Dataikuと弁当の需要予測

SIGNATE提供の弁当需要予測は期日無制限のコンテストで、興味深いストーリーが伴っています。

https://signate.jp/competitions/24

Dataikuはやっぱり、扱いやすいツールであり、ドラッグアンドドロップやPythonコードを利用してデータ整形を行いました。

期待するようなモデルの精度は得られませんでした。
勉強会としての学びはありましたが、スコアが低い結果はやはり悔しい。

3. 学びの深化: ツールの本質とは?

勉強会終了後のディスカッションで気づかされたこと。
そして僕らは知っていたはずなのですが…

ツールが便利でも、それだけでは高い成果は得られないということ。

TableauやSnowflake、BigQueryなどのサービスも同様。
大切なのはそのツールの深い知識、そしてその分野自体に関する学習です。私たちの次のステップは、データサイエンスの基礎知識をさらに深めることが明確になりました。

4. 次への展望: Dataikuを通じてデータサイエンスを学ぼう

次回はコンテスト参加に関する重きよりも、
「Dataiku を通じてデータサイエンスを学ぼう」
というテーマで開催します。

1. KaggleでDataikuを使って、上位を獲得する。
2. SIGNATEでDataikuを使って復習しながら、残念ながら下位となる。
3. やっぱりDataikuを使って、データサイエンスを学んでいきたいね。

となる。運営MTGのディスカッションを行って、
「そういえばあの方、Dataikuを利用して、データサイエンティストとして活躍されてた…!声かえてみよう!」
と不思議にアイデアもどんどん飛び出す。だからUpskillingは面白い。

次回の日程については、リカさんからのアップデートをお待ちください。
最後に、今回の結果は悔しかったですが、その気持ちを力に変えて次回に臨みたいと思います。頑張ろう!

最後に、SIGNATEさんコンペ環境すごく使いやすかったです。
本当にありがとうございました!


いいなと思ったら応援しよう!