【11/12開催】Dataikuでデータコンペに参加する会#5 11/24 Data Hikerイベント予習 Kaggle"従業員の退職予測"に挑戦!
こんにちは! #Dataiku ユーザー会企画メンバー、Data Haiker Rikaです!
お弁当の需要予測に取り組んで早4回目。
・課題の理解は大事!
・特徴量エンジニアリングには、「仮説」が不可欠!!
・事前のデータ探索はやっぱり大事!!!
というわけで、第4回では、データ探索ともくもく作業を行いました!
前半:グループディスカッション
お弁当屋さん・購入者の立場に基づいて、問題文やチュートリアルを改めて見直し、仮説を議論。Tableauも駆使してデータを探索。
・そもそも売上って全体的に下がってたんだね。
・お楽しみメニューって、売上数が「跳ねる」特性があるね。
・お楽しみメニューって、最初からあったわけじゃないんだ!
・予測したいのは通年ではなくて、10月、11月の2か月分だけなんだ。
・人気メニューかどうか、って大事じゃない?
・通年を期間で区切って、重みづけってできないのかな?
など、の気づきを得て、
後半:グループディスカッションでの気づきを反映したフローを作成。得られたアウトプットをSignateに投稿
・日時のデータを、年・月・日に分解、特徴量に含める
・人気メニュー(平均よりも売り上げの高いメニュー)にフラグを付ける
・カレーにフラグを付ける
・お楽しみメニューにフラグを付ける
など、気付きをフローに実装しました。
Dataikuの操作に四苦八苦して、ホストの私は投稿までたどり着けませんでしたが、参加者の中には、人気メニューやお楽しみメニューのフラグを実装し、スコアアップに成功した方も!
引き続き、「どうやったら、この時系列での減少をうまくモデルに伝えられるのだろうか?」「どんなモデルが最適なのだろうか?」など、改善の余地はありつつも、次回から、Data Haikerは新たな課題に取り組みます!
テーマ
11/24 Data Hikerイベント予習 Kaggle"従業員の退職予測"に挑戦!
11/12(日) 10:00 ~ 12:00ごろ
・オンライン開催 ※時間になったら適宜入場ください!
Google Meet URL
https://meet.google.com/xsz-asqo-xna
お題
Kaggle 退職者予測
SE NanaeさんからのTips!
最初に自分でSplitして、モデルを作るデータとスコアリングするデータに分ける
スコアリングするデータに正解の列も存在しているので、ScoreではなくEvaluateのレシピを使う
やること
11/24(金)Dataikuさん主催のハンズオンイベント 第二部 15:15-16:45のData Haikerチャレンジのお題の予習をします!(鳥越 希氏/株式会社キーウォーカー データサイエンス部 チームリーダーによるゲストトークもあるとのこと!専門家から直接学べるのは貴重ですね!)
環境:Dataiku無料版を使用します!
まだダウンロードしていない方はこちら↓から!
無料版はフリートライアルと異なり、ずっと無料で使用できます。
課題の各種告知は イベントホストのX(Twitter)で積極発信中です!
マエスhttps://twitter.com/maes_data
Rikahttps://twitter.com/Rika_Olga_F
当日みなさまとお会いできることを楽しみにしています!
ホストもDataikuを始めたばかり。Data Haikerとして一緒にポップに楽しくアップスキルしましょう!
どんな会なのかな?と気になる方へ
これまでのイベントのレポートやお役立ち情報をマガジンにまとめています。御覧ください!
Dataikuは初めて…
初心者の方には、Dataikuさんが不定期に開催している、公式のハンズオンイベントがオススメです。本職のセールスエンジニアさんが、丁寧に解説してくれます!
独学希望の方は、Dataikuの初心者向けラーニングパス・認定資格、「コアデザイナー」を目指すのがおすすめですよ!
Dataikuって、説明会とかイベントってやってるの?→最近すごいです。
各種イベント情報は、↓のTableau Publicのリンクより。
直近のイベントスケジュールが、がTableauで機能的に可視化されていてわかりやすいです!
Dataikuの操作、気になる事、聞きたいなぁ。→公式コミュニティのJapan User Groupでの質問がオススメ!
日本語で質問OK! 質問・情報共有自体が、User Groupの盛り上がりに貢献します。どんどん質問していきましょう!
Dataikuって、日本語対応してないって聞いたんだけど…
Dataikuコミュニティに、日本語化の要望が上がっています。
日本語版が欲しいよ!という方は、是非↓のリンクからログイン後、↑(やじるし)マークをクリックして、Vote(投票)しましょう!
日本の熱いローカライズ要望よ、届け!
Dataikuについてもっと知りたい方へ
Data Haikerって何?という方へ