見出し画像

kaggle、、、SIGNATEから始めます

4.これから挑戦したいコトやモノ

  • AIプログラミング(私の代わりにバリバリ働く相棒を自作したいw)

  • 機械学習とデータサイエンス

  • kaggleでメダルをとってexpertになりたい

  • G検定(単純に会社の手当と勉強の両得) ’23年5月に達成!!

  • E資格(単純に会社の手当と勉強の両得) ’24年3月に達成!!

  • 今更ですが情報学部系の大卒資格が欲しい(元々短大卒なので3年次編入で)

  • 上記スキルの実践として副業したい

  • ロードスター欲しいーーー(趣味的な話) `24年4月に達成!!

  • 新しいシム用ペダル欲しいーーー(趣味的な話)

挑戦したいリストの一つ、前回は「ロードスター欲しい」を実現しました。
今回はworkスキル寄りの話しに戻って、kaggleコンペに取り組みます。

kaggleでアカウント作って、定番のタイタニック生存者予測とか住宅価格とかのチュートリアルコンペを他のサイトなどでも情報収集しながらやってみみて、テーブルデータ系のランダムフォレスト、XGB、LightGBM、これらのアンサンブルなどを一通り試したりすることができ、良いアウトプット経験にはなりました。
おかげで難なくcontributorにはランクアップしましたが、expertになるためには、本格的なコンペでメダルを取らなければいけません。

がしかし、ここから各段に難易度が上がりました。
まず、当たり前ですが全て英語の為、いちいち内容の理解に時間がかかります。
どんなコンペなのか?何が目的なのか?ルールは?提供されるデータは?提出物の形態、評価指標などなどゲームを始める前のルール理解が???の状態に陥りました。
さらに与えられるデータはそのままでは当然使えません、欠損値、意味不明な業界用語的な項目、明らかな異常値、項目数が多すぎてデータ構造の理解も大変、機械学習はデータ前処理が業務の大半を占めると至る所で見て聞いていましたが、これはマジだなと素人ながらに感じました。
ディープラーニング系のモデルで全て解決できる訳ではないと思いますので、特徴量エンジニアリングもちゃんと覚えないかんです。

と言う事で、早速kaggleは一旦封印ですw
まずは不慣れな英語の環境を一旦おいといて、機械学習コンペに集中できる国内コンペのSIGNATEでexpertを目指す方針に切り替えです。これがアジャイルです。たぶん

この記事が気に入ったらサポートをしてみませんか?