
DAY2 本日のインプット・Nishikaのコンペ出場結果
#100日後にデータアナリストになるえいこ DAY2です。
本日のインプット
すみません早速ですがDAY1のインプットの報告です(自己紹介して終わってました)
・N予備校 機械学習入門コース Python基礎講座 5~8章
こちらで基礎的なことを学び始めました。色んなスクールがあるんですけど、どれがいいのか結局よくわからず(笑)
評判のよかったN予備校にしてみました。
機械学習入門コースは以下の3章で成り立っています。
①Python基礎学習コース…16章
②数学…3章
③機械学習入門コース…26章
全部で45章あります。いまのところ1章がだいたい15分ぐらい。とりあえずこちらで基本的な操作はポチポチとやってみてます。
Nishikaのコンペに出場してみました
実は、この #100日後にデータアナリストになるえいこ をスタートする前にいきなりコンペに出場してみました。無謀!(笑)
挑戦したのは「リチウムイオン電池の充電率予測」
ドメイン知識があるからもしかしたらいけるかも…と高をくくりトライしました。
結果、597人中207位…
でもデータを提出できただけでも自分、すごい!!(笑)
ドメイン知識があると言ったけど、結局やった方法は線形近似しただけです。
お題は、バッテリーの充電率予測をすること。
私がやった方法は以下です。順位が低すぎて誰の参考にもなりませんが(笑)
・Excelでtestデータを開く。全データ数が開けないので500桁ぐらいまで使う。
・SOCに影響する温度、各時間のSOCはいったんマル無視。SOCと電流(Ah)で傾き(SLOPE)を取る。
SOC=a*Ah+100
とするとa=38.48276…と定数が出てきます。
・この一次式を使い、Pythonで全データにぶち込みました
ドメイン知識ゼロ!別に全然電池の知識使ってない(笑)
今回のコンペをやってみて、N予備校の講座をやってるだけじゃ自分で解析できるようにはならないんだなと痛感。ある程度のスキル(文章でいうところの平仮名が書ける、単語が書けるレベル)になったらどんどん実践した方がいいのだとわかりました。
今回初めてコンペというものを検索したぐらい、初心者なんですが、ディスカッションという項目を見ると、自分のやった方法を公開してる人がいるんですね。
例えば私の場合、今回線形近似を用いたんですが、線形近似で解析をして上位に食い込んでいる人もいました。この人の解析の仕方を見るととても参考になります。
こうやって習字の手習いのように、上手に解析している人を真似するところから始まるんですね。勉強になった…
明日もがんばります~