記事一覧
9/19 kaggle本 2章
久しぶりです。kaggle本が届いたので、一通り見てみましたがめちゃめちゃわかり易くてびっくりしました。データ分析コンペに参加する人はみんな読んだ方が良さそうです。
第2章の要約です。最後の方はまだ読んでません。
参考にしたのは以下のslideshareです。
https://www.slideshare.net/meownoisy/kaggle-2-191950766
第2章タスクと評価
9/14 交差検証法、KFold法、SHAP
9/14に学んだこと。備忘録用。
モデルの評価方法ホールドアウト法と交差検証法の2種類ある。
ホールドアウト法はデータを学習データとテストデータに分ける。そして、学習データで構築されたモデルをテストデータで検証する。
めちゃめちゃシンプルだが、データ数が少ない時は、たまたま学習データで作ったモデルの評価が高くなってしまう可能性がある。同時に学習データの母数が少なくなり、正確なモデルを構築できなく
怖いのは幽霊じゃない。世の理だ。
昨日、真夜中に目が覚めてしまって、お手洗いに行っている時に思った話。
今では幽霊が全く怖くなくて、なんなら存在しないのではないかとすら思っている。
だけど、確かに子供の時は幽霊が怖かったし、トイレになんか怖くて行けなかった。
じゃあどうして今は行けるようになったんだ。幽霊のことを信じなくなったからだ。(厳密には信じているかもしれないけど、軽視するようになった)
じゃあどうして軽視するように
9/13 学んだこと
重回帰分析とラッソ回帰&リッジ回帰の違い
両方とも同じことは、予測値と目的変数の二重誤差を最小にするように回帰係数を推定すること。
ラッソ回帰&リッジ回帰はそれに加えて、その回帰係数自体を小さくするように推定する。回帰係数が大きい状態っていうのは、少しのインプットでaプットが大きく変わってしまうっていう状態のこと。データ分析においてこれは避けるべきだよね。っていう。
決定木の内容理解
説明
こんにちは(思考の軌跡1)
最近思ったことを綴ろうと思います。
twitterをやっているんですが、気づいたのは
ある任意の界隈では、その界隈の用語を知らないとある意見を主張した際に、「それってそうじゃなくて、○○(界隈用語)ですよね。そのように言った方が良いかと。」みたいな反駁のされ方が散見されているということです。(これは、自分がそうされたわけじゃなくて、フォローしている人がある有名人のツイートにそうリプライしているの
コロナウイルスに対応したメンタルヘルスサービス
みなさん、こんばんは。
投稿に間が空いてしまい、本当に申し訳ありません。
実は最近積読を解消しようと思って色々と本を読んでいました。
「原因と結果」の経済学は面白いので、ぜひ読んでみてください。
今はIGPI流経営分析のリアル・ノウハウを読んでいます。これ、読んだら今話題のstartupsを読む予定です。
さあさあ、海外スタートアップ分析をやりましょう。
制限時間
22:35-23:15
Amazonビジネスを「ハック」する
久しぶりです。
長らく時間が空いてしまってごめんなさい。
昨日英会話で話したパキスタン人の英語があまり聞き取れなくて悲しかったのでやります。
制限時間
12:11-12:40
企業名
THRASIO
説明thrasioはamazonのFBA(fulfillment by Amazon)ビジネスを最速で加速させる会社である。FBAとは、Amazon.co.jpによると「Amazonの世界屈指の
COVID-19 will permanently change consumer behavior(大意和訳)
こんにちは。
突然ですが、今日からコンサルティングファームの英語レポートも和訳していこうと思います。
っていうのは、自分は趣味でprtimes(各企業のプレスリリース掲載サイト)を見るんですが、昨日コンサルティング会社のレポート見てると、「あれ?これ、ちゃんと読むと英語の力つくんじゃない?」って思ったからです。
今日はそのたまたま見つけた企業のレポートを和訳するのですが、手応えがあれば他のもやって