ファイナンス機械学習:標本の重み付け クラスの重み付け

少数しか存在しないラベルを補正する重みをクラス・ウエイトである。最も重要なクラス(イベント)がまれにしか現れない時、これをそのままにして扱うと外れ値としてスルーしてしまう場合に重要な手続きである。
 sklearnにはある特定のラベルjに属する標本に重みをつけ、jの正解率を高くすることができる。金融分野では、標準的なラベルは$${\{-1,1\}}$$の2択で、一方のクラスが他方のクラスより高い正解率で分類したい状況には当てはまらない。よって、class_weight='balanced'と指定する。class_weight='balanced'は、in-bagのブーストラップ標本に適用されるので、バギングを使用するならば、class_weight='balaned_subsample'の方が良い。

いいなと思ったら応援しよう!