scikit-learn機械学習⑯アダブースト実践編
前回は、アダブーストの理論的な側面を紹介しました。今回は、scikit-learnを使って簡単な実験を行います。
今回使うデータセット digits は数字の画像データです。各数字は、8x8ピクセルの画像で、ラベルは0から9までの10個のクラスになります。
以下は、digits からのサンプル画像です。
このような画像を scikit-learnの AdaBoostClassifier で分類します。
まず、いつものように探索的なデータ分析を行います。次に、データセットを訓練データと評価データに分割し、訓練データにモデルをフィットさせます。そして、評価データでモデルの性能を吟味します。
今回は、画像データが特徴量となっているのでいつもとは少し勝手が違います。また、ディープラーニングのような畳み込みを使うわけでもありません。
さて、アダブーストは、弱学習器によるアンサンブル学習の一種であるブースティングのアルゴリズムを使っていますが、画像分類において良い結果を生み出すことができるでしょうか。
この記事が気に入ったらサポートをしてみませんか?