見出し画像

バギング・ブースティングとは?~G検定頻出用語

いつも読んでいただきありがとうございます✨
本日もG検定で良く出題される用語をイメージできるように参考となる動画サイトを紹介していきたいと思います。


新シラバス上の分類

・本日紹介するバギングとブースティングは教師あり学習の中のアンサンブル学習で登場する手法です。
・新シラバスでは機械学習の概要のカテゴリに含まれております。

説明動画紹介

・スタビジで解説されている誤差逆伝播法の紹介がわかりやすかったので
紹介いたします!

動画サマリー
・バギング(Bagging)とブースティング(Boosting)は、どちらもアンサンブル学習の手法ですが、それぞれ異なるアプローチと目的があります。

・バギング
- 並列的な学習:バギングでは、同じ学習データから無作為にサブセットを抽出し、それぞれのサブセットで独立したモデルを訓練します。これにより、複数のモデルが同時に学習され、最終的な予測は各モデルの出力を平均や多数決で集約します。
- バリアンスの低減各モデルが独立しているため、全体の予測のばらつき(バリアンス)を抑えることができます。これにより、モデルが特定のデータセットに過剰適合するリスクが減少し、より安定した予測が可能になります。
- 例:ランダムフォレストはバギングの典型的な実装です。

・ブースティング
- 直列的な学習:ブースティングでは、最初のモデルが学習した後、そのモデルの誤りを修正するために次のモデルが訓練されます。各モデルは前のモデルの弱点を克服することを目的としており、誤分類されたデータに重みをつけて学習します。
- バイアスの低減:モデルが逐次的に学習を行うことで、全体の予測精度が向上し、バイアスを小さくすることが可能です。特に難しいデータに対して高い精度を発揮します。
- 例:XGBoostやLightGBMは、ブースティングの代表的な手法です。

・まとめ
- 構築の方式:バギングは独立したモデルを並列に訓練するのに対し、ブースティングは依存関係を持ち、逐次的にモデルを構築します。
- 目的:バギングはバリアンスの低減を目指し、ブースティングはバイアスの低減を重視します。一般的にはブースティングの方が精度が高いものの、学習に時間がかかります。

スタビジ

・スタビジさんは上記内容を6分の短時間でまとめて解説してくれています!

・アンサンブル学習は他にスタッキング等の手法もありますが、G検定ではバギングとブースティングの頻出割合が高いので、まずはこの2つをしっかり押さえるようにしましょう!

以上本日はバギングとブースティングのについてわかりやすく解説している動画を紹介いたしました。読んでいただきありがとうございました📝


いいなと思ったら応援しよう!