見出し画像

機械学習勉強まとめ

こんにちは。Ktrainです。
今日は、機械学習について昨日勉強した内容をまとめたいと思います。

自分の備忘録の側面が強いので、かなり説明は煩雑ですが、見ていただければと思います。
良ければ、コメント、スキお願いします。

初めに断りますが、この記事は、備忘録が含まれていますので、
誤り等あるかと思います。指摘して欲しいです。また、参考文献を貼りますので、ご自身でご確認ください。

本日のテーマ

半教師あり学習とは?

半教師あり学習の前に、教師あり学習と教師なし学習についてまとめます。

教師あり学習は、その名前の通り、正解データがあり、訓練データを元に、正解データを予測するものだと考えています。

そして、半教師あり学習は、半分教師あり、半分教師なしの認識を持っています。

ωという値を用いる事で、学習回数が少ない時は小さめ、学習が大きくなった時に大きめの値をとるパラメータです。
これによって、初めのうちは、教師ありデータを元に学習し、いずれは、教師梨学習を元に学習するというものらしいです。

以下、参考文献です。
最新版では、FixMatchというものがあるそうです。

https://scholar.google.com/scholar?hl=ja&as_sdt=0%2C5&q=FixMatch&btnG=#d=gs_qabs&t=1650622111052&u=%23p%3DSaCln84WFHUJ


カットオフ値とは?


カットオフ値は、分類問題においてどこを閾値にするのかどうかという事だと認識しています。
ROC,AUCとの関連性が強そうです。
とにかくミスを減らしたい場合、結果の偏りを減らしたい場合は、0.5に設定する。
とにかく陽性を検出したい!陰性の有無を問わない!という場合は、どちらかに偏ったカットオフ値を設定すると良いそうです。

以下、参考文献です。

https://dataanablog.com/cutoff%ef%bd%9chow-to-use-more-than-one-threshold/
https://dataanablog.com/cutoff%EF%BD%9Chow-to-use-more-than-one-threshold/


クロスエントロピーについて


クロスエントロピーは、平均二乗誤差:MSEと同じ損失関数の1つです。

利点としては、自然対数eを含んでいるので、計算量の観点から、よく使われる最適化アルゴリズムのSDG;確率的勾配降下法と相性が良いそうです。

以下参考文献です。


転移学習、ファインチューニングについて


これに関してですが、深い意味で理解できていないので、これから理解しようと思っています。

要するに、計算されたモデルを用いて、早く、的確に制度を予測するものだと考えています。

参考文献を貼っておきます。ご覧ください。



ViT;Vision Transformerについて


こちらは、Transformerという最近話題になっているモデルの紹介です。
これから勉強しようと思っているので、こちらを参考に頑張って勉強しようと思っています。

参考文献です


その他面白かった記事


ここからは記事と内容のコメントのみになります。
是非読んでみてください。

・姿勢推定を元に、OpenPoseを用いて、姿勢が悪くなった時にslackに通知を送るサイト


・最適化アルゴリズムについて死ぬほどわかりやすく書かれている記事


・深層学習のわかりやすい最適化アルゴリズムの紹介

・Variational Autoencoder;VAEの解説記事


いかがでしたか。
ちょっと適当になってしまいましたが、是非各サイトを訪れてみてください。

またまとめますね。

では

2022年4月23日

この記事が気に入ったらサポートをしてみませんか?