![見出し画像](https://assets.st-note.com/production/uploads/images/153983593/rectangle_large_type_2_1ad75a0dc560062accf59c21d2fe3fde.png?width=1200)
機械学習勉強日記#6-混同行列と正解率
今回は2つのテーマについて解説をします。
本当にこのモデルは使えるのか?
ということは判断してくれる内容となっているので
ぜひ覚えてみてください!
それでは行きましょう。
混同行列
分類問題で出力されたクラス分類の結果をまとめた行列(表)
となっています。
混同行列、言葉の通り条件が多くて迷ってしまう内容なので
図と例を使って解説します。
下の表はインフルエンザの結果を表している混同行列です。
![](https://assets.st-note.com/img/1726060936-vcHlMDGY9df7AJOeUhtV4y12.png?width=1200)
条件はそれぞれ4つ
正の陽性:検査で陽性、実際にインフルエンザである(TP)
正の陰性:検査で陰性、実際に健康である(TN)
偽の陽性:検査で陽性だが健康である(FP)
偽の陰性:検査で陰性だがインフルエンザである(FN)
それぞれの項目に分類されることでモデルの結果を確認します。
正解率とは
機械学習のモデルを評価する1つの指標
モデルの全予測に対する正しい予測の割合です。
さっき見たグラフに数値をあてはめると
こんな感じの値になります。
![](https://assets.st-note.com/img/1726061939-lpaYMDV5O6qX0AuCci8bKPGm.png?width=1200)
正解率はすべての値の合計値
つまり (900+50+30+20)
これらで正解の合計を割って (900+50)
900+50÷900+50+30+20=95%
となり、
このモデルの正解率は95%であるとわかります。
医療のモデルとして扱うときには注意が必要で、
正解率が95%であっても結果が陰性で実際はインフルエンザ
の場合があり、モデルのパフォーマンスを測るうえで、
常に優先度を高くする方法ではないということを覚えておきましょう。
おわりに
最後まで読んでいただきありがとうございます。
今回は少し複雑な内容でしたが覚えらましたか?
機械学習をするうえで、モデルの状態を把握し、適切な評価をすることが重要なのでぜひ知識として身に付けてみてください!
次回もAIについて学んでいきましょう。