G検定 予測結果の評価尺度 #2
株式会社リュディアです。G検定対策として機械学習の評価尺度についてまとめたいと思います。予測結果の評価尺度 #1 の続きです。
予測結果の評価尺度 #1では〇×を使って用語のまとめのみを行いました。今回は〇×ではなくG検定公式テキストで使う用語でまとめていきます。まず混同行列からです。
予測値、測定値のとりうる値を陽性(Positive)、陰性(Negative)とします。予測値、測定値のそれぞれが陽性、陰性をとりうるので組合せの数は 4 になります。表中の青い箇所は予測値と測定値が一致した場合、灰色の箇所は予測値と測定値が不一致であることを示しています。
4 つのとりうる組合せにはそれぞれ名前がついています。名前と内容が一致するようにしっかりと理解してください。予測した値が陽(Posivie)陰(Negative) のいずれか、それに対して結果である測定値が真(True)、偽(False)のいずれか、という情報を基準として用語が定義されています。たとえば陽(Positive)と予測して偽 (False) の場合は偽陽性、False Positive となります。また数式を記載する際に略語を使いたいので False Positive は FP と記載します。他も同様です。一度意味を理解すれば複雑ではありません。この機会にしっかりと理解してください。以下の表も参考にしてください。
では性能指標について予測結果の評価尺度 #1 でまとめた順番にしたがってみていきます。各々に対して混同行列と数式を記載しています。混同行列のどの部分を扱っているのかを示すため、数式の分母を緑枠、分子を赤枠として示しています。
正解率
陽性、陰性にかかわらず正解であったものの確率です。
適合率
陽性を予測したうち、測定値が陽性であったものの確率です。予測値を基準として陽性の判別能力がどれだけあったかを見ます。
陰性的中率
陰性を予測したうち、測定値が陰性であったものの確率です。予測値を基準として陰性の判別能力がどれだけあったかを見ます。
再現率
測定値が陽性であったとき、予測値が陽性であったものの確率です。測定値を基準として陽性の判別能力がどれだけあったかを見ます。
特異度
測定値が陰性であったとき、予測値が陰性であったものの確率です。測定値を基準として陰性の判別能力がどれだけあったかを見ます。
今回は予測結果の性能指標についてまとめてみました。具体的な計算を要求される問題を含めG検定では頻出です。しっかりと理解してください。
では、ごきげんよう。