見出し画像

【図解】2値分類:混同行列

データサイエンティスト検定の学習で出てきた「混同行列」の各指標をまとめました。

教科書から引用した表に、「適合率・再現率・正解率がどこを見ているか」を角丸四角形で図示しました。実測値を縦軸、予測値を横軸に取っています。画像検索してみた限り、縦軸・横軸の割り振りにスタンダードはなさそうです。


混同行列では、左上から右下へのナナメのライン(緑)が重要そうです。予測値と実測値が一致している要素群になるので。

予測モデルの評価に使う考え方なので、予測値(横軸)の陽性・陰性が各要素に引き継がれるような見え方になります。2値よりも多いクラス数の場合だとわかりやすいですね。以下は、画像を4種類に分類するモデルにおける、パンダの予測精度についての混同行列です。

予測も実測も評価対象(パンダ)ではない要素は、すべて真陰性(TN)になるのが特徴的。例えば「トラだと予測したがクマだった」ケースは、モデル全体の精度としてはマイナスですが、パンダの予測精度に対しては影響がないと見なすためですね。パンダ以外は眼中にない人だと思えばわかりやすい。


一方、一般的な2×2マトリクスでは、左上と右下には共通点がなく、対照的なペアになることが多い印象です。


混同行列は、今まで見たり作ったりしてきたマトリクスとは少し考え方を変えて見る必要があると感じました。


#図解 #最近の学び #マトリクス #混同行列 #2値分類 #データサイエンス #データサイエンティスト #DS検定

この記事が参加している募集

いつも図書館で本を借りているので、たまには本屋で新刊を買ってインプット・アウトプットします。