見出し画像

サウンドAIでの推論結果のロジットと確立分布

サウンドAIモデルを構築している中で気になった、推論結果の値の扱いについてのメモです。

参考にしていた書籍などでクラス分類については「ロジットは生の値なので確立分布に変換しましょう」のように書かれていることが多く、今まではロジットは確立分布に変換することを前提としていましたが、可視化してみるとAIモデルの構築内容によってはロジットのままでも使えるのではと思いました。

以下は可視化した内容です。

訓練データをグラフ化

一つのサウンドデータに複数のクラスのアノテーションが作成されています。

訓練データと正解アノテーション

正解アノテーションをクラス毎にグラフ化

サウンドデータは同じものですが、クラス毎に確認できるようにしました。

訓練データと正解アノテーション(分離表示)

推論結果のロジット

推論結果のロジットを、クラス毎に確認できるようにしました。後述の確立分布よりも元のサウンドのクラスの出現を表現している印象です。
波形に近いグラフとなつているからそのような印象に感じるのだと思います。
あくまで、時系列においてのクラス分類を行っており、元の波形を再現しようとはしていません。

推論結果のロジット

推論結果の確立分布

なんとなく、元の正解アノテーションとは遠い印象です。
細かい推論を行うAIモデルの構造なので、可視化するとこのようになります。

推論結果の確立分布

いいなと思ったら応援しよう!