サウンドAIでの推論結果のロジットと確立分布

2024年12月3日 12:45

サウンドAIモデルを構築している中で気になった、推論結果の値の扱いについてのメモです。

参考にしていた書籍などでクラス分類については「ロジットは生の値なので確立分布に変換しましょう」のように書かれていることが多く、今まではロジットは確立分布に変換することを前提としていましたが、可視化してみるとAIモデルの構築内容によってはロジットのままでも使えるのではと思いました。

以下は可視化した内容です。

一つのサウンドデータに複数のクラスのアノテーションが作成されています。

サウンドデータは同じものですが、クラス毎に確認できるようにしました。

推論結果のロジットを、クラス毎に確認できるようにしました。後述の確立分布よりも元のサウンドのクラスの出現を表現している印象です。
波形に近いグラフとなつているからそのような印象に感じるのだと思います。
あくまで、時系列においてのクラス分類を行っており、元の波形を再現しようとはしていません。

なんとなく、元の正解アノテーションとは遠い印象です。
細かい推論を行うAIモデルの構造なので、可視化するとこのようになります。

いいなと思ったら応援しよう！