見出し画像

AIは真実を語るか?炎上事件で音声認証技術SpeechBrainを試す


はじめに

近年、芸能人のスキャンダルは後を絶ちませんが、特に人気のあるアイドルに関連する情報は瞬く間に拡散され、大きな波紋を呼ぶことがあります。今回注目するのは、ある男性アイドルが女性関連のトラブルで炎上している一件です。そして、誰がリークしたのか不明な電話の音声データがYouTubeにアップロードされています。

疑惑の音声、その真偽を確かめる試み

公開された音声データが本当に当該アイドル本人のものなのか、多くの人が疑問に思っています。そこで登場するのが、AI技術を活用した音声認証です。今回、AI深層学習を利用した「SpeechBrain」というライブラリを用いて、この疑惑の音声の検証を試みました。

「SpeechBrain」は、音声認識や話者認識など、音声処理に関する様々なタスクを実行できるオープンソースライブラリです。このライブラリを利用することで、音声データが同一人物のものである可能性を数値化し、判定することができます。

検証方法とその結果

検証では、男性アイドルについては過去の記者会見での音声、女性については過去に公開されたYouTubeの「100の質問」動画の音声を比較対象として用いました。そして、問題の流出音声との類似度を「SpeechBrain」によって分析した結果。

以下がその結果です。

男性音声

  • 類似度スコア: 0.19492775201797485

  • 同一人物かどうかの判定結果: False (2つの音声は異なる人物のものです)

女性音声

  • 類似度スコア: 0.357480525970459

  • 同一人物かどうかの判定結果: True (2つの音声は同一人物のものです)

この結果だけを見ると、興味深い示唆が得られます。AIは、流出した音声と過去のアイドル本人の音声を「異なる人物のもの」と判断した一方、女性とされる人物の声については「同一人物のもの」と判断しました。

結果を読み解く上での注意点

ただし、この結果を鵜呑みにするのは早計です。流出した音声データは音質が荒く、ノイズが多いのです。音声認証の精度は、音声データの品質に大きく左右されるため、今回の結果はあくまで参考程度に留めておくべきでしょう。環境ノイズや録音機器の違い、発声時の状況など、様々な要因が影響する可能性があります。

また、「SpeechBrain」のようなAIによる判定は、完璧ではありません。誤判定のリスクも常に存在します。特に、類似度スコアが中間的な値を示す場合は、判断が難しくなります。

上記の女性は同一人物となっていますが、数値は若干低いです。試しに私の声を雑音のない環境で録音したものを2つ用意し、比べると数値は、0.819となりました。

※この続きや日々更新される記事の全文は、個別購入以外にnoteにて月額550円の『メンバーシップ』への加入でも読むことができます。

コード紹介

ここから先は

1,541字
この記事のみ ¥ 100

この記事が気に入ったらチップで応援してみませんか?