音声の類似性を評価するモデル「Audio Proximity Network（仮称）」の開発について

2024年12月12日 03:12

音声の類似度を評価するためのファーストモデルとして「Audio Proximity Network（APN）」を開発しました

【概要】
APNは音声の特徴を深層学習で分析し、音の類似度を評価するモデルです。このモデルを音楽演奏の分野に応用することで、演奏者が目標とする音色やフレーズにどの程度近づいているかを客観的に把握できることを目指します。

【モデルの特徴】
・音響特徴量の抽出による類似度の定量化
・深層学習を用いた特徴空間での比較
・数秒単位での時系列分析

【開発状況】
現在は初期実装の段階であり、アプローチにおける妥当性など検証を進めることによって、より精度の良いモデル開発を進めて参ります。

【備考】
本モデルは研究開発段階にあり、公開の詳細については検討とさせて頂きます。