絶対音感と相互相関
「あの人は声が高い/低い」という相対的な音感は誰しも持ち合わせていますが、ある音がピアノの鍵盤のどの音に対応するのかを即座に識別できる絶対音感を持つ人は稀です。
絶対音感(absolute pitch)は、ある音を聴いたときに、その音の高さを絶対的に認識する能力のことを指します。絶対音感がある人は、その人の記憶に基づいて、その音を楽器もしくは音楽学用語で示すことができます。絶対音感を成人で保持している人は少ないと言われています。
もちろん私には全くない能力ですが、「今の音はドの♯(シャープ)ですね」などと即座に音名を指摘できる人を見ると、驚いてしまいます。絶対音感を持つ人の脳内のデータ処理はどうなっているのか、私なりに考察してみます。あくまでも勝手な考察ですので、エビデンスはありません。
絶対音感を持つ人は楽器を演奏する人が多く、このような人は脳内に音のデータベースが出来上がっています。そのような人が”不明な音”を聞くと、脳内で音を周波数成分に分解し、脳内のデータベースと照合します。このとき、脳内ではデータベースにある周波数成分と”不明な音の周波数成分”との相互相関を計算しているのだろうと考えています。この照合の結果、相互相関が1に近ければ、そのデータベースの音が”不明な音”に該当します。
もしAIに絶対音感を持たせる場合には、前述のような相互相関を使うか、コンボリューションを利用したコサイン類似度などを使う方法が考えられます。たぶん・・・。