人は何をもって音程を認識しているのか
音声って、基本的には倍音がh1234... と積み重なってできるじゃないですか。そのときの基本周波数h1が300Hz→D4あたりね、となるわけですが、じゃあ基本周波数にあたるh1が聴こえているから、D4って認識しているんでしょうか?
というわけで病み上がりの声で300Hz付近を「あー」と伸ばしてみました。縦が周波数、横が時間です。当然再生するとD4付近に聞こえます。
次にいきなり、基本周波数h1=300Hzを消します。一番低い強い音は600Hzになりました。再生すると、