音は空気の振動で、振動数に応じて音の《高》《低》が決まる。一秒あたりの振動数をHz(ヘルツ)という単位であらわす。そして人間の耳が、約二〇ヘルツから二〇キロヘルツの範囲を聴きとることができ、それを可聴周波数範囲と呼ぶことはよく知られている。
 厳密に言えば、音とは空気にかぎらずそれ以外の物質を含めて弾性体中を伝わる波の一種であり、波の周期は、極端を言えば無限小から無限大までの間に分布していて、たままその中から、人間の耳が二〇ヘルツないし二〇キロヘルツの範囲を拾い出して《音》として聴きとっているにすぎない。たとえば、イヌの可聴周波数範囲は一五ヘルツから五〇キロヘルツという広範囲だし、ネコは六〇ヘルツから六五キロヘルツ、イルカは一五〇ヘルツから一五〇キロヘルツであり、コウモリは一キロヘルツから一二〇キロヘルツを聴きとる。魚類は一般に可聴範囲が狭く、ウナギは約三五ヘルツないし三五〇ヘルツが限度だといわれる。
 いずれにしても、自然界に存在する広範囲の振動の中から、人間が二〇ヘルツないし二〇キロヘルツの範囲を選びとって《音》として感じていることがこれでわかる。
 では、なぜ二〇から二万なのか、これについては故田口 三郎博士の興味深い説がある。
 人間の耳が音を聴き分けるメカニズムは非常に複雑かつ精妙だが、耳の構造を大別すれば、集音器としての外耳、伝達装置としての中耳、そして分析装置に相当する内耳の三つの部分からなる。この内耳の自然共振周波数は約六三〇ヘルツ附近にあって内耳の特性は、六三〇ヘルツを中心とした確率曲線を画くとされている。
 二〇ヘルツから二〇キロヘルツの範囲というのは、別の言い方をすれば一〇オクターブの範囲になる。オクターブというのは周波数が二倍または1/2の関係であり、二〇から二〇キロヘルツの中心が約六三〇ヘルツにあたる。つまり人間の耳は、この六三〇ヘルツを中心として低音・高音とも対称的に五オクターブずつの範囲を聴きとっていることになる。言うまでもなく六三〇ヘルツとは、20×20,000=40,000 の平方根にあたる。
 一方、人間が口をポカンと開いたときの口腔内の自然共振周波数も、個人差を均すとやはりこの六三〇ヘルツ附近に多く分布する。唇を閉じた状態から急に口をパッと開くとき、ポンという特定のピッチの共鳴音が出るが、オシレーターで六三〇ヘルツの音を鳴らして比較してみれば、このことが確かめられる。オシレーターでなくとも、ピアノその他の楽器でe2音(約六六〇ヘルツ)がそれに近い。
 人間の発生が、声帯で生じた振動を口腔内の共鳴で拡大すると考えれば、可聴周波数のほぼ中心に共振点を持ってきた自然の配慮はたいへんなものだ。
 話をするときの人の声は、六三〇ヘルツの1/2の三一五ヘルツ附近が女声の平均的なピッチであり、その約1/2の一六〇ヘルツ近辺が男声のピッチの平均値になる。この基音(ファンダメンタル)の上に倍音が乗って人の声の個性を作るので、声を特徴づけ、その特徴を聴き分けるためには、この自然の配慮は大いに役立っているらしい。
 ところで、耳の集音器としての外耳の中にある外耳道は一種の共鳴管で、おおよそ三・五キロヘルツ附近にその共鳴周波数を持っている。このために三ないし四キロヘルツ附近は耳の感度の最も高い音域になる。
 おもしろいことに、赤ん坊や女の悲鳴を周波数分析してみると、この三ないし四キロヘルツ当たりに多くのエネルギーが集中している。赤子の泣き声や悲鳴は、遠くからでもよく聴こえるようにとの、これもまた自然の精妙な配慮なのだろうか。