聲音頻率的科學解析

什麼是聲音頻率?

在我為 WhiteNoise.top 開發音訊工具的工作中,我每天都在處理聲音頻率,也因此深深體會到其背後物理學的優雅之處。聲音頻率是每秒鐘發生的完整壓力振盪週期數,以赫茲(Hz)為單位。一個以 440 Hz 振動的音叉每秒產生 440 個完整的壓縮和稀疏循環,創造出中央 C 上方的音樂音符 A。振動速率與感知音高之間的這個簡單關係,是聲學中最基本的概念之一。

聲音本身是一種機械波,需要介質(如空氣、水或固體)來傳播。當聲源振動時,它會產生交替的高壓(壓縮)和低壓(稀疏)區域,從聲源向外傳播。這些振盪的頻率決定了我們感知到的音高,而它們的幅度決定了響度。在室溫下的空氣中,這些壓力波以大約每秒 343 公尺的速度傳播,這個值被稱為聲速。

人類能聽到的頻率範圍大約從低端的 20 Hz 到高端的 20,000 Hz,但這個範圍在個體之間差異顯著,且隨年齡而縮小。在我的聽力測試中,我發現大多數 30 歲以上的成年人難以聽到 15,000 Hz 以上的純音,到了 60 歲,上限通常降至大約 12,000 Hz。這種與年齡相關的聽力損失稱為老年性耳聾,它不成比例地影響高頻率,因為耳蝸中偵測這些頻率的毛細胞最容易受到累積性損傷。

波長及其與頻率的關係

頻率和波長透過聲速呈反比關係。聲波的波長是兩個連續相同相位點之間的物理距離,例如兩個相鄰的壓縮區。公式很直接:波長等於聲速除以頻率。在空氣中每秒 343 公尺的條件下,20 Hz 的聲音波長約為 17.15 公尺,而 20,000 Hz 的聲音波長只有 1.7 公分。

根據我設計聲學環境和測試音訊設備的經驗,波長具有深遠的實際意義。低頻聲音由於波長較長,容易繞過障礙物產生繞射,也很難被吸收或封閉。這就是為什麼鄰居重低音音箱的低音能有效地穿過牆壁,也是為什麼錄音室中的低音陷阱需要體積夠大才能有效。高頻聲音由於波長較短,容易被柔軟材料吸收,也容易被薄屏障阻擋,這就是為什麼關上門能有效減弱高音但幾乎不影響低音。

當我設計噪音生成器時,我會在房間聲學的背景下思考波長問題。尺寸與特定頻率波長相當的房間,會在該頻率出現駐波模式,產生建設性和破壞性干涉的位置。這些被稱為房間模態,它們可能導致低頻處的聲級出現劇烈變化。一個 70 Hz 的音調,波長約為 4.9 公尺,在房間中某個位置可能比僅兩公尺外的另一個位置大聲 20 分貝。理解波長與房間尺寸之間的這種交互作用,對於任何從事聲音工作的人來說都是必要的。

振幅、強度與響度感知

頻率決定音高,而振幅決定聲音的響度。振幅是指壓力波從靜止狀態的最大位移量,與波所攜帶的能量直接相關。聲音強度以每平方公尺瓦特為單位測量,與振幅的平方成正比。振幅加倍,強度變為四倍。

人類聽覺在極其寬廣的強度範圍內運作。一個健康年輕人能偵測到的最安靜聲音,即 1 kHz 時的聽覺閾值,其強度約為每平方公尺一兆分之一瓦特。痛覺閾值大約發生在每平方公尺一瓦特,高出一兆倍。為了管理這個巨大的範圍,聲學家使用分貝標度,將強度比壓縮成更易管理的對數範圍,約從 0 到 130 dB SPL。

在我的測量中,我觀察到響度的感知在不同頻率間並不均勻。人耳在 2,000 到 5,000 Hz 的範圍內最為敏感,這對應於耳道的共振頻率。一個 40 dB SPL 的 1 kHz 純音聽起來明顯比同等聲壓級的 100 Hz 純音大聲。這種頻率相關的敏感性由等響曲線所描繪,最初由 Fletcher 和 Munson 在 1930 年代測量,後來由 Robinson 和 Dadson 改進。當我校準我們的噪音生成器時,我會將這些曲線納入考量,確保即使使用者調整頻譜形狀,感知到的響度仍然保持一致。

諧波、泛音與音色

由單一頻率組成的純音在自然界中很少見。大多數真實世界的聲音是由基頻加上一系列諧波組成的複雜波形,諧波是基頻的整數倍。一根以 220 Hz 振動的吉他弦會在 440 Hz、660 Hz、880 Hz 等頻率上產生諧波。這些諧波的相對振幅賦予每種樂器其特有的音色,這就是為什麼鋼琴和小提琴演奏相同音符聽起來完全不同。

在我為平台分析自然聲音錄音時,我使用頻譜圖來視覺化不同聲源的諧波內容。頻譜圖的縱軸為頻率,橫軸為時間,以顏色或亮度表示強度。音調性聲音如鳥鳴和引擎嗡嗡聲在基頻和諧波頻率處顯示清晰的水平線。寬頻帶聲音如流水和風聲則顯示能量連續分佈在寬廣的頻率範圍,沒有明顯的諧波結構。

噪音信號就其本質而言缺乏諧波結構。白噪音在所有頻率上都有能量,且具有隨機的相位關係,因此沒有週期性,也沒有基頻音高。這正是噪音對遮蔽有用的原因:因為它不包含音調模式,聽覺系統無法像抓住語音或音樂那樣抓住它。它停留在感知背景中,提高偵測其他聲音的閾值,而不會主動吸引注意力。

人耳如何處理頻率

人類聽覺系統使用耳蝸執行卓越的即時頻率分析。耳蝸是內耳中充滿液體的螺旋結構。聲音進入耳道,振動鼓膜,並透過三塊微小的骨頭——錘骨、砧骨和鐙骨——傳送到耳蝸的卵圓窗。在耳蝸內部,基底膜因傳入的聲音而振動。膜上的不同位置對不同頻率做出反應:靠近卵圓窗的耳蝸底部對高頻率做出反應,而頂部對低頻率做出反應。

這種音調分佈組織意味著耳蝸本質上對傳入的聲音執行連續的頻譜分析。基底膜上的每個位置激發特定的毛細胞,毛細胞將機械振動轉換為電信號,透過聽覺神經傳送到大腦。大腦然後將這些信號解讀為音高、響度、音色和空間位置。

在我從事噪音生成器的工作中,我發現思考耳蝸的頻率解析度很有用,這由臨界頻帶的概念所描述。臨界頻帶是耳朵整合聲能的頻率範圍。在低頻時,臨界頻帶在絕對值上很窄,在 500 Hz 以下約 100 Hz 寬。在較高頻率時,它們加寬,在 10 kHz 時約達 2,500 Hz 寬。這種可變的解析度是耳朵以對數方式感知音高的原因:從 100 Hz 到 200 Hz 的頻率變化聽起來與從 1,000 Hz 到 2,000 Hz 的變化是相同的音程,即使絕對差值大了十倍。

音訊工程中的頻率

音訊工程師持續與頻率打交道,無論是設計揚聲器、混音音樂,還是像我們一樣建構噪音生成器。標準的可聽範圍 20 Hz 到 20 kHz 為了方便被劃分為傳統的子頻帶:次低音(20 到 60 Hz)、低音(60 到 250 Hz)、低中頻(250 到 500 Hz)、中頻(500 Hz 到 2 kHz)、高中頻(2 到 4 kHz)、臨場感(4 到 6 kHz)和光輝感(6 到 20 kHz)。每個頻帶對聲音的整體特性有不同的貢獻。

根據我調校噪音配置的經驗,我特別關注 2 到 4 kHz 的範圍,因為這是耳朵最敏感的區域,也是語音子音攜帶大部分資訊的地方。這個範圍內能量的微小變化對感知到的明亮度和可理解性有不成比例的影響。當我塑形遮蔽噪音以降低語音感知時,我確保在這個區域有足夠的能量來干擾攜帶意義的子音頻率。

奈奎斯特-香農取樣定理控制了數位音訊中頻率的捕捉方式。為了精確地表示一個信號,取樣率必須至少是存在的最高頻率的兩倍。標準 CD 品質的音訊使用 44,100 Hz 的取樣率,允許忠實地重現高達 22,050 Hz 的頻率。我們的噪音生成器預設以此取樣率運作,但可以為需要擴展頻寬的使用者配置更高的取樣率,用於超音波測試或超取樣處理鏈等專門應用。

理解頻率不僅僅是學術性的;它是所有音訊工具建構的實際基礎。每個等化器、濾波器、壓縮器和噪音生成器都透過操縱信號的頻率內容來運作。在我的開發工作中,對頻率理論的紮實掌握為每個設計決策提供資訊,從濾波器拓撲的選擇到頻譜分析顯示的解析度。它是聲音的語言,對任何從事音訊工程的人來說,精通它是必要的。

參考資料

常見問題

人類聽覺的赫茲範圍是多少?

常被引用的範圍是 20 Hz 到 20,000 Hz,但因人而異。大多數成年人隨年齡增長會失去對 15,000 Hz 以上頻率的敏感度,且範圍持續縮小。

為什麼低頻聲音更容易穿過牆壁?

低頻聲音的波長較長,與典型牆壁厚度相當或更大。長波長能繞過障礙物產生繞射,且不會被薄屏障有效吸收,使得低音能穿過阻擋較高頻率的結構。

頻率和音高有什麼區別?

頻率是以赫茲測量的聲波物理屬性。音高是人類聽覺系統對頻率的主觀感知。它們密切相關但並不相同,因為音高感知受到響度、音色和脈絡的影響。

為什麼耳朵以對數方式感知音高?

耳蝸的基底膜沿其長度以對數方式映射頻率,因此相等的物理距離對應相等的八度音程。這種對數映射意味著感知到的音高間隔對應頻率比率,而非絕對頻率差。

捕捉完整可聽範圍需要什麼取樣率?

根據奈奎斯特-香農定理,取樣率必須至少是目標最高頻率的兩倍。44,100 Hz 的取樣率可捕捉高達 22,050 Hz 的頻率,舒適地涵蓋了完整的可聽範圍。

Leo Chen

Leo Chen 是一位工具開發者與音訊愛好者,專注於打造實用的線上聲音與效率工具。