自然聲音 vs. 合成噪音:全面比較

兩種背景聲音方法

在我建構 WhiteNoise.top 的工作中,我同時實作了錄製的自然音景和演算法生成的合成噪音,而這兩種方法之間的工程權衡比大多數人意識到的更加微妙。表面上看,選擇似乎很簡單:自然聲音是「真實的」,合成噪音是「人工的」。但當你深入研究頻譜內容、檔案管理、循環行為和使用者體驗時,畫面變得更加有趣。

錄製的自然聲音,如雨聲、海浪、鳥鳴、風聲和河流水聲,是在自然環境中使用麥克風捕捉的。錄音經過編輯,有時會疊層處理,然後作為音訊檔案交付,由使用者的裝置播放。相比之下,合成噪音是使用演算法即時以數學方式生成的。沒有音訊檔案;聲音是從隨機數透過數位濾波器塑形而創建的,正如我在關於噪音生成器運作原理的文章中描述的那樣。

兩種方法都有合理的優勢和劣勢,根據我的經驗,最好的音訊工具提供兩種選項,讓使用者可以根據自己的偏好和使用場景來選擇。在本文中,我將從幾個對音訊品質和實際部署都重要的維度來比較這兩種方法。

頻譜內容與聲學特性

自然聲音和合成噪音之間最根本的區別在於它們的頻譜內容。合成噪音,無論是白噪音、粉紅噪音還是棕噪音,都具有精確定義的頻譜形狀。白噪音具有平坦的功率譜密度。粉紅噪音以每八度恰好衰減三分貝的速率衰減。這些形狀由數學決定,且完全可重複。在我的測量中,我們生成器相對於理論理想值的頻譜偏差在整個可聽範圍內小於 0.5 dB。

另一方面,自然聲音具有複雜的、隨時間變化的頻譜特性,難以用簡單的方式描述。例如,雨聲具有來自水滴撞擊表面的寬頻帶能量,但頻譜會隨著水滴大小、表面材料和降雨強度而變化。在我對一段高品質雨聲錄音的頻譜分析中,我發現能量集中在 500 Hz 到 8 kHz 之間,濺射部分在大約 2 到 4 kHz 處有一個寬的峰值,而 200 Hz 以下的能量相對較少。隨著降雨強度的波動,頻譜也會時刻變化。

海浪呈現出更複雜的畫面。海浪拍打海岸的碰撞產生從次低音隆隆聲到高頻嘶聲的寬頻帶能量爆發,隨後是水流過沙灘的穩定嘶嘶聲。在我的分析中,頻譜重心(頻譜的質量中心)在每個波浪週期中劇烈移動,從衝擊階段的 500 Hz 以下到消退階段的 3 kHz 以上。這種動態變化是海浪聲音引人入勝的部分原因,但也使它們與合成噪音的穩態特性有根本不同。

從遮蔽的角度來看,錄製聲音的非穩態特性既可以是優勢也可以是劣勢。變化保持了聽者的興趣並感覺更自然,但也意味著遮蔽效果隨時間波動。在海浪之間的安靜段落或雨勢間歇期間,遮蔽水準下降,可能讓不想要的聲音變得可聽到。合成噪音始終維持恆定、可預測的遮蔽水準。

循環偽影與無縫播放

錄製自然聲音最具挑戰性的工程問題之一是創建無縫循環。自然錄音有有限的持續時間,通常為 30 秒到幾分鐘,必須重複才能連續播放。如果循環點可以聽出來,聽者會聽到節奏性的重複,打破了自然環境的幻象。在我的製作工作中,我開發了幾種技術來最小化循環偽影,但沒有一種是完美的。

最簡單的方法是交叉淡化循環,其中錄音的結尾使用淡化曲線與開頭混合。我通常使用三到五秒的升餘弦交叉淡化,這對雨聲等連續聲音效果很好,但如果被混合的兩段有明顯特徵(例如一個大聲的雷聲同時出現在淡出和淡入中),可能會產生可聽到的重疊偽影。

更精緻的方法是使用長錄音(五到十分鐘或更長)並在更長的窗口上應用交叉淡化。這降低了重複率,即使循環點略微可察覺,聽者也不會經常遇到它以至於變得煩人。然而,更長的錄音意味著更大的檔案大小,這帶來了自身的權衡。

對於具有週期性元素的錄音,如海浪,我將循環點同步到波浪週期。我分析波形以在錄音的開頭和結尾附近找到波浪週期的起點,然後在這些匹配的相位點進行修剪和交叉淡化。這產生了一個保持海浪自然節奏而不突然跳躍的循環。在我的測試中,這種技術是有效的但耗時的,每個錄音都需要手動調整。

合成噪音完全消除了循環問題。因為每個樣本是從隨機過程獨立生成的,信號永遠不會重複(在 PRNG 的週期內,對於 128 位元狀態機來說,這是天文數字般長)。沒有循環點、沒有交叉淡化,也沒有聽者偵測到重複的風險。這是合成噪音相對於錄製音景最引人注目的實際優勢之一。

檔案大小、頻寬與交付

錄製的自然聲音必須作為音訊檔案儲存並交付到使用者的裝置。檔案大小取決於錄音長度、取樣率、位元深度和壓縮格式。一段兩分鐘的立體聲錄音,44.1 kHz、16 位元,以未壓縮的 WAV 格式約為 21 MB。壓縮格式大幅減少這個數字:同樣的錄音在高品質 MP3(256 kbps)下約 3.8 MB,在 Opus 96 kbps 下約 1.4 MB。

對於像我們這樣的網頁平台,檔案大小直接影響載入時間和數據使用量。如果我們提供 20 種不同的自然聲音錄音,每段兩分鐘,MP3 格式的總資料庫大小約為 76 MB。使用行動數據連接的使用者可能覺得這太多了,尤其是他們可能只想在確定最愛之前嘗試幾個選項。在我的實作中,我使用漸進式載入:每段錄音的前 15 秒立即載入,其餘部分在使用者聆聽時在背景串流。

合成噪音完全不需要音訊檔案。整個生成器,包括 PRNG、頻譜塑形濾波器和音訊工作程式碼,通常不到 10 KB 的 JavaScript。這意味著噪音幾乎立即開始播放,數據使用量可以忽略不計,無論使用者的連接速度如何。對於頻寬有限或行動數據昂貴的地區的使用者,這個優勢很顯著。

然而,錄製的聲音在首次下載後可以在本地快取,使後續播放同樣快速。而且精心錄製的自然音景的豐富性和複雜性很難用合成方式複製。根據我的經驗,最好的方法是提供合成噪音作為即時、輕量的預設選項,並提供錄製的音景作為使用者可以按需下載和快取的選用增強功能。

一致性與可控性

合成噪音提供了錄製聲音無法匹配的一致性和可控性水準。當我設定粉紅噪音生成器為 -12 dBFS 並指定特定的頻譜形狀時,我確切知道輸出會是什麼,每次都是,在每個裝置上都是。頻譜、振幅分佈和統計特性是確定的且可重複的。這種可預測性對於聲學測量、設備測試和聲音遮蔽系統校準等應用至關重要。

錄製的自然聲音本質上是變化的。即使是單個錄音也包含聲級、頻譜和時間模式的自然波動。同一聲源的不同錄音,如兩個不同地點的雨聲,由於水滴大小、表面材料、麥克風放置位置和環境條件的差異,聽起來可能相當不同。這種變化性對於休閒聆聽來說很有魅力,但對於需要一致、可預測聲學行為的應用來說是有問題的。

可控性是合成噪音擅長的另一個領域。使用者可以即時調整合成噪音的頻譜形狀、振幅甚至統計分佈。想要更多低音?調整頻譜傾斜。想要更柔和的特性?從白噪音切換到粉紅噪音或棕噪音。這些調整立即生效並可以精確微調。對於錄製的聲音,使用者的控制僅限於音量、對現有錄音的等化,以及從有限的錄音庫中選擇。改變聲音的特性需要完全選擇不同的錄音。

在我的開發工作中,我建構了將合成噪音的可控性與錄製聲音的自然特性相結合的混合模式。一種方法是使用從自然錄音中提取的包絡來調制合成噪音的振幅。結果聽起來像雨聲或海浪,但具有合成噪音的頻譜一致性和無縫循環特性。另一種方法是將安靜的自然錄音與較大聲的合成噪音背景疊層,使用錄音來添加質感和趣味,同時合成噪音提供一致的遮蔽。這些混合方法受到希望兼得兩者優點的使用者的好評。

在自然聲音和合成噪音之間選擇

經過多年建構和測試這兩類音訊內容,我開發了一些在它們之間選擇的實用準則。對於聲學測量、校準以及任何頻譜精度至關重要的應用,合成噪音是明確的選擇。它是可預測的、可控的,且不需要儲存空間。

對於休閒背景聆聽,選擇取決於個人偏好。有些使用者覺得自然聲音更有吸引力和愉悅感,因為它們具有有機的特性和與平靜環境的聯想。其他人偏好合成噪音的中性、一致的覆蓋,因為它不會引起對自身的注意。在我對我們平台進行的使用者調查中,對於一般使用大約有 60/40 偏好自然聲音,但在描述主要目標為在工作環境中遮蔽干擾聲音的使用者中,這個比例反轉為 30/70 偏好合成噪音。

對於辦公室和圖書館等專業場所的聲音遮蔽,聲學顧問幾乎總是偏好合成噪音,因為其一致性確保了可靠的效能。使用自然聲音的遮蔽系統在安靜段落期間會有遮蔽減弱的時刻,可能損害聲學隱私。

對於透過耳機的個人聆聽,我建議嘗試兩種選項並根據什麼聽起來最好來選擇。我們的平台使在合成噪音和錄製音景之間切換變得很容易,許多使用者最終創建了結合兩者元素的自訂混音。我在本文中描述的技術權衡是真實的,但最終最好的背景聲音是在你特定的環境中、為你特定的需求而有效的那個。

參考資料

常見問題

自然聲音錄音在聲音遮蔽方面比合成噪音更好嗎?

不一定。合成噪音提供恆定、可預測的遮蔽水準,而自然錄音的自然音量波動可能在安靜段落期間降低遮蔽效果。對於可靠的遮蔽,通常偏好合成噪音。

如何使自然聲音錄音無縫循環?

最常見的技術是在循環點進行交叉淡化,將錄音的結尾與開頭在幾秒鐘內混合。對於海浪等週期性聲音,將循環點同步到波浪週期會產生更好的效果。

自然聲音檔案需要多少儲存空間?

一段兩分鐘的 CD 品質立體聲錄音以 MP3 格式約為 3.8 MB。20 段錄音的資料庫約為 76 MB。合成噪音不需要音訊檔案,只需要幾 KB 的生成器程式碼。

合成噪音能聽起來像雨聲或海浪嗎?

合成噪音可以透過頻譜塑形來近似自然聲音的平均頻譜,但它缺乏真實錄音的動態變化、瞬態事件和有機特性。使用自然包絡調制合成噪音的混合方法提供了一個折中方案。

哪種選項在行動裝置上更省電?

兩者在播放期間使用相當的 CPU 資源。然而,合成噪音避免了初始數據下載,節省了蜂巢式網路射頻的能量。對於長時間使用,兩種方法之間的電池消耗差異可以忽略不計。

Leo Chen

Leo Chen 是一位工具開發者與音訊愛好者,專注於打造實用的線上聲音與效率工具。