什么是白噪音?完整声音指南
从信号处理的角度定义白噪音
在 WhiteNoise.top 开发音频工具的经验中,没有比白噪音本身更常被提及的概念了,然而大多数人对它的理解只是模糊的。白噪音是一种功率谱密度在整个频率范围内平坦的随机信号。通俗地说,从最深沉的低音轰鸣到最高亢的高音嘶嘶声,每个频率在单位带宽内携带相同的能量。这个名称借用了光学的类比:就像白光以大致相等的强度包含所有可见波长一样,白噪音以相等的功率包含所有可听频率。
从数学上讲,真正的白噪音信号具有无限带宽和无限总功率,这在物理上是不可能的。我们在数字音频中使用的是带限白噪音,受限于系统的采样率。对于标准的 44.1 kHz 采样率,噪音从 0 Hz 延伸到 22.05 kHz 的奈奎斯特极限。在该范围内,每个窄频带贡献相同的能量。这种平坦的频谱形状使得白噪音作为声学和音频工程中的参考信号如此有用。
当我刚开始构建噪音生成器时,让我惊讶的是人们多么经常将白噪音与简单的静电噪声或嘶嘶声混淆。虽然这些声音可能在感知上有相似之处,但它们并不总是频谱平坦的。例如,电视静电噪声包含了来自解调过程的伪影,使其频谱不均匀。真正的白噪音是由其统计特性定义的,而不是由它对于普通听者的听感来定义的。
频率分布与平坦频谱
白噪音的标志性特征是其平坦的功率谱密度,通常缩写为 PSD。如果你将白噪音信号输入频谱分析仪,你应该看到在频率轴上大致水平的线。从 20 Hz 到 20 kHz 的每个一赫兹宽的频带与其他任何一赫兹宽的频带携带相同的功率。这有时被称为“每赫兹等能量”。
在我的测试中,现实世界的生成器永远不会产生完美的平坦线。模拟电路中的元件容差和数字系统中的量化效应会引入微小偏差。设计良好的生成器将这些偏差控制在整个可听范围内正负一分贝以内,这对大多数应用来说已经绰绰有余。当我基准测试我们的 Web Audio API 生成器时,我捕获一个 30 秒的样本,运行 16384 点的快速傅里叶变换,并对结果幅度进行平均。目标是从直流到奈奎斯特偏差小于 0.5 dB。
一个经常让人措手不及的微妙之处是“每赫兹等能量”和“每倍频程等能量”之间的区别。因为每个连续倍频程跨越的赫兹数是下一个的两倍,白噪音实际上在更高的倍频程中拥有更多的总能量。从 10 kHz 到 20 kHz 的倍频程包含一万赫兹,而从 500 Hz 到 1 kHz 的倍频程仅包含五百赫兹。这就是为什么白噪音听起来比许多人预期的更明亮、更嘶嘶。感知到的明亮度不是信号的缺陷;它是平坦每赫兹频谱与人类音高感知的对数性质相互作用的直接结果。
白噪音与静默和环境声音的区别
将噪音与静默进行比较似乎很奇怪,但在声学中,这两者处于一条非常重要的频谱的两端。理想化的静默在所有频率上携带零声能。白噪音在所有频率上携带等量的能量。环境声音则介于两者之间,能量根据环境不均匀地集中在频谱的不同部分。
在为用户分析房间声学的工作中,我已经在数十种环境中测量了环境声音。典型的开放式办公室的噪音本底以暖通空调系统的低频能量为主,偶尔有来自语音的中频峰值。安静的夜间卧室可能显示出来自远处交通和建筑振动的低频隆起,2 kHz 以上的能量很少。这些配置都不是平坦的;它们由存在的声源和房间的传递函数所塑造。
白噪音的特殊之处在于它是宽带的和统计平稳的。宽带意味着它占据了整个可听范围,而不是聚集在某些频率附近。平稳意味着其统计特性不随时间变化:均值为零,方差恒定,信号的任何一段在统计上与相同长度的任何其他段相同。这两个特性共同使白噪音成为测试音频设备、测量房间脉冲响应和校准声音系统的宝贵工具。
从感知的角度来看,静默让环境中的每一个小声音都变得明显。在安静的房间里,滴水的水龙头或滴答作响的时钟可以占据你的注意力。白噪音通过均匀地填充可听频谱来提高整体背景水平,使小的瞬态声音变得不那么可感知。这就是声音遮蔽的基本原理,我将在本站的其他文章中详细讨论。
白噪音的频谱分析技术
如果你想验证一个噪音信号是否真的是白噪音,你需要进行频谱分析。最常见的方法是快速傅里叶变换(FFT),它将时域信号分解为其组成频率。在我的工具链中,我通常使用 16384 点 FFT,对每一帧应用汉宁窗,然后将数百帧的结果进行平均以平滑结果。平均频谱在测量带宽内应呈平坦。
另一个有用的技术是三分之一倍频程分析。这种方法将频谱划分为每段三分之一倍频程宽的频带,模仿人耳对频率的分组方式。对于白噪音,每个三分之一倍频程频带的能量随着频率升高而大约增加一分贝。这是因为每个频带跨越逐渐增大的赫兹范围。如果你在三分之一倍频程分析中看到大约每倍频程 3 dB 的上升趋势,那就确认了平坦的每赫兹频谱。
自相关是另一种验证工具。根据定义,白噪音在所有非零延迟处的自相关为零。在实践中,有限长度的样本会显示出微小的残余相关性,但它们应该在统计上不显著。我经常计算生成样本的自相关函数,检查所有超过零延迟的值是否落在该长度随机过程的 95% 置信区间内。这有助于捕获伪随机数生成器中可能引入周期性模式的微妙缺陷。
峰值因子,定义为峰值振幅与均方根振幅的比值,是我跟踪的另一个指标。对于高斯白噪音,理论峰值因子是无界的,但在实践中,数字样本被削波到可用的位深度。16 位白噪音信号通常显示 10 到 14 dB 之间的峰值因子,具体取决于样本长度。异常低的峰值因子可能表明生成器没有产生正确的高斯分布。
音频工程中的实际应用
白噪音堪称音频测试信号中的瑞士军刀。在我的日常工作中,我用它进行扬声器和耳机的频率响应测量、房间声学分析和均衡校准。通过扬声器播放白噪音并用校准过的测量麦克风录制,你可以获得扬声器、房间和麦克风的综合频率响应。偏离平坦频谱的部分揭示了共振、空洞和其他声学异常。
音响系统设计师使用白噪音在现场场馆、录音室和家庭影院中设置均衡。通过 PA 系统播放粉红噪音(由白噪音经每倍频程负 3 分贝的滤波器得来),并在观众区域的多个位置进行测量,工程师可以调整图形或参量均衡器来补偿房间模态和扬声器指向性图案。白噪音是生成粉红噪音和其他滤波变体的起点。
在产品开发中,我依靠白噪音来对我们的生成器进行压力测试。好的噪音生成器必须产生通过严格的随机性和频谱平坦度统计测试的信号。我对原始样本值运行 Diehard 随机性测试套件,同时使用前面描述的方法验证频谱平坦度。在这个阶段的任何异常都会传播到我们提供的每个噪音变体中,因此白噪音源的质量控制至关重要。
白噪音还在声学隐私系统中发挥作用。开放式办公室和商业建筑使用通过天花板安装的扬声器发出的白噪音或整形噪音来提高环境噪音本底,降低远距离对话的可懂度。目标不是要大声,而是要一致和宽带,填充允许语音在开放空间中传播的频谱空白。
关于白噪音的常见误解
在我与用户互动的经验中,有几个误解反复出现。第一个是白噪音总是很吵。实际上,白噪音可以以任何振幅生成,从几乎听不到的到令人不适的大声。其标志性特征是频谱形状,而不是音量。
第二个误解是所有的嘶嘶声都算作白噪音。例如磁带嘶嘶声会因录音介质的磁性而在高频滚降,使其更类似于粉红噪音而非白噪音。电台之间的 FM 收音机静电噪声包含解调电路产生的伪影,会产生频谱峰值和谷值。只有经过验证具有平坦功率谱密度的信号才配得上“白噪音”的标签。
第三个误解是数字白噪音无论采样率如何听起来都一样。在我的测试中,以 44.1 kHz 生成并在 44.1 kHz 回放的白噪音,听起来与以 96 kHz 生成并在 96 kHz 回放的白噪音明显不同,因为后者延伸到了 48 kHz,远超人类听力的极限。然而,扩展的带宽可能影响下游处理的行为,如插件中的非线性失真或混叠。即使在使用噪音时,为你的应用选择正确的采样率也很重要。
最后,一些用户认为白噪音本质上令人不快。虽然平坦频谱噪音明亮、嘶嘶的特性不是每个人的口味,但这是主观偏好,而非内在缺陷。许多人发现粉红噪音或棕噪音——它们强调较低频率——在长时间聆听中更为舒适。在我们的平台上,我们提供这三种变体,让用户选择最适合自己的频谱配置。
参考资料
常见问题
白噪音包含哪些频率?
白噪音包含其带宽内所有频率,且每单位频率的功率相等。在 44.1 kHz 采样率的数字音频中,这意味着从 0 Hz 到 22.05 kHz 的等能量分布。
为什么白噪音听起来有嘶嘶声,即使所有频率是等量的?
每个更高的倍频程跨越的赫兹数是下一个的两倍。由于白噪音每赫兹能量相等,更高的倍频程包含更多的总能量,使信号听起来比名称可能暗示的更明亮、更嘶嘶。
白噪音和静电噪声一样吗?
不一定。电视或收音机的静电噪声包含来自解调过程的伪影,产生不均匀的频谱。白噪音是由平坦的功率谱密度定义的,而静电噪声可能并不具备这一特性。
如何验证一个噪音信号是否真的是白噪音?
对足够长的样本运行快速傅里叶变换,检查平均幅度频谱在频率范围内是否平坦。你还可以检查自相关函数,对于真正的白噪音,它在所有非零延迟处应该为零。
采样率会影响白噪音的听感吗?
会。更高的采样率将噪音带宽延伸到可听频率之外。虽然你不能直接听到超声波内容,但它会在与非线性效应交互时影响下游处理和信号的整体特性。