ध्वनि आवृत्तियों का विज्ञान समझाया गया
ध्वनि आवृत्ति क्या है?
WhiteNoise.top के लिए ऑडियो टूल्स विकसित करने के मेरे काम में, मैं हर दिन ध्वनि आवृत्तियों से निपटता हूँ, और मैंने अंतर्निहित भौतिकी की सुंदरता की सराहना करना सीखा है। ध्वनि आवृत्ति प्रति सेकंड होने वाले पूर्ण दबाव दोलन चक्रों की संख्या है, जिसे हर्ट्ज (Hz) में मापा जाता है। 440 Hz पर कंपन करने वाला ट्यूनिंग फोर्क हर सेकंड संपीड़न और विरलन के 440 पूर्ण चक्र उत्पन्न करता है, जो मध्य C के ऊपर संगीत स्वर A बनाता है। कंपन दर और अनुभवित पिच के बीच यह सरल संबंध ध्वनिकी में सबसे मौलिक अवधारणाओं में से एक है।
ध्वनि स्वयं एक यांत्रिक तरंग है जिसे प्रसारित होने के लिए एक माध्यम की आवश्यकता होती है, जैसे हवा, पानी, या कोई ठोस पदार्थ। जब कोई स्रोत कंपन करता है, तो यह उच्च दबाव (संपीड़न) और कम दबाव (विरलन) के वैकल्पिक क्षेत्र बनाता है जो स्रोत से बाहर की ओर यात्रा करते हैं। इन दोलनों की आवृत्ति हमारे द्वारा अनुभव की जाने वाली पिच निर्धारित करती है, जबकि उनका परिमाण ध्वनि की तीव्रता निर्धारित करता है। कमरे के तापमान पर हवा में, ये दबाव तरंगें लगभग 343 मीटर प्रति सेकंड की गति से यात्रा करती हैं, एक मान जिसे ध्वनि की गति के रूप में जाना जाता है।
मनुष्य जो आवृत्तियाँ सुन सकते हैं उनकी रेंज निचले छोर पर लगभग 20 Hz से लेकर ऊँचे छोर पर 20,000 Hz तक फैली हुई है, हालाँकि यह रेंज व्यक्तियों के बीच काफी भिन्न होती है और उम्र के साथ संकुचित होती है। मेरे सुनने के परीक्षणों में, मैंने पाया है कि 30 से अधिक अधिकांश वयस्कों को 15,000 Hz से ऊपर शुद्ध स्वर सुनने में कठिनाई होती है, और 60 वर्ष की आयु तक, ऊपरी सीमा आमतौर पर लगभग 12,000 Hz तक गिर जाती है। यह आयु-संबंधित श्रवण हानि, जिसे प्रेसबीक्यूसिस कहा जाता है, उच्च आवृत्तियों को असमान रूप से प्रभावित करती है क्योंकि कोक्लीअ में जो बाल कोशिकाएँ इन आवृत्तियों का पता लगाती हैं वे संचयी क्षति के प्रति सबसे संवेदनशील हैं।
तरंगदैर्ध्य और आवृत्ति से इसका संबंध
आवृत्ति और तरंगदैर्ध्य ध्वनि की गति के माध्यम से विपरीत रूप से संबंधित हैं। ध्वनि तरंग की तरंगदैर्ध्य समान चरण के दो लगातार बिंदुओं, जैसे दो आसन्न संपीड़नों, के बीच भौतिक दूरी है। सूत्र सीधा है: तरंगदैर्ध्य ध्वनि की गति को आवृत्ति से विभाजित करने के बराबर है। हवा में 343 मीटर प्रति सेकंड पर, 20 Hz ध्वनि की तरंगदैर्ध्य लगभग 17.15 मीटर है, जबकि 20,000 Hz ध्वनि की तरंगदैर्ध्य केवल 1.7 सेंटीमीटर है।
ध्वनिक वातावरण डिज़ाइन करने और ऑडियो उपकरण परीक्षण करने के मेरे अनुभव में, तरंगदैर्ध्य के गहन व्यावहारिक प्रभाव हैं। कम-आवृत्ति ध्वनियाँ, अपनी लंबी तरंगदैर्ध्य के साथ, बाधाओं के चारों ओर आसानी से विवर्तित होती हैं और अवशोषित या रोकना कठिन होता है। यही कारण है कि पड़ोसी के सबवूफर से बास दीवारों के माध्यम से इतनी प्रभावी ढंग से यात्रा करता है, और रिकॉर्डिंग स्टूडियो में बास ट्रैप को प्रभावी होने के लिए भौतिक रूप से बड़ा होना आवश्यक है। उच्च-आवृत्ति ध्वनियाँ, अपनी छोटी तरंगदैर्ध्य के साथ, नरम सामग्री द्वारा आसानी से अवशोषित होती हैं और पतली बाधाओं द्वारा अवरुद्ध होती हैं, यही कारण है कि दरवाज़ा बंद करना ट्रेबल को प्रभावी ढंग से क्षीण करता है लेकिन बास को मुश्किल से प्रभावित करता है।
जब मैं नॉइज़ जनरेटर डिज़ाइन करता हूँ, तो मैं कमरे की ध्वनिकी के संदर्भ में तरंगदैर्ध्य के बारे में सोचता हूँ। किसी विशेष आवृत्ति की तरंगदैर्ध्य के बराबर आयामों वाला कमरा उस आवृत्ति पर स्थायी तरंग पैटर्न प्रदर्शित करेगा, रचनात्मक और विनाशकारी हस्तक्षेप की स्थितियाँ बनाएगा। इन्हें रूम मोड कहा जाता है, और वे कम आवृत्तियों पर नाटकीय स्तर भिन्नताएँ पैदा कर सकते हैं। लगभग 4.9 मीटर की तरंगदैर्ध्य वाला 70 Hz स्वर एक कमरे में एक स्थिति पर दूसरी स्थिति की तुलना में 20 डेसिबल ज़ोर हो सकता है, जो केवल दो मीटर दूर है। तरंगदैर्ध्य और कमरे के आयामों के बीच इस अंतःक्रिया को समझना ध्वनि के साथ काम करने वाले किसी भी व्यक्ति के लिए आवश्यक है।
आयाम, तीव्रता, और ध्वनि की तीव्रता की धारणा
जबकि आवृत्ति पिच निर्धारित करती है, आयाम निर्धारित करता है कि ध्वनि कितनी तेज़ है। आयाम दबाव तरंग के अपनी विश्राम स्थिति से अधिकतम विस्थापन को संदर्भित करता है, और यह तरंग द्वारा वहन की जाने वाली ऊर्जा से सीधे संबंधित है। ध्वनि तीव्रता, वाट प्रति वर्ग मीटर में मापी जाती है, आयाम के वर्ग के समानुपाती है। आयाम को दोगुना करना तीव्रता को चौगुना कर देता है।
मानव श्रवण तीव्रताओं की एक असाधारण रूप से विस्तृत रेंज में संचालित होता है। एक स्वस्थ युवा व्यक्ति द्वारा पता लगाई जा सकने वाली सबसे शांत ध्वनि, 1 kHz पर श्रवण सीमा, की तीव्रता लगभग एक ट्रिलियनवें वाट प्रति वर्ग मीटर है। दर्द सीमा लगभग एक वाट प्रति वर्ग मीटर पर होती है, एक ट्रिलियन गुना अधिक। इस विशाल रेंज को प्रबंधित करने के लिए, ध्वनिकीविद डेसिबल स्केल का उपयोग करते हैं, जो तीव्रता अनुपात को 0 से लगभग 130 dB SPL की अधिक प्रबंधनीय लघुगणकीय रेंज में संपीड़ित करता है।
मेरे मापों में, मैंने देखा है कि ध्वनि की तीव्रता की धारणा आवृत्तियों में समान नहीं है। मानव कान 2,000 से 5,000 Hz की रेंज में सबसे संवेदनशील होते हैं, जो कान नहर की अनुनाद आवृत्ति से मेल खाती है। 40 dB SPL पर एक 1 kHz स्वर उसी स्तर पर 100 Hz स्वर की तुलना में स्पष्ट रूप से ज़ोर लगता है। यह आवृत्ति-निर्भर संवेदनशीलता समान-ध्वनि तीव्रता समोच्चों द्वारा कैप्चर की जाती है, जिन्हें मूल रूप से 1930 के दशक में Fletcher और Munson द्वारा मापा गया और बाद में Robinson और Dadson द्वारा परिष्कृत किया गया। जब मैं अपने नॉइज़ जनरेटर कैलिब्रेट करता हूँ, तो मैं इन समोच्चों को ध्यान में रखता हूँ ताकि यह सुनिश्चित हो सके कि उपयोगकर्ता स्पेक्ट्रल आकार समायोजित करते समय भी अनुभवित ध्वनि तीव्रता सुसंगत बनी रहे।
हार्मोनिक्स, ओवरटोन, और टिम्बर
शुद्ध स्वर, जो एक एकल आवृत्ति से मिलकर बने होते हैं, प्रकृति में दुर्लभ हैं। अधिकांश वास्तविक दुनिया की ध्वनियाँ जटिल तरंगरूप हैं जो एक मौलिक आवृत्ति और हार्मोनिक्स की एक श्रृंखला से बनी होती हैं, जो मौलिक के पूर्णांक गुणज होते हैं। 220 Hz पर कंपन करने वाला गिटार तार 440 Hz, 660 Hz, 880 Hz, और इसी तरह आगे हार्मोनिक्स उत्पन्न करता है। इन हार्मोनिक्स के सापेक्ष आयाम प्रत्येक वाद्य यंत्र को उसका विशिष्ट टिम्बर देते हैं, यही कारण है कि एक ही स्वर बजाने वाला पियानो और वायलिन मौलिक रूप से भिन्न लगते हैं।
हमारे प्लेटफ़ॉर्म के लिए प्राकृतिक ध्वनि रिकॉर्डिंग के मेरे विश्लेषण में, मैं विभिन्न स्रोतों की हार्मोनिक सामग्री को विज़ुअलाइज़ करने के लिए स्पेक्ट्रोग्राम का उपयोग करता हूँ। एक स्पेक्ट्रोग्राम ऊर्ध्वाधर अक्ष पर आवृत्ति, क्षैतिज अक्ष पर समय, और रंग या चमक के रूप में तीव्रता प्लॉट करता है। पक्षी गान और इंजन की गुनगुनाहट जैसी स्वरिक ध्वनियाँ मौलिक और हार्मोनिक आवृत्तियों पर स्पष्ट क्षैतिज रेखाएँ दिखाती हैं। बहते पानी और हवा जैसी ब्रॉडबैंड ध्वनियाँ बिना किसी विशिष्ट हार्मोनिक संरचना के एक विस्तृत आवृत्ति रेंज में निरंतर ऊर्जा प्रसार दिखाती हैं।
नॉइज़ सिग्नल, अपनी प्रकृति से, हार्मोनिक संरचना से रहित होते हैं। व्हाइट नॉइज़ में यादृच्छिक चरण संबंधों के साथ सभी आवृत्तियों पर ऊर्जा होती है, इसलिए कोई आवधिकता और कोई मौलिक पिच नहीं है। यह ठीक वही है जो नॉइज़ को मास्किंग के लिए उपयोगी बनाता है: क्योंकि इसमें कोई स्वरिक पैटर्न नहीं है, श्रवण प्रणाली इसे उस तरह पकड़ नहीं सकती जैसे वह भाषण या संगीत को पकड़ती है। यह अनुभवात्मक पृष्ठभूमि में बना रहता है, अन्य ध्वनियों का पता लगाने की सीमा बढ़ाता है बिना स्वयं ध्यान माँगे।
मानव कान आवृत्तियों को कैसे संसाधित करता है
मानव श्रवण प्रणाली कोक्लीअ का उपयोग करके एक उल्लेखनीय रियल-टाइम आवृत्ति विश्लेषण करती है, जो आंतरिक कान में एक तरल-भरी सर्पिल संरचना है। ध्वनि कान नहर में प्रवेश करती है, कान के पर्दे को कंपन करती है, और तीन छोटी हड्डियों, मैलियस, इन्कस और स्टेपीज़ के माध्यम से कोक्लीअ की अंडाकार खिड़की तक प्रेषित होती है। कोक्लीअ के अंदर, बेसिलर झिल्ली आने वाली ध्वनि के जवाब में कंपन करती है। झिल्ली के साथ विभिन्न स्थितियाँ विभिन्न आवृत्तियों पर प्रतिक्रिया करती हैं: अंडाकार खिड़की के पास कोक्लीअ का आधार उच्च आवृत्तियों पर प्रतिक्रिया करता है, जबकि शीर्ष कम आवृत्तियों पर प्रतिक्रिया करता है।
यह टोनोटोपिक संगठन का अर्थ है कि कोक्लीअ अनिवार्य रूप से आने वाली ध्वनि का निरंतर स्पेक्ट्रल विश्लेषण करता है। बेसिलर झिल्ली के साथ प्रत्येक स्थिति विशिष्ट बाल कोशिकाओं को उत्तेजित करती है, जो यांत्रिक कंपन को श्रवण तंत्रिका के माध्यम से मस्तिष्क को भेजे जाने वाले विद्युत संकेतों में परिवर्तित करती हैं। मस्तिष्क फिर इन संकेतों को पिच, ध्वनि तीव्रता, टिम्बर और स्थानिक स्थान के रूप में व्याख्या करता है।
नॉइज़ जनरेटर के साथ मेरे काम में, मुझे कोक्लीअ के आवृत्ति रिज़ॉल्यूशन के बारे में सोचना उपयोगी लगता है, जिसे क्रिटिकल बैंड की अवधारणा द्वारा वर्णित किया गया है। क्रिटिकल बैंड वह आवृत्ति रेंज है जिसके भीतर कान ध्वनिक ऊर्जा को एकीकृत करता है। कम आवृत्तियों पर, क्रिटिकल बैंड निरपेक्ष शब्दों में संकीर्ण होते हैं, 500 Hz से नीचे लगभग 100 Hz चौड़े। उच्च आवृत्तियों पर, वे चौड़े हो जाते हैं, 10 kHz पर लगभग 2,500 Hz चौड़े तक पहुँचते हैं। यह परिवर्तनशील रिज़ॉल्यूशन ही कारण है कि कान पिच को लघुगणकीय रूप से अनुभव करता है: 100 Hz से 200 Hz तक का आवृत्ति परिवर्तन 1,000 Hz से 2,000 Hz तक के परिवर्तन के समान अंतराल लगता है, भले ही निरपेक्ष अंतर दस गुना बड़ा हो।
ऑडियो इंजीनियरिंग के संदर्भ में आवृत्ति
ऑडियो इंजीनियर लगातार आवृत्ति के साथ काम करते हैं, चाहे वे स्पीकर डिज़ाइन कर रहे हों, संगीत मिक्स कर रहे हों, या हमारे जैसे नॉइज़ जनरेटर बना रहे हों। 20 Hz से 20 kHz की मानक श्रव्य रेंज को सुविधा के लिए पारंपरिक उप-बैंड में विभाजित किया गया है: सब-बास (20 से 60 Hz), बास (60 से 250 Hz), लो मिडरेंज (250 से 500 Hz), मिडरेंज (500 Hz से 2 kHz), अपर मिडरेंज (2 से 4 kHz), प्रेज़ेंस (4 से 6 kHz), और ब्रिलियंस (6 से 20 kHz)। प्रत्येक बैंड ध्वनि के समग्र चरित्र में अलग ढंग से योगदान करता है।
अपने नॉइज़ प्रोफाइल ट्यून करने के मेरे अनुभव में, मैं 2 से 4 kHz रेंज पर विशेष ध्यान देता हूँ क्योंकि यहाँ कान सबसे संवेदनशील है और जहाँ भाषण व्यंजन अपनी अधिकांश जानकारी ले जाते हैं। इस रेंज में ऊर्जा में छोटे बदलाव अनुभवित चमक और सुगमता पर असमानुपातिक प्रभाव डालते हैं। जब मैं भाषण धारणा को कम करने के लिए एक मास्किंग नॉइज़ को आकार देता हूँ, तो मैं सुनिश्चित करता हूँ कि इस क्षेत्र में पर्याप्त ऊर्जा है ताकि उन व्यंजन आवृत्तियों में हस्तक्षेप हो सके जो अर्थ वहन करती हैं।
Nyquist-Shannon नमूनाकरण प्रमेय नियंत्रित करता है कि डिजिटल ऑडियो में आवृत्तियाँ कैसे कैप्चर की जाती हैं। किसी सिग्नल को सटीक रूप से दर्शाने के लिए, नमूनाकरण दर मौजूद उच्चतम आवृत्ति से कम से कम दोगुनी होनी चाहिए। मानक CD-गुणवत्ता ऑडियो 44,100 Hz नमूनाकरण दर का उपयोग करता है, जो 22,050 Hz तक की आवृत्तियों के विश्वसनीय पुनरुत्पादन की अनुमति देता है। हमारे नॉइज़ जनरेटर डिफ़ॉल्ट रूप से इस नमूनाकरण दर पर काम करते हैं लेकिन जब उपयोगकर्ताओं को अल्ट्रासोनिक परीक्षण या ओवरसैंपल्ड प्रोसेसिंग चेन जैसे विशेष अनुप्रयोगों के लिए विस्तारित बैंडविड्थ की आवश्यकता होती है तो उच्च दरों के लिए कॉन्फ़िगर किया जा सकता है।
आवृत्ति को समझना केवल अकादमिक नहीं है; यह वह व्यावहारिक नींव है जिस पर सभी ऑडियो टूल्स बने हैं। हर इक्वलाइज़र, फिल्टर, कंप्रेसर, और नॉइज़ जनरेटर एक सिग्नल की आवृत्ति सामग्री में हेरफेर करके काम करता है। मेरे विकास कार्य में, आवृत्ति सिद्धांत की ठोस समझ फिल्टर टोपोलॉजी के चयन से लेकर स्पेक्ट्रल विश्लेषण डिस्प्ले के रिज़ॉल्यूशन तक हर डिज़ाइन निर्णय को सूचित करती है। यह ध्वनि की भाषा है, और ऑडियो इंजीनियरिंग में काम करने वाले किसी भी व्यक्ति के लिए इसमें प्रवाह आवश्यक है।
संदर्भ
अक्सर पूछे जाने वाले प्रश्न
हर्ट्ज में मानव श्रवण की रेंज क्या है?
सामान्यतः उद्धृत रेंज 20 Hz से 20,000 Hz है, लेकिन यह व्यक्तियों के बीच भिन्न होती है। अधिकांश वयस्क उम्र बढ़ने के साथ 15,000 Hz से ऊपर की आवृत्तियों के प्रति संवेदनशीलता खो देते हैं, और रेंज समय के साथ संकुचित होती रहती है।
कम-आवृत्ति ध्वनियाँ दीवारों से अधिक आसानी से क्यों गुज़रती हैं?
कम-आवृत्ति ध्वनियों में लंबी तरंगदैर्ध्य होती है जो विशिष्ट दीवार मोटाई के बराबर या उससे बड़ी होती है। लंबी तरंगदैर्ध्य बाधाओं के चारों ओर विवर्तित होती है और पतली बाधाओं द्वारा कुशलता से अवशोषित नहीं होती, जिससे बास उन संरचनाओं से गुज़र पाता है जो उच्च आवृत्तियों को रोकती हैं।
आवृत्ति और पिच में क्या अंतर है?
आवृत्ति ध्वनि तरंग का एक भौतिक गुण है जिसे हर्ट्ज में मापा जाता है। पिच मानव श्रवण प्रणाली द्वारा आवृत्ति की व्यक्तिपरक धारणा है। वे निकट से संबंधित हैं लेकिन समान नहीं हैं, क्योंकि पिच धारणा ध्वनि तीव्रता, टिम्बर और संदर्भ से प्रभावित होती है।
कान पिच को लघुगणकीय रूप से क्यों अनुभव करता है?
कोक्लीअ की बेसिलर झिल्ली अपनी लंबाई के साथ आवृत्तियों को लघुगणकीय रूप से मैप करती है, इसलिए समान भौतिक दूरियाँ समान ऑक्टेव अंतराल से मेल खाती हैं। यह लघुगणकीय मैपिंग का अर्थ है कि अनुभवित पिच अंतराल निरपेक्ष आवृत्ति अंतरों के बजाय आवृत्ति अनुपातों से मेल खाते हैं।
पूरी श्रव्य रेंज कैप्चर करने के लिए किस नमूनाकरण दर की आवश्यकता है?
Nyquist-Shannon प्रमेय के अनुसार, नमूनाकरण दर रुचि की उच्चतम आवृत्ति से कम से कम दोगुनी होनी चाहिए। 44,100 Hz नमूनाकरण दर 22,050 Hz तक की आवृत्तियों को कैप्चर करती है, जो पूरी श्रव्य रेंज को आराम से कवर करती है।