मनोध्वनिकी

मनोध्वनिकी मनोभौतिकी की वह शाखा है जिसमें ध्वनि धारणा और ऑडियोलॉजी का वैज्ञानिक अध्ययन सम्मलित होता है - मानव श्रवण प्रणाली विभिन्न ध्वनियों को कैसे समझती है। विशेष रूप से, यह विज्ञान की वह शाखा है जो ध्वनि (शोर, भाषण और संगीत सहित) से जुड़ी मनोवैज्ञानिक प्रतिक्रियाओं का अध्ययन करती है। मनोध्वनिकी मनोविज्ञान, ध्वनिकी, इलेक्ट्रॉनिक अभियान्त्रिकी, भौतिकी, जीव विज्ञान, शरीर विज्ञान और कंप्यूटर विज्ञान सहित कई क्षेत्रों का एक अंतःविषय क्षेत्र होता है।

पृष्ठभूमि
श्रवण तरंग प्रसार पूर्ण रुप से यांत्रिक घटना नहीं है, बल्कि एक संवेदी और अवधारणात्मक घटना भी है; दूसरे शब्दों में, जब कोई व्यक्ति कुछ सुनता है, तो वह हवा के माध्यम से यात्रा करते हुए एक यांत्रिक ध्वनि तरंग के रूप में कान तक पहुंचता है, किन्तु कान के भीतर यह तंत्रिका क्रिया क्षमता में परिवर्तित हो जाता है। स्तनधारी कोक्लीअ की बाहरी बाल कोशिकाएं (ओएचसी) बढ़ी हुई संवेदनशीलता और कर्णावत विभाजन की यांत्रिक प्रतिक्रिया की आवृत्ति संकल्प को जन्म देती हैं। ये तंत्रिका आवेग फिर मस्तिष्क तक जाते हैं जहां उन्हें महसूस किया जाता है। इसलिए, ध्वनिकी में कई समस्याओं में, जैसे कि श्रवण प्रणाली के लिए, न केवल पर्यावरण के यांत्रिकी को ध्यान में रखना लाभदायक होता है, बल्कि इस तथ्य को भी ध्यान में रखना लाभदायक है कि कान और मस्तिष्क दोनों किसी व्यक्ति के सुनने के अनुभव में सम्मलित होते हैं।

उदाहरण के लिए, आंतरिक कान, ध्वनि तरंगों को तंत्रिका उत्तेजनाओं में परिवर्तित करने में महत्वपूर्ण संकेत संसाधन प्रदान करता है, इसलिए तरंगों के बीच कुछ अंतर अदृश्य हो सकते हैं। MP3 जैसी डेटा संपीड़न तकनीकें इस तथ्य का उपयोग करती हैं। इसके अतिरिक्त, कान में विभिन्न तीव्रता स्तरों की ध्वनियों के प्रति एक अरेखीय प्रतिक्रिया होती है; इस अरैखिक प्रतिक्रिया को प्रबलता कहा जाता है। टेलीफोन नेटवर्क और ऑडियो ध्वनि कम करने वाली प्रणालियाँ इस तथ्य का उपयोग ट्रांसमिशन से पहले डेटा नमूनों को गैर-रेखीय रूप से संपीड़ित करके और फिर प्लेबैक के लिए विस्तारित करके करती हैं। कान की अरेखीय प्रतिक्रिया का एक अन्य प्रभाव यह है कि जो ध्वनियाँ आवृत्ति में समीप होती हैं वे फैंटम बीट नोट्स, या इंटरमॉड्यूलेशन विरूपण उत्पाद उत्पन्न करती हैं।

मनोध्वनिकी शब्द संज्ञानात्मक मनोविज्ञान और उन प्रभावों के बारे में चर्चा में भी उठता है जो व्यक्तिगत अपेक्षाओं, पूर्वाग्रहों और पूर्वाग्रहों का श्रोताओं के सापेक्ष मूल्यांकन और ध्वनि सौंदर्यशास्त्र और तीक्ष्णता की तुलना और विभिन्न संगीत वाद्ययंत्रों के सापेक्ष गुणों के बारे में श्रोताओं के अलग-अलग निर्धारण पर हो सकते हैं। कलाकार यह अभिव्यक्ति कि कोई "वही सुनता है जो वह सुनना चाहता है (या अपेक्षा करता है)" ऐसी चर्चाओं से संबंधित हो सकता है।

धारणा की सीमा
मानव कान नाममात्र रूप से 20 हर्ट्ज (0.02 किलोहर्ट्ज़) से 20,000 हर्ट्ज (20 किलोहर्ट्ज़) की सीमा में ध्वनि सुन सकता है। ऊपरी सीमा उम्र के साथ घटती जाती है; अधिकांश वयस्क 16 किलोहर्ट्ज़ से ऊपर सुनने में असमर्थ होते हैं। आदर्श प्रयोगशाला स्थितियों में सबसे कम आवृत्ति जिसे संगीतमय स्वर के रूप में पहचाना गया है वह 12 हर्ट्ज होता है। 4 और 16 हर्ट्ज़ के बीच के स्वर को शरीर के स्पर्श संवेदना अनुभूति के माध्यम से समझा जा सकता है।

ऑडियो संकेत के समय पृथक्करण की मानवीय धारणा को 10 माइक्रोसेकंड से कम मापा गया है। इसका मतलब यह नहीं हैकि 100 किलोहर्ट्ज़ से ऊपर की आवृत्तियाँ श्रव्य हैं, किन्तु उस समय का सीधे आवृत्ति सीमा के साथ जुड़ा नहीं है।

कान की आवृत्ति वियोजन 1000–2000 हर्ट्ज हर्ट्ज के सप्तक के भीतर लगभग 3.6 हर्ट्ज है। अर्थात, 3.6 हर्ट्ज़ से बड़ी पिच में बदलाव को क्लिनिकल सेटिंग में देखा जा सकता है। चूँकि, पिच के छोटे अंतर को भी अन्य माध्यमों से देखा जा सकता है। उदाहरण के लिए, दो पिचों के हस्तक्षेप को अधिकांशतः स्वर की मात्रा में दोहराव वाले बदलाव के रूप में सुना जा सकता है। यह आयाम मॉड्यूलेशन दो स्वरों की आवृत्तियों में अंतर के बराबर आवृत्ति के साथ होता है और इसे बीट (ध्वनिकी) के रूप में जाना जाता है।

पश्चिमी संगीत संकेतन में प्रयुक्त अर्द्धस्वर स्केल एक रैखिक आवृत्ति स्केल नहीं जबकि लघुगणकीय होते है। अन्य पैमाने मे सीधे मानव श्रवण धारणा पर प्रयोगों से प्राप्त किए गए हैं, जैसे कि मेल स्केल और बार्क स्केल (इन्हें धारणा का अध्ययन करने में उपयोग किया जाता है, किन्तु सामान्यतः संगीत रचना में नहीं), और ये उच्च आवृत्ति के अंत में आवृत्ति में लगभग लघुगणक होते हैं, किन्तु कम आवृत्ति के अंत में लगभग रैखिक होते हैं।

श्रव्य ध्वनियों की तीव्रता का बहुत अधिक होती है। मानव कान के पर्दे ध्वनि दबाव में भिन्नता के प्रति संवेदनशील होते हैं और कुछ माइक्रोपास्कल (μPa) से लेकर 100 kPa से अधिक तक के दबाव परिवर्तन का पता लगा सकते हैं। इस कारण से, ध्वनि दबाव स्तर को लघुगणकीय रूप से भी मापा जाता है, जिसमें सभी दबाव 20 μPa (या 1.97385×10−10वातावरण इकाई) के संदर्भ में होते हैं। इसलिए श्रव्यता की निचली सीमा को 0 डीबी, के रूप में परिभाषित किया गया है, किन्तु ऊपरी सीमा को स्पष्ट रूप से परिभाषित नहीं किया गया है। ऊपरी सीमा उस सीमा का प्रश्न है जहां कान को शारीरिक रूप से नुकसान पहुंचाया जाएगा या शोर-प्रेरित श्रवण हानि होने की संभावना होती है।

श्रव्यता की निचली सीमाओं का अधिक कठोर अन्वेषण यह निर्धारित करता है कि न्यूनतम सीमा जिस पर ध्वनि सुनी जा सकती है वह आवृत्ति पर निर्भर होती है। विभिन्न आवृत्तियों के स्वरों के परीक्षण के लिए इस न्यूनतम तीव्रता को मापकर, आवृत्ति-निर्भर श्रवण सीमा (एटीएच) वक्र प्राप्त किया जा सकता है। सामान्यतः, कान मे 1-5 किलोहर्ट्ज़ के बीच संवेदनशीलता की चरम सीमा (अर्थात, इसका सबसे कम एटीएच) दिखाता है 1–5 kHz, चूँकि उम्र के साथ सीमा बदलती है, पुरातर कानों में 2 किलोहर्ट्ज़ से ऊपर संवेदनशीलता में कमी देखी जा सकती है।

ATH समान-ज़ोर वाली आकृतियों में सबसे कम होती है। समान-तीव्र आकृतियाँ श्रव्य आवृत्तियों की सीमा पर ध्वनि दबाव स्तर (डीबी एसपीएल) को इंगित करती हैं, जिन्हें समान तीव्रता के रूप में माना जाता है। समान-लाउडनेस कंटूर को पहली बार1933 में बेल लैब्स में फ्लेचर और मुनसन द्वारा हेडफ़ोन के माध्यम से पुनरुत्पादित शुद्ध टोन का उपयोग करके मापा गया था, और उनके द्वारा एकत्र किए गए डेटा को फ्लेचर-मुनसन कर्व्स कहा जाता है। क्योंकि व्यक्तिपरक प्रबलता को मापना कठिन था, कई विषयों पर फ्लेचर-मुनसन वक्र औसत होते थे।

रॉबिन्सन और डैडसन ने 1956 में एनीकोइक कक्ष में मापे गए फ्रंटल ध्वनि स्रोत के लिए समान-जोर वाले वक्रों का एक नया सेट प्राप्त करने के लिए प्रक्रिया को परिष्कृत किया था। रॉबिन्सन-डैडसन वक्रों को 1986 में आईएसओ 226 के रूप में मानकीकृत किया गया था। 2003 में, आईएसओ 226 12 अंतरराष्ट्रीय अध्ययनों से एकत्र किए गए डेटा का उपयोग करके समान-जोर वाले समोच्च के रूप में संशोधित किया गया था।

ध्वनि स्थानीयकरण
ध्वनि स्थानीयकरण ध्वनि स्रोत का स्थान निर्धारित करने की प्रक्रिया है। मस्तिष्क हमें ध्वनि स्रोतों को स्थानीयकृत करने की अनुमति देने के लिए दोनों कानों के बीच तीव्रता, स्वर और समय में सूक्ष्म अंतर का उपयोग करता है। स्थानीयकरण को त्रि-आयामी स्थिति के संदर्भ में वर्णित किया जा सकता है: अज़ीमुथ या क्षैतिज कोण, आंचल या ऊर्ध्वाधर कोण, और दूरी (स्थिर ध्वनियों के लिए) या वेग (गतिशील ध्वनियों के लिए)। मनुष्य, अधिकांश चौपाया चार-पैर वाले जानवरों की तरह, क्षैतिज दिशा में दिशा का पता लगाने में माहिर हैं, किन्तु कान सममित रूप से स्थित होने के कारण ऊर्ध्वाधर दिशाओं में कम होता है। उल्लुओं की कुछ प्रजातियों के कान विषम रूप से स्थित होते हैं और वे तीनों तलों में ध्वनि का पता लगा सकते हैं, जो अंधेरे में छोटे स्तनधारियों का शिकार करने के लिए एक अनुकूलन होता है।

मास्किंग प्रभाव
मान लीजिए कि एक श्रोता मूक परिस्थितियों में दिए गए ध्वनिक संकेत को सुन सकता है। जब एक संकेत बज रहा हो और दूसरी ध्वनि बज रही हो (एक प्रच्छादक), तो श्रोता को सुनने के लिए संकेत मजबूत होना चाहिए। मास्किंग के लिए प्रच्छादक को मूल संकेत के आवृत्ति घटकों की आवश्यकता नहीं होती है। अप्रत्यक्ष संकेत को सुना जा सकता है, भले ही वह अप्रत्यक्ष से कमजोर हो। मास्किंग तब होती है जब एक संकेत और एक प्रच्छादक को एक साथ बजाया जाता है - उदाहरण के लिए, जब एक व्यक्ति फुसफुसाता है जबकि दूसरा व्यक्ति चिल्लाता है - और श्रोता कमजोर संकेत को नहीं सुनता है क्योंकि इसे तेज़ प्रच्छादक द्वारा मास्क किया गया है। मास्किंग प्रारंभ होने से पहले या प्रच्छादक रुकने के बाद भी संकेत पर मास्किंग हो सकती है। उदाहरण के लिए, अचानक तेज़ ताली की ध्वनि उन ध्वनियों को अश्रव्य बना सकती है जो तुरंत पहले या बाद में आती हैं। पश्चगामी मास्किंग का प्रभाव पूर्वकालिक मास्किंग की तुलना में कमजोर होता है। मनोध्वनिक अनुसंधान में मास्किंग प्रभाव का व्यापक अध्ययन किया गया है। कोई व्यक्ति अप्रत्यक्ष स्तर को बदल सकता है और सीमा रेखा को माप सकता है, फिर एक मनोभौतिकीय ट्यूनिंग वक्र का एक आरेख बना सकता है जो समान विशेषताओं को प्रकट करेगा। मास्किंग प्रभावों का उपयोग एमपी3 जैसे हानिपूर्ण ऑडियो एन्कोडिंग में भी किया जाता है।

मौलिक गुम
जब संबंध 2f, 3f, 4f, 5f, आदि (जहाँ f एक विशिष्ट आवृत्ति होती है) में आवृत्तियों की एक हार्मोनिक श्रृंखला के साथ प्रस्तुत किया जाता है, तो मनुष्य यह अनुभव करते हैं कि पिच f है। एक श्रव्य उदाहरण यूट्यूब पर पाया जा सकता है।

सॉफ्टवेयर
मनोध्वनिक मॉडल यह वर्णन करके उच्च गुणवत्ता वाले हानिपूर्ण संकेत संपीड़न प्रदान करता है कि किसी दिए गए डिजिटल ऑडियो संकेत के किन हिस्सों को सुरक्षित रूप से हटाया जा सकता है (या आक्रामक रूप से संपीड़ित किया जा सकता है) - अर्थात, ध्वनि की (सचेत रूप से) कथित गुणवत्ता में महत्वपूर्ण नुकसान के बिना किया जा सकता है।

यह समझा सकता है कि एक शांत पुस्तकालय में हाथों की तेज ताली कितनी अप्रीतिकर ढंग से लग सकती है, किन्तु एक व्यस्त, शहरी सड़क पर कार के पलट जाने के बाद यह ध्यान देने योग्य नहीं है। यह समग्र संपीड़न अनुपात को बहुत लाभ प्रदान करता है, और मनोध्वनिक विश्लेषण नियमित रूप से संपीड़ित संगीत फ़ाइलों की ओर जाता है जो उच्च-गुणवत्ता वाले मास्टर्स के आकार के दसवें से बारहवें हिस्से तक होते हैं, किन्तु स्पष्ट रूप से कम आनुपातिक गुणवत्ता हानि के साथ होता है। ऐसा संपीड़न लगभग सभी आधुनिक हानिपूर्ण ऑडियो संपीड़न प्रारूपों की एक विशेषता है। इनमें से कुछ प्रारूपों में डॉल्बी डिजिटल (एसी-3), एमपी3, ओपस (ऑडियो प्रारूप), ऑग वॉर्बिस, उन्नत ऑडियो कोडिंग, विंडोज़ मीडिया ऑडियो , एमपीईजी-1 लेयर II (कई देशों में डिजिटल ऑडियो प्रसारण के लिए उपयोग किया जाता है) और एटीआरएसी, मिनीडिस्क और कुछ वॉकमेन मॉडल में उपयोग किया जाने वाला संपीड़न सम्मलित होते हैं।

मनोध्वनिकी अधिक मानव शरीर रचना विज्ञान पर आधारित होती है, विशेष रूप से ध्वनि को समझने में कान की सीमाओं पर जैसा कि पहले बताया गया है। संक्षेप में, ये सीमाएँ हैं:


 * उच्च-आवृत्ति सीमा
 * सुनने की पूर्ण सीमा
 * टेम्पोरल मास्किंग (आगे मास्किंग, बैकवर्ड मास्किंग)
 * एक साथ मास्किंग (स्पेक्ट्रल मास्किंग के रूप में भी जाना जाता है)

एक संपीड़न एल्गोरिदम मानव श्रवण की सीमा के बाहर की ध्वनियों को कम प्राथमिकता दे सकता है। ध्यानपूर्वक बिट्स को महत्वहीन घटकों से दूर और महत्वपूर्ण घटकों की ओर स्थानांतरित करके, एल्गोरिदम यह सुनिश्चित करता है कि श्रोता द्वारा जिन ध्वनियों को समझने की सबसे अधिक संभावना है, वे सबसे सटीक रूप से प्रस्तुत की गई हैं।

संगीत
मनोध्वनिकी में ऐसे विषय और अध्ययन सम्मलित हैं जो संगीत मनोविज्ञान और संगीत चिकित्सा से संबंधित होते हैं। बेंजामिन बोरेट्ज़ जैसे सिद्धांतकार मनोध्वनिकी के कुछ परिणामों को केवल संगीत के संदर्भ में सार्थक मानते हैं।

इरव टीबेल की एन्वायरमेंट्स श्रृंखला एलपी (1969-79) मनोवैज्ञानिक क्षमताओं को बढ़ाने के लिए स्पष्ट रूप से जारी की गई व्यावसायिक रूप से उपलब्ध ध्वनियों का एक प्रारंभिक उदाहरण है।

अनुप्रयुक्त मनोध्वनिकी
मनोध्वनिकी का लंबे समय से कंप्यूटर विज्ञान के साथ सहजीवी संबंध रहा है। इंटरनेट अग्रणी जे. सी. आर. लिक्लिडर और रॉबर्ट टेलर (कंप्यूटर वैज्ञानिक) दोनों ने मनोध्वनिकी में स्नातक स्तर का काम पूरा किया, जबकि बीबीएन टेक्नोलॉजीज ने पहले पैकेट-स्विच्ड नेटवर्क का निर्माण प्रारंभ करने से पहले मूल रूप से ध्वनिकी मुद्दों पर परामर्श देने में विशेषज्ञता हासिल की थी।

लिक्लाइडर ने पिच धारणा का एक द्वैध सिद्धांत नामक एक पेपर लिखा।

सॉफ्टवेयर विकास के कई क्षेत्रों में मनोध्वनिकी का उपयोग किया जाता है, जहां डेवलपर्स डिजिटल संकेत प्रक्रमन में प्रमाणित और प्रयोगात्मक गणितीय पैटर्न का मानचित्रण करते हैं। कई ऑडियो संपीड़न कोडेक्स जैसे एमपी3 और ओपस (ऑडियो प्रारूप) संपीड़न अनुपात को बढ़ाने के लिए एक मनोध्वनिक मॉडल का उपयोग करते हैं। थिएटरों और घरों में संगीत के पुनरुत्पादन के लिए होम ऑडियो की सफलता का श्रेय मनोध्वनिकी को दिया जा सकता है और मनोध्वनिक विचारों ने मनोध्वनिक तरंग क्षेत्र संश्लेषण जैसे उपन्यास ऑडियो सिस्टम को जन्म दिया। इसके अतिरिक्त, वैज्ञानिकों ने नए ध्वनिक हथियार बनाने में सीमित सफलता के साथ प्रयोग किया है, जो ऐसी आवृत्तियों का उत्सर्जन करते हैं जो ख़राब कर सकती हैं, नुकसान पहुँचा सकती हैं या मार सकती हैं। कई स्वतंत्र डेटा आयामों को श्रव्य और आसानी से व्याख्या करने योग्य बनाने के लिए ध्वनिकरण में मनोध्वनिकी का भी लाभ उठाया जाता है। यह स्थानिक ऑडियो और ध्वनिकरण कंप्यूटर गेम की आवश्यकता के बिना श्रवण मार्गदर्शन को सक्षम बनाता है और अन्य अनुप्रयोग, जैसे ड्रोन रेसिंग उड़ान और छवि-निर्देशित सर्जरी। इसे आज संगीत में भी लागू किया जाता है, जहां संगीतकार और कलाकार वाद्ययंत्रों की अवांछित आवृत्तियों को छिपाकर नए श्रवण अनुभव बनाना जारी रखते हैं, जिससे अन्य आवृत्तियों को बढ़ाया जाता है। फिर भी एक अन्य अनुप्रयोग छोटे या निम्न-गुणवत्ता वाले लाउडस्पीकरों के डिज़ाइन में है, जो लाउडस्पीकरों द्वारा भौतिक रूप से उत्पादन करने में सक्षम होने की तुलना में कम आवृत्तियों पर बेस नोट्स का प्रभाव देने के लिए बुनियादी सिद्धांतों की परिघटना का उपयोग कर सकता है (संदर्भ देखें)।

ऑटोमोबाइल निर्माता अपने इंजनों और यहां तक ​​कि दरवाजों को एक निश्चित ध्वनि के लिए इंजीनियर करते हैं।

संबंधित फ़ील्ड

 * संगीत का संज्ञानात्मक तंत्रिका विज्ञान
 * संगीत मनोविज्ञान

मनोध्वनिक विषय

 * ए-भार, आमतौर पर इस्तेमाल किया जाने वाला अवधारणात्मक लाउडनेस स्थानांतरण प्रकार्य
 * एबीएक्स परीक्षण
 * श्रवण संबंधी भ्रम
 * श्रवण दृश्य विश्लेषण सहित। 3डी-ध्वनि धारणा, स्थानीयकरण
 * बाइनॉरल बीट्स
 * ब्लाइंड सिग्नल पृथक्करण
 * संयोजन स्वर|संयोजन स्वर (टार्टिनी स्वर भी)
 * स्केल भ्रम|जर्मन स्केल भ्रम
 * समतुल्य आयताकार बैंडविड्थ (ईआरबी)
 * फ्रांसेन प्रभाव
 * ग्लिसेंडो भ्रम
 * हाइपरसोनिक प्रभाव
 * भाषा प्रसंस्करण
 * लेविटिन प्रभाव
 * मिसोफोनिया
 * संगीतमय ट्यूनिंग
 * शोर स्वास्थ्य पर प्रभाव
 * अष्टक भ्रम
 * पिच (संगीत)
 * प्राथमिकता प्रभाव
 * मनोभाषा विज्ञान
 * दर-विरूपण सिद्धांत
 * ध्वनि स्थानीयकरण
 * चॉकबोर्ड को नाखूनों से खुरचने की आवाज
 * ध्वनि छिपाना
 * वाक् बोध
 * वाक् पहचान
 * टिम्ब्रे
 * ट्राइटोन विरोधाभास

स्रोत

 * इ। लार्सन और आर.एम. आर्ट्स (2004), ऑडियो बैंडविड्थ एक्सटेंशन। मनोध्वनिकी, सिग्नल प्रोसेसिंग और लाउडस्पीकर डिजाइन का अनुप्रयोग।, जे. विली।

बाहरी संबंध

 * The Musical Ear—Perception of Sound
 * —Simulation of Free-field Hearing by Head Phones
 * GPSYCHO—An Open-source Psycho-Acoustic and Noise-Shaping Model for ISO-Based MP3 Encoders.
 * Definition of: perceptual audio coding
 * Java appletdemonstrating masking
 * Temporal Masking
 * HyperPhysics Concepts—Sound and Hearing
 * The MP3 as Standard Object