मनोध्वनिकी

मनोध्वनिकी मनोभौतिकी की वह शाखा है जिसमें ध्वनि धारणा और ऑडियोलॉजी का वैज्ञानिक अध्ययन शामिल है - मानव श्रवण प्रणाली विभिन्न ध्वनियों को कैसे समझती है। अधिक विशेष रूप से, यह विज्ञान की वह शाखा है जो ध्वनि (शोर, भाषण और संगीत सहित) से जुड़ी मनोवैज्ञानिक प्रतिक्रियाओं का अध्ययन करती है। मनोध्वनिकी मनोविज्ञान, ध्वनिकी, इलेक्ट्रॉनिक इंजीनियरिंग, भौतिकी, जीव विज्ञान, शरीर विज्ञान और कंप्यूटर विज्ञान सहित कई क्षेत्रों का एक अंतःविषय क्षेत्र है।

पृष्ठभूमि
श्रवण तरंग प्रसार की विशुद्ध रूप से यांत्रिक घटना नहीं है, बल्कि एक संवेदी और अवधारणात्मक घटना भी है; दूसरे शब्दों में, जब कोई व्यक्ति कुछ सुनता है, तो वह हवा के माध्यम से यात्रा करते हुए एक यांत्रिक ध्वनि तरंग के रूप में कान तक पहुंचता है, लेकिन कान के भीतर यह तंत्रिका क्रिया क्षमता में परिवर्तित हो जाता है। स्तनधारी कोक्लीअ की बाहरी बाल कोशिकाएं (ओएचसी) बढ़ी हुई और बेहतर संवेदनशीलता को जन्म देती हैं कर्णावत विभाजन की यांत्रिक प्रतिक्रिया की आवृत्ति संकल्प। ये तंत्रिका आवेग फिर मस्तिष्क तक जाते हैं जहां उन्हें महसूस किया जाता है। इसलिए, ध्वनिकी में कई समस्याओं में, जैसे कि श्रवण प्रणाली के लिए, न केवल पर्यावरण के यांत्रिकी को ध्यान में रखना फायदेमंद है, बल्कि इस तथ्य को भी ध्यान में रखना फायदेमंद है कि कान और मस्तिष्क दोनों किसी व्यक्ति के सुनने के अनुभव में शामिल होते हैं।

उदाहरण के लिए, आंतरिक कान, ध्वनि तरंगों को तंत्रिका उत्तेजनाओं में परिवर्तित करने में महत्वपूर्ण संकेत आगे बढ़ाना  करता है, इसलिए तरंगों के बीच कुछ अंतर अदृश्य हो सकते हैं। बिका हुआ जैसी डेटा संपीड़न तकनीकें इस तथ्य का उपयोग करती हैं। इसके अलावा, कान में विभिन्न तीव्रता स्तरों की ध्वनियों के प्रति एक अरेखीय प्रतिक्रिया होती है; इस अरैखिक प्रतिक्रिया को प्रबलता कहा जाता है। टेलीफोन नेटवर्क और ऑडियो शोर कम करने वाली प्रणालियाँ इस तथ्य का उपयोग ट्रांसमिशन से पहले डेटा नमूनों को गैर-रेखीय रूप से संपीड़ित करके और फिर प्लेबैक के लिए विस्तारित करके करती हैं। कान की अरेखीय प्रतिक्रिया का एक अन्य प्रभाव यह है कि जो ध्वनियाँ आवृत्ति में करीब होती हैं वे फैंटम बीट नोट्स, या इंटरमॉड्यूलेशन विरूपण उत्पाद उत्पन्न करती हैं। मनोध्वनिकी शब्द संज्ञानात्मक मनोविज्ञान और उन प्रभावों के बारे में चर्चा में भी उठता है जो व्यक्तिगत अपेक्षाओं, पूर्वाग्रहों और पूर्वाग्रहों का श्रोताओं के सापेक्ष मूल्यांकन और ध्वनि सौंदर्यशास्त्र और तीक्ष्णता की तुलना और विभिन्न संगीत वाद्ययंत्रों के सापेक्ष गुणों के बारे में श्रोताओं के अलग-अलग निर्धारण पर हो सकते हैं। कलाकार यह अभिव्यक्ति कि कोई वही सुनता है जो वह सुनना चाहता है (या अपेक्षा करता है) ऐसी चर्चाओं से संबंधित हो सकता है।

धारणा की सीमा
मानव कान नाममात्र की सीमा में ध्वनि सुन सकता है 20 Hz (0.02 kHz) को 20,000 Hz (20 kHz). ऊपरी सीमा उम्र के साथ घटती जाती है; अधिकांश वयस्क 16 किलोहर्ट्ज़ से ऊपर सुनने में असमर्थ हैं। आदर्श प्रयोगशाला स्थितियों में सबसे कम आवृत्ति जिसे संगीतमय स्वर के रूप में पहचाना गया है वह 12 हर्ट्ज है। 4 और 16 हर्ट्ज़ के बीच के स्वर को शरीर के स्पर्श की अनुभूति के माध्यम से समझा जा सकता है।

ऑडियो सिग्नल समय पृथक्करण की मानवीय धारणा को 10 माइक्रोसेकंड से कम मापा गया है। इसका मतलब यह नहीं है कि आवृत्तियाँ ऊपर हैं श्रव्य हैं, लेकिन उस समय का भेदभाव सीधे आवृत्ति सीमा के साथ जुड़ा नहीं है। कान की आवृत्ति रिज़ॉल्यूशन सप्तक के भीतर लगभग 3.6 हर्ट्ज है 1000–2000 Hz. यानी, क्लिनिकल सेटिंग में 3.6 हर्ट्ज़ से बड़ी पिच में बदलाव को देखा जा सकता है। हालाँकि, पिच के छोटे अंतर को भी अन्य माध्यमों से देखा जा सकता है। उदाहरण के लिए, दो पिचों के हस्तक्षेप को अक्सर स्वर की मात्रा में दोहराव वाले बदलाव के रूप में सुना जा सकता है। यह आयाम मॉड्यूलेशन दो स्वरों की आवृत्तियों में अंतर के बराबर आवृत्ति के साथ होता है और इसे बीट (ध्वनिकी) के रूप में जाना जाता है।

पश्चिमी संगीत संकेतन में प्रयुक्त अर्द्धस्वर स्केल एक रैखिक आवृत्ति स्केल नहीं है बल्कि लघुगणकीय पैमाने है। अन्य पैमाने सीधे मानव श्रवण धारणा पर प्रयोगों से प्राप्त किए गए हैं, जैसे कि मेल स्केल और छाल का पैमाना  (इन्हें धारणा का अध्ययन करने में उपयोग किया जाता है, लेकिन आमतौर पर संगीत रचना में नहीं), और ये उच्च आवृत्ति के अंत में आवृत्ति में लगभग लघुगणक हैं, लेकिन कम आवृत्ति के अंत में लगभग रैखिक हैं।

श्रव्य ध्वनियों की तीव्रता का दायरा बहुत बड़ा है। मानव कान के पर्दे ध्वनि दबाव में भिन्नता के प्रति संवेदनशील होते हैं और कुछ माइक्रोपास्कल (μPa) से लेकर इससे अधिक दबाव में परिवर्तन का पता लगा सकते हैं। 100 kPa.इस कारण से, ध्वनि दबाव को लघुगणकीय रूप से भी मापा जाता है, जिसमें सभी दबावों का संदर्भ दिया जाता है 20 μPa (या 1.97385×10−10वातावरण (इकाई)). इसलिए श्रव्यता की निचली सीमा को इस प्रकार परिभाषित किया गया है 0 dB, लेकिन ऊपरी सीमा स्पष्ट रूप से परिभाषित नहीं है। ऊपरी सीमा उस सीमा का प्रश्न है जहां कान को शारीरिक रूप से नुकसान पहुंचाया जाएगा या शोर-प्रेरित श्रवण हानि होने की संभावना होगी।

श्रव्यता की निचली सीमाओं का अधिक कठोर अन्वेषण यह निर्धारित करता है कि न्यूनतम सीमा जिस पर ध्वनि सुनी जा सकती है वह आवृत्ति पर निर्भर है। विभिन्न आवृत्तियों के स्वरों के परीक्षण के लिए इस न्यूनतम तीव्रता को मापकर, आवृत्ति-निर्भर श्रवण सीमा (एटीएच) वक्र प्राप्त किया जा सकता है। आमतौर पर, कान बीच में संवेदनशीलता का चरम (यानी, इसका सबसे कम एटीएच) दिखाता है 1–5 kHz, हालांकि उम्र के साथ सीमा बदलती है, पुराने कानों में 2 किलोहर्ट्ज़ से ऊपर संवेदनशीलता में कमी देखी जाती है। ATH समान-ज़ोर वाली आकृतियों में सबसे कम है। समान-तीव्र आकृतियाँ श्रव्य आवृत्तियों की सीमा पर ध्वनि दबाव स्तर (डीबी एसपीएल) को इंगित करती हैं, जिन्हें समान तीव्रता के रूप में माना जाता है। समान-लाउडनेस कंटूर को पहली बार 1933 में बेल लैब्स में फ्लेचर और मुनसन द्वारा हेडफ़ोन के माध्यम से पुनरुत्पादित शुद्ध टोन का उपयोग करके मापा गया था, और उनके द्वारा एकत्र किए गए डेटा को फ्लेचर-मुनसन कर्व्स कहा जाता है। क्योंकि व्यक्तिपरक प्रबलता को मापना कठिन था, कई विषयों पर फ्लेचर-मुनसन वक्र औसत थे।

रॉबिन्सन और डैडसन ने 1956 में एनीकोइक कक्ष में मापे गए फ्रंटल ध्वनि स्रोत के लिए समान-जोर वाले वक्रों का एक नया सेट प्राप्त करने के लिए प्रक्रिया को परिष्कृत किया। रॉबिन्सन-डैडसन वक्रों को 1986 में अंतर्राष्ट्रीय मानकीकरण संगठन 226 के रूप में मानकीकृत किया गया था। 2003 में, {{nowrap|ISO 226}12 अंतरराष्ट्रीय अध्ययनों से एकत्र किए गए डेटा का उपयोग करके } को समान-जोर वाले समोच्च के रूप में संशोधित किया गया था।

ध्वनि स्थानीयकरण
ध्वनि स्थानीयकरण ध्वनि स्रोत का स्थान निर्धारित करने की प्रक्रिया है। मस्तिष्क हमें ध्वनि स्रोतों को स्थानीयकृत करने की अनुमति देने के लिए दोनों कानों के बीच तीव्रता, स्वर और समय में सूक्ष्म अंतर का उपयोग करता है। स्थानीयकरण को त्रि-आयामी स्थिति के संदर्भ में वर्णित किया जा सकता है: दिगंश या क्षैतिज कोण, आंचल या ऊर्ध्वाधर कोण, और दूरी (स्थिर ध्वनियों के लिए) या वेग (गतिशील ध्वनियों के लिए)। मनुष्य, अधिकांश चौपाया |चार-पैर वाले जानवरों की तरह, क्षैतिज दिशा में दिशा का पता लगाने में माहिर हैं, लेकिन कान सममित रूप से स्थित होने के कारण ऊर्ध्वाधर दिशाओं में कम। उल्लुओं की कुछ प्रजातियों के कान विषम रूप से स्थित होते हैं और वे तीनों स्तरों पर ध्वनि का पता लगा सकते हैं, जो अंधेरे में छोटे स्तनधारियों का शिकार करने के लिए एक अनुकूलन है।

मास्किंग प्रभाव
मान लीजिए कि एक श्रोता मूक परिस्थितियों में दिए गए ध्वनिक संकेत को सुन सकता है। जब एक सिग्नल बज रहा हो और दूसरी ध्वनि बज रही हो (एक मास्कर), तो श्रोता को सुनने के लिए सिग्नल को मजबूत होना चाहिए। मास्किंग के लिए मास्कर को मूल सिग्नल के आवृत्ति घटकों की आवश्यकता नहीं होती है। नकाबपोश सिग्नल को सुना जा सकता है, भले ही वह नकाबपोश से कमजोर हो। मास्किंग तब होती है जब एक सिग्नल और एक मास्कर को एक साथ बजाया जाता है - उदाहरण के लिए, जब एक व्यक्ति फुसफुसाता है जबकि दूसरा व्यक्ति चिल्लाता है - और श्रोता कमजोर सिग्नल को नहीं सुनता है क्योंकि इसे तेज़ मास्कर द्वारा मास्क किया गया है। मास्किंग शुरू होने से पहले या मास्कर रुकने के बाद भी सिग्नल पर मास्किंग हो सकती है। उदाहरण के लिए, एक अचानक तेज़ ताली की ध्वनि उन ध्वनियों को अश्रव्य बना सकती है जो तुरंत पहले या बाद में आती हैं। पिछड़ा मुखौटा  का प्रभाव फॉरवर्ड मास्किंग की तुलना में कमजोर होता है। मनोध्वनिक अनुसंधान में मास्किंग प्रभाव का व्यापक अध्ययन किया गया है। कोई व्यक्ति मास्कर के स्तर को बदल सकता है और दहलीज को माप सकता है, फिर एक मनोभौतिकीय ट्यूनिंग वक्र का एक आरेख बना सकता है जो समान विशेषताओं को प्रकट करेगा। मास्किंग प्रभावों का उपयोग एमपी3 जैसे हानिपूर्ण ऑडियो एन्कोडिंग में भी किया जाता है।

मौलिक गुम
जब संबंध 2f, 3f, 4f, 5f, आदि (जहाँ f एक विशिष्ट आवृत्ति है) में आवृत्तियों की एक हार्मोनिक श्रृंखला (संगीत) के साथ प्रस्तुत किया जाता है, तो मनुष्य यह अनुभव करते हैं कि पिच f है। एक श्रव्य उदाहरण यूट्यूब पर पाया जा सकता है।

सॉफ्टवेयर
मनोध्वनिक मॉडल यह वर्णन करके उच्च गुणवत्ता वाले हानिपूर्ण डेटा संपीड़न प्रदान करता है कि किसी दिए गए डिजिटल ऑडियो सिग्नल के किन हिस्सों को सुरक्षित रूप से हटाया जा सकता है (या आक्रामक रूप से संपीड़ित किया जा सकता है) - यानी, ध्वनि की (सचेत रूप से) कथित गुणवत्ता में महत्वपूर्ण नुकसान के बिना।

यह समझा सकता है कि एक शांत पुस्तकालय में हाथों की तेज ताली कितनी दर्दनाक लग सकती है, लेकिन एक व्यस्त, शहरी सड़क पर कार के पलट जाने के बाद यह ध्यान देने योग्य नहीं है। यह समग्र संपीड़न अनुपात को बहुत लाभ प्रदान करता है, और मनोध्वनिक विश्लेषण नियमित रूप से संपीड़ित संगीत फ़ाइलों की ओर जाता है जो उच्च-गुणवत्ता वाले मास्टर्स के आकार के दसवें से बारहवें हिस्से तक होते हैं, लेकिन स्पष्ट रूप से कम आनुपातिक गुणवत्ता हानि के साथ। ऐसा संपीड़न लगभग सभी आधुनिक हानिपूर्ण ऑडियो संपीड़न प्रारूपों की एक विशेषता है। इनमें से कुछ प्रारूपों में डॉल्बी डिजिटल (एसी-3), एमपी3, ओपस (ऑडियो प्रारूप), ऑग वॉर्बिस, उन्नत ऑडियो कोडिंग,  विंडोज़ मीडिया ऑडियो , एमपीईजी-1 लेयर II (कई देशों में डिजिटल ऑडियो प्रसारण के लिए उपयोग किया जाता है) और एटीआरएसी, Minidisc और कुछ  वॉकमेन  मॉडल में उपयोग किया जाने वाला संपीड़न शामिल हैं।

मनोध्वनिकी काफी हद तक मानव शरीर रचना विज्ञान पर आधारित है, विशेष रूप से ध्वनि को समझने में कान की सीमाओं पर जैसा कि पहले बताया गया है। संक्षेप में, ये सीमाएँ हैं:


 * उच्च-आवृत्ति सीमा
 * सुनने की पूर्ण सीमा
 * टेम्पोरल मास्किंग (आगे मास्किंग, बैकवर्ड मास्किंग)
 * एक साथ मास्किंग (स्पेक्ट्रल मास्किंग के रूप में भी जाना जाता है)

एक संपीड़न एल्गोरिदम मानव श्रवण की सीमा के बाहर की ध्वनियों को कम प्राथमिकता दे सकता है। ध्यानपूर्वक बिट्स को महत्वहीन घटकों से दूर और महत्वपूर्ण घटकों की ओर स्थानांतरित करके, एल्गोरिदम यह सुनिश्चित करता है कि श्रोता द्वारा जिन ध्वनियों को समझने की सबसे अधिक संभावना है, वे सबसे सटीक रूप से प्रस्तुत की गई हैं।

संगीत
मनोध्वनिकी में ऐसे विषय और अध्ययन शामिल हैं जो संगीत मनोविज्ञान और संगीत चिकित्सा से संबंधित हैं। बेंजामिन बोरेट्ज़ जैसे सिद्धांतकार मनोध्वनिकी के कुछ परिणामों को केवल संगीत के संदर्भ में सार्थक मानते हैं। इरव टीबेल की एन्वायरमेंट्स (एल्बम श्रृंखला) एलपी (1969-79) मनोवैज्ञानिक क्षमताओं को बढ़ाने के लिए स्पष्ट रूप से जारी की गई व्यावसायिक रूप से उपलब्ध ध्वनियों का एक प्रारंभिक उदाहरण है।

अनुप्रयुक्त मनोध्वनिकी
मनोध्वनिकी का लंबे समय से कंप्यूटर विज्ञान के साथ सहजीवी संबंध रहा है। इंटरनेट अग्रणी जे. सी. आर. लिक्लिडर और रॉबर्ट टेलर (कंप्यूटर वैज्ञानिक) दोनों ने मनोध्वनिकी में स्नातक स्तर का काम पूरा किया, जबकि बीबीएन टेक्नोलॉजीज ने पहले पैकेट-स्विच्ड नेटवर्क का निर्माण शुरू करने से पहले मूल रूप से ध्वनिकी मुद्दों पर परामर्श देने में विशेषज्ञता हासिल की थी।

लिक्लाइडर ने पिच धारणा का एक द्वैध सिद्धांत नामक एक पेपर लिखा। साइकोएकॉस्टिक्स को सॉफ्टवेयर विकास के कई क्षेत्रों में लागू किया जाता है, जहां डेवलपर्स डिजिटल सिग्नल प्रोसेसिंग में सिद्ध और प्रयोगात्मक गणितीय पैटर्न का मानचित्रण करते हैं। कई ऑडियो संपीड़न कोडेक्स जैसे एमपी3 और ओपस (ऑडियो प्रारूप) संपीड़न अनुपात को बढ़ाने के लिए एक मनोध्वनिक मॉडल का उपयोग करते हैं। थिएटरों और घरों में संगीत के पुनरुत्पादन के लिए होम ऑडियो की सफलता का श्रेय मनोध्वनिकी को दिया जा सकता है और मनोध्वनिक विचारों ने मनोध्वनिक तरंग क्षेत्र संश्लेषण जैसे उपन्यास ऑडियो सिस्टम को जन्म दिया। इसके अलावा, वैज्ञानिकों ने नए ध्वनिक हथियार बनाने में सीमित सफलता के साथ प्रयोग किया है, जो ऐसी आवृत्तियों का उत्सर्जन करते हैं जो ख़राब कर सकती हैं, नुकसान पहुँचा सकती हैं या मार सकती हैं। कई स्वतंत्र डेटा आयामों को श्रव्य और आसानी से व्याख्या करने योग्य बनाने के लिए ध्वनिकरण में मनोध्वनिकी का भी लाभ उठाया जाता है। यह स्थानिक ऑडियो और ध्वनिकरण कंप्यूटर गेम की आवश्यकता के बिना श्रवण मार्गदर्शन को सक्षम बनाता है और अन्य अनुप्रयोग, जैसे ड्रोन रेसिंग उड़ान और छवि-निर्देशित सर्जरी। इसे आज संगीत में भी लागू किया जाता है, जहां संगीतकार और कलाकार वाद्ययंत्रों की अवांछित आवृत्तियों को छिपाकर नए श्रवण अनुभव बनाना जारी रखते हैं, जिससे अन्य आवृत्तियों को बढ़ाया जाता है। फिर भी एक अन्य अनुप्रयोग छोटे या निम्न-गुणवत्ता वाले लाउडस्पीकरों के डिज़ाइन में है, जो लाउडस्पीकरों द्वारा भौतिक रूप से उत्पादन करने में सक्षम होने की तुलना में कम आवृत्तियों पर बेस नोट्स का प्रभाव देने के लिए लापता बुनियादी सिद्धांतों की घटना का उपयोग कर सकता है (संदर्भ देखें)।

ऑटोमोबाइल निर्माता अपने इंजनों और यहां तक ​​कि दरवाजों को एक निश्चित ध्वनि के लिए इंजीनियर करते हैं।

संबंधित फ़ील्ड

 * संगीत का संज्ञानात्मक तंत्रिका विज्ञान
 * संगीत मनोविज्ञान

मनोध्वनिक विषय

 * ए-भार, आमतौर पर इस्तेमाल किया जाने वाला अवधारणात्मक लाउडनेस स्थानांतरण प्रकार्य
 * एबीएक्स परीक्षण
 * श्रवण संबंधी भ्रम
 * श्रवण दृश्य विश्लेषण सहित। 3डी-ध्वनि धारणा, स्थानीयकरण
 * बाइनॉरल बीट्स
 * ब्लाइंड सिग्नल पृथक्करण
 * संयोजन स्वर|संयोजन स्वर (टार्टिनी स्वर भी)
 * स्केल भ्रम|जर्मन स्केल भ्रम
 * समतुल्य आयताकार बैंडविड्थ (ईआरबी)
 * फ्रांसेन प्रभाव
 * ग्लिसेंडो भ्रम
 * हाइपरसोनिक प्रभाव
 * भाषा प्रसंस्करण
 * लेविटिन प्रभाव
 * मिसोफोनिया
 * संगीतमय ट्यूनिंग
 * शोर स्वास्थ्य पर प्रभाव
 * अष्टक भ्रम
 * पिच (संगीत)
 * प्राथमिकता प्रभाव
 * मनोभाषा विज्ञान
 * दर-विरूपण सिद्धांत
 * ध्वनि स्थानीयकरण
 * चॉकबोर्ड को नाखूनों से खुरचने की आवाज
 * ध्वनि छिपाना
 * वाक् बोध
 * वाक् पहचान
 * टिम्ब्रे
 * ट्राइटोन विरोधाभास

स्रोत

 * इ। लार्सन और आर.एम. आर्ट्स (2004), ऑडियो बैंडविड्थ एक्सटेंशन। मनोध्वनिकी, सिग्नल प्रोसेसिंग और लाउडस्पीकर डिजाइन का अनुप्रयोग।, जे. विली।

बाहरी संबंध

 * The Musical Ear—Perception of Sound
 * —Simulation of Free-field Hearing by Head Phones
 * GPSYCHO—An Open-source Psycho-Acoustic and Noise-Shaping Model for ISO-Based MP3 Encoders.
 * Definition of: perceptual audio coding
 * Java appletdemonstrating masking
 * Temporal Masking
 * HyperPhysics Concepts—Sound and Hearing
 * The MP3 as Standard Object