रव रूपण: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Digital signal performance enhancement}}
{{short description|Digital signal performance enhancement}}
शोर आकार देना ऐसी तकनीक है जिसका उपयोग आमतौर पर [[डिजिटल ऑडियो]], [[ मूर्ति प्रोद्योगिकी ]] और [[ वीडियो प्रसंस्करण ]] में किया जाता है, आमतौर पर डिजिटल सिग्नल की [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) ]] या [[ ऑडियो बिट गहराई ]]|बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में [[ कटौती ]] के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के [[पावर स्पेक्ट्रम]] को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला लोकप्रिय शोर आकार देने वाला एल्गोरिदम '[[फ्लोयड स्टाइनबर्ग डगमगाते हुए]]' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम '[[सुनने की पूर्ण सीमा]]' मॉडल पर आधारित हैं।
'''नॉइज़ शेपिंग''' देना ऐसी प्रौद्योगिकी है जिसका उपयोग सामान्यतः [[डिजिटल ऑडियो]], [[ मूर्ति प्रोद्योगिकी |इमेज]] और [[ वीडियो प्रसंस्करण |वीडियो प्रोसेसिंग]] में किया जाता है, सामान्यतः डिजिटल सिग्नल की [[ परिमाणीकरण (सिग्नल प्रोसेसिंग) |क्वान्टिजेशन (सिग्नल प्रोसेसिंग)]] या [[ ऑडियो बिट गहराई |ऑडियो बिट डेप्थ]] रिडक्शन के प्रोसेस के भाग के रूप में [[ कटौती |डिथरिंग]] के कॉम्बिनेशन में इसका उद्देश्य रिजल्टएंट सिग्नल के स्पष्ट सिग्नल-टू-नॉइज़ अनुपात को इनक्रीस करना है। यह एरर के [[पावर स्पेक्ट्रम]] को परिवर्तित करके ऐसा करता है जो डिथरिंग और क्वान्टिजेशन द्वारा प्रस्तुत किया जाता है; जैसे कि नॉइज़ पॉवर फ्रीक्वेंसी बैंड में लो लेवल पर होती है, जिस पर नॉइज़ कम डिजायरेबल माना जाता है और बैंड करेस्पोंडिंगली हाई लेवल पर होता है, जहां इसे अधिक डिजायरेबल माना जाता है। इमेज प्रोसेसिंग में उपयोग किया जाने वाला पोपुलर नॉइज़ शेपिंग देने वाला एल्गोरिदम '[[फ्लोयड स्टाइनबर्ग डगमगाते हुए|फ्लोयड स्टाइनबर्ग डिथरिंग]]' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई नॉइज़ शेपिंग देने वाले एल्गोरिदम '[[सुनने की पूर्ण सीमा|अब्सोल्यूट थ्रेसहोल्ड हियरिंग]]' मॉडल पर आधारित हैं।


== ऑपरेशन ==
== ऑपरेशन ==


शोर को आकार देने का काम परिमाणीकरण त्रुटि को [[ प्रतिक्रिया ]] लूप में डालकर किया जाता है। कोई भी फीडबैक लूप [[फ़िल्टर (सिग्नल प्रोसेसिंग)]] के रूप में कार्य करता है, इसलिए त्रुटि के लिए फीडबैक लूप बनाकर, त्रुटि को इच्छानुसार फ़िल्टर किया जा सकता है।
कोई भी फीडबैक लूप [[फ़िल्टर (सिग्नल प्रोसेसिंग)]] के रूप में कार्य करता है, डिजायरेबल नॉइज़ को फ़िल्टर करने के लिए डिज़ाइन किए गए फीडबैक लूप में क्वान्टिजेशन नॉइज़ क्रिएट करके नॉइज़ को शेप देने का कार्य किया जाता है।  


उदाहरण के लिए, फीडबैक प्रणाली पर विचार करें:
'''लो-पास बॉक्सकार फ़िल्टर उदाहरण:'''


: <math>\ y[n] = x[n] + e[n-1],</math>
: <math>\ y[n] = x[n] + e[n-1],</math>
कहाँ {{math|''y''[''n'']}} आउटपुट नमूना मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, {{math|''x''[''n'']}} इनपुट नमूना मान है, {{mvar|n}} नमूना संख्या है, और {{math|''e''[''n'']}} नमूने में प्रस्तुत परिमाणीकरण त्रुटि है {{mvar|n}}:
जहाँ b कांस्टेंट है, {{mvar|n}} साइकिल नंबर है, {{math|''x''[''n'']}} इनपुट सैंपल वैल्यू है, {{math|''y''[''n'']}} आउटपुट सैंपल मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है,   , और {{math|''e''[''n'']}} नमूने में प्रस्तुत क्वान्टिजेशन एरर है {{mvar|n}}:


: <math>\ e[n] = y_\text{quantized}[n] - y[n].</math>
: <math>\ e[n] = y_\text{quantized}[n] - y[n].</math>
इस मॉडल में, जब किसी नमूने की बिट गहराई कम हो जाती है, तो परिमाणित मान और मूल मान के बीच परिमाणीकरण त्रुटि को मापा और संग्रहीत किया जाता है। उस त्रुटि मान को उसके परिमाणीकरण से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि परिमाणीकरण त्रुटि [[लो पास फिल्टर]] है | लो-पास को 2-सैंपल [[बॉक्सकार फ़ंक्शन]] फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, परिमाणीकरण त्रुटि में उच्च आवृत्तियों पर कम शक्ति और कम आवृत्तियों पर उच्च शक्ति होती है।
इस मॉडल में, जब किसी नमूने की बिट डेप्थ कम हो जाती है, तो परिमाणित मान और मूल मान के बीच क्वान्टिजेशन एरर को मापा और संग्रहीत किया जाता है। उस एरर मान को उसके क्वान्टिजेशन से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि क्वान्टिजेशन एरर [[लो पास फिल्टर]] है | लो-पास को 2-सैंपल [[बॉक्सकार फ़ंक्शन]] फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, क्वान्टिजेशन एरर में हाई फ्रीक्वेंसीयों पर कम पॉवर और कम फ्रीक्वेंसीयों पर हाई पॉवर होती है।


ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ आवृत्ति को समायोजित कर सकते हैं, {{mvar|b}}, पिछले नमूने की त्रुटि के बारे में जिसे वापस फीड किया गया है:
ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ फ्रीक्वेंसी को समायोजित कर सकते हैं, {{mvar|b}}, पिछले नमूने की एरर के बारे में जिसे वापस फीड किया गया है:


: <math>\ y[n] = x[n] + b e[n-1] </math>
: <math>\ y[n] = x[n] + b e[n-1] </math>
अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल [[आवृत्ति प्रतिक्रिया]] वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।<ref>{{cite conference
अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल [[आवृत्ति प्रतिक्रिया|फ्रीक्वेंसी प्रतिक्रिया]] वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।<ref>{{cite conference
| title        = Noise shaping filter design for minimally audible signal requantization
| title        = Noise shaping filter design for minimally audible signal requantization
| first1        = Werner
| first1        = Werner
Line 30: Line 30:


: <math>\ W(f) = \frac{1}{A(f)}.</math>
: <math>\ W(f) = \frac{1}{A(f)}.</math>
शोर को आकार देने में हमेशा प्रक्रिया के भीतर ही उचित मात्रा में [[ तड़पना ]] शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध त्रुटियों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो शोर आकार देना प्रभावी रूप से केवल विरूपण आकार देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न आवृत्ति बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रक्रिया में डीथर जोड़ा जाता है
नॉइज़ को शेपिंग देने में हमेशा प्रोसेस के भीतर ही उचित मात्रा में [[ तड़पना ]] शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध एररयों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो नॉइज़ शेपिंग देना प्रभावी रूप से केवल विरूपण शेपिंग देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न फ्रीक्वेंसी बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रोसेस में डीथर जोड़ा जाता है


:<math>\ y[n] = x[n] + b e[n-1] + \mathrm{dither},</math>
:<math>\ y[n] = x[n] + b e[n-1] + \mathrm{dither},</math>
तब परिमाणीकरण त्रुटि वास्तव में शोर बन जाती है, और प्रक्रिया वास्तव में शोर को आकार देती है।
तब क्वान्टिजेशन एरर वास्तव में नॉइज़ बन जाती है, और प्रोसेस वास्तव में नॉइज़ को शेपिंग देती है।


== डिजिटल ऑडियो में ==
== डिजिटल ऑडियो में ==
Line 49: Line 49:
}}
}}


ऑडियो में शोर को आकार देना आमतौर पर बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद शोर है। हालाँकि, कान निम्न स्तर पर दूसरों की तुलना में कुछ आवृत्तियों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। शोर को आकार देने का उपयोग करके परिमाणीकरण त्रुटि को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन आवृत्तियों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन आवृत्तियों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां परिमाणीकरण त्रुटि को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां शोर बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित शोर में कमी दे सकता है।<ref>{{cite conference
ऑडियो में नॉइज़ को शेपिंग देना सामान्यतः बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद नॉइज़ है। हालाँकि, कान निम्न लेवल पर दूसरों की तुलना में कुछ फ्रीक्वेंसीयों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। नॉइज़ को शेपिंग देने का उपयोग करके क्वान्टिजेशन एरर को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन फ्रीक्वेंसीयों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन फ्रीक्वेंसीयों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां क्वान्टिजेशन एरर को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां नॉइज़ बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित नॉइज़ में कमी दे सकता है।<ref>{{cite conference
| title        = Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media
| title        = Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media
| first        = Michael
| first        = Michael
Line 59: Line 59:
| publisher    = [[Audio Engineering Society|AES]]
| publisher    = [[Audio Engineering Society|AES]]
| at            = Preprint 3501
| at            = Preprint 3501
}}</ref> जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref>
}}</ref> जबकि 16-बिट ऑडियो को सामान्यतः 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में नॉइज़-शेपिंग के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।<ref>{{Cite web|title = 24/192 Music Downloads are Very Silly Indeed|url = http://xiph.org/~xiphmont/demo/neil-young.html|website = xiph.org|access-date = 2015-08-01}}</ref>


'''शोर आकार और 1-बिट कन्वर्टर्स'''
'''नॉइज़ शेपिंग और 1-बिट कन्वर्टर्स'''


1989 के आसपास से, 1 बिट [[डेल्टा-सिग्मा मॉड्यूलेशन]]|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग [[एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण]] में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल  बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की [[नाइक्विस्ट आवृत्ति]] के नीचे संपूर्ण गैर-[[ एलियासिंग ]] आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड [[डानामिक रेंज]] केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।
1989 के आसपास से, 1 बिट [[डेल्टा-सिग्मा मॉड्यूलेशन]]|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग [[एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण]] में किया गया है। इसमें बहुत हाई दर पर ऑडियो का सैंपल लेना शामिल है (उदाहरण के लिए 2.8224 सैंपल फ्रीक्वेंसी) लेकिन केवल  बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, नॉइज़ तल 1.4112 मेगाहर्ट्ज की [[नाइक्विस्ट आवृत्ति|नाइक्विस्ट फ्रीक्वेंसी]] के नीचे संपूर्ण गैर-[[ एलियासिंग ]] फ्रीक्वेंसी रेंज में फैला हुआ है। नॉइज़ शेपिंग देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद नॉइज़ को कम करने और श्रव्य सीमा से ऊपर नॉइज़ को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड [[डानामिक रेंज]] केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम फ्रीक्वेंसीयों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। नॉइज़ शेपिंग देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।


1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की  आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .<ref>S. Lipschitz and J. Vanderkooy, "[http://peufeu.free.fr/audio/extremist_dac/files/1-Bit-Is-Bad.pdf Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea]" AES 109th Convention, Sep 2000</ref><ref>S. Lipschitz and J. Vanderkooy, "[http://sjeng.org/ftp/SACD.pdf Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications]" AES 110th convention, May 2001</ref> 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक [[ पल्स कोड मॉडुलेशन ]] सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।
1 बिट कनवर्टर सोनी द्वारा [[डायरेक्ट स्ट्रीम डिजिटल]] प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की  आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .<ref>S. Lipschitz and J. Vanderkooy, "[http://peufeu.free.fr/audio/extremist_dac/files/1-Bit-Is-Bad.pdf Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea]" AES 109th Convention, Sep 2000</ref><ref>S. Lipschitz and J. Vanderkooy, "[http://sjeng.org/ftp/SACD.pdf Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications]" AES 110th convention, May 2001</ref> 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक [[ पल्स कोड मॉडुलेशन ]] सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।
Line 69: Line 69:
=== आधुनिक एडीसी में ===
=== आधुनिक एडीसी में ===


[[एनालॉग डिवाइस]]ेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण ]]्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर  अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है{{specify|reason=No mention found in SNRBoost refs}} स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।
[[एनालॉग डिवाइस]]ेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,<ref>[http://www.analog.com/static/imported-files/data_sheets/AD6677.pdf AD6677 80 MHz Bandwidth IF Receiver] (on Page 23)</ref> और [[ टेक्सस उपकरण ]]्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं<ref>[http://www.ti.com/lit/pdf/slaa445 Using Windowing With SNRBoost3G Technology] (PDF)</ref><ref>[http://www.ti.com/lit/pdf/sboa133 Understanding Low-Amplitude Behavior of 11-bit ADCs] (PDF)</ref> आसपास की फ्रीक्वेंसीयों की तुलना में नॉइज़ लेवल को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर  अच्छा बाथटब शेपिंग तैयार करता है। इसे बिट-बूस्ट जैसी अन्य प्रौद्योगिकीों के साथ जोड़ा जा सकता है{{specify|reason=No mention found in SNRBoost refs}} स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।


== संदर्भ ==
== संदर्भ ==

Revision as of 20:18, 7 October 2023

नॉइज़ शेपिंग देना ऐसी प्रौद्योगिकी है जिसका उपयोग सामान्यतः डिजिटल ऑडियो, इमेज और वीडियो प्रोसेसिंग में किया जाता है, सामान्यतः डिजिटल सिग्नल की क्वान्टिजेशन (सिग्नल प्रोसेसिंग) या ऑडियो बिट डेप्थ रिडक्शन के प्रोसेस के भाग के रूप में डिथरिंग के कॉम्बिनेशन में इसका उद्देश्य रिजल्टएंट सिग्नल के स्पष्ट सिग्नल-टू-नॉइज़ अनुपात को इनक्रीस करना है। यह एरर के पावर स्पेक्ट्रम को परिवर्तित करके ऐसा करता है जो डिथरिंग और क्वान्टिजेशन द्वारा प्रस्तुत किया जाता है; जैसे कि नॉइज़ पॉवर फ्रीक्वेंसी बैंड में लो लेवल पर होती है, जिस पर नॉइज़ कम डिजायरेबल माना जाता है और बैंड करेस्पोंडिंगली हाई लेवल पर होता है, जहां इसे अधिक डिजायरेबल माना जाता है। इमेज प्रोसेसिंग में उपयोग किया जाने वाला पोपुलर नॉइज़ शेपिंग देने वाला एल्गोरिदम 'फ्लोयड स्टाइनबर्ग डिथरिंग' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई नॉइज़ शेपिंग देने वाले एल्गोरिदम 'अब्सोल्यूट थ्रेसहोल्ड हियरिंग' मॉडल पर आधारित हैं।

ऑपरेशन

कोई भी फीडबैक लूप फ़िल्टर (सिग्नल प्रोसेसिंग) के रूप में कार्य करता है, डिजायरेबल नॉइज़ को फ़िल्टर करने के लिए डिज़ाइन किए गए फीडबैक लूप में क्वान्टिजेशन नॉइज़ क्रिएट करके नॉइज़ को शेप देने का कार्य किया जाता है।

लो-पास बॉक्सकार फ़िल्टर उदाहरण:

जहाँ b कांस्टेंट है, n साइकिल नंबर है, x[n] इनपुट सैंपल वैल्यू है, y[n] आउटपुट सैंपल मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, , और e[n] नमूने में प्रस्तुत क्वान्टिजेशन एरर है n:

इस मॉडल में, जब किसी नमूने की बिट डेप्थ कम हो जाती है, तो परिमाणित मान और मूल मान के बीच क्वान्टिजेशन एरर को मापा और संग्रहीत किया जाता है। उस एरर मान को उसके क्वान्टिजेशन से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि क्वान्टिजेशन एरर लो पास फिल्टर है | लो-पास को 2-सैंपल बॉक्सकार फ़ंक्शन फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, क्वान्टिजेशन एरर में हाई फ्रीक्वेंसीयों पर कम पॉवर और कम फ्रीक्वेंसीयों पर हाई पॉवर होती है।

ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ फ्रीक्वेंसी को समायोजित कर सकते हैं, b, पिछले नमूने की एरर के बारे में जिसे वापस फीड किया गया है:

अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल फ्रीक्वेंसी प्रतिक्रिया वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है।[1] डिजिटल ऑडियो के मामले में, आम तौर पर उपयोग किए जाने वाले वेटिंग फ़ंक्शन को श्रवण वक्र की पूर्ण सीमा से विभाजित किया जाता है, अर्थात।

नॉइज़ को शेपिंग देने में हमेशा प्रोसेस के भीतर ही उचित मात्रा में तड़पना शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध एररयों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो नॉइज़ शेपिंग देना प्रभावी रूप से केवल विरूपण शेपिंग देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न फ्रीक्वेंसी बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रोसेस में डीथर जोड़ा जाता है

तब क्वान्टिजेशन एरर वास्तव में नॉइज़ बन जाती है, और प्रोसेस वास्तव में नॉइज़ को शेपिंग देती है।

डिजिटल ऑडियो में

ऑडियो में नॉइज़ को शेपिंग देना सामान्यतः बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद नॉइज़ है। हालाँकि, कान निम्न लेवल पर दूसरों की तुलना में कुछ फ्रीक्वेंसीयों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। नॉइज़ को शेपिंग देने का उपयोग करके क्वान्टिजेशन एरर को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन फ्रीक्वेंसीयों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन फ्रीक्वेंसीयों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां क्वान्टिजेशन एरर को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां नॉइज़ बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित नॉइज़ में कमी दे सकता है।[2] जबकि 16-बिट ऑडियो को सामान्यतः 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में नॉइज़-शेपिंग के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।[3]

नॉइज़ शेपिंग और 1-बिट कन्वर्टर्स

1989 के आसपास से, 1 बिट डेल्टा-सिग्मा मॉड्यूलेशन|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण में किया गया है। इसमें बहुत हाई दर पर ऑडियो का सैंपल लेना शामिल है (उदाहरण के लिए 2.8224 सैंपल फ्रीक्वेंसी) लेकिन केवल बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, नॉइज़ तल 1.4112 मेगाहर्ट्ज की नाइक्विस्ट फ्रीक्वेंसी के नीचे संपूर्ण गैर-एलियासिंग फ्रीक्वेंसी रेंज में फैला हुआ है। नॉइज़ शेपिंग देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद नॉइज़ को कम करने और श्रव्य सीमा से ऊपर नॉइज़ को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड डानामिक रेंज केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम फ्रीक्वेंसीयों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। नॉइज़ शेपिंग देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।

1 बिट कनवर्टर सोनी द्वारा डायरेक्ट स्ट्रीम डिजिटल प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है। .[4][5] 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक पल्स कोड मॉडुलेशन सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।

आधुनिक एडीसी में

एनालॉग डिवाइसेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं,[6] और टेक्सस उपकरण ्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं[7][8] आसपास की फ्रीक्वेंसीयों की तुलना में नॉइज़ लेवल को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर अच्छा बाथटब शेपिंग तैयार करता है। इसे बिट-बूस्ट जैसी अन्य प्रौद्योगिकीों के साथ जोड़ा जा सकता है[specify] स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।

संदर्भ

  1. Verhelst, Werner; De Koning, Dreten (24 October 2001). Noise shaping filter design for minimally audible signal requantization. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. IEEE.
  2. Gerzon, Michael; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 March 1993). Psychoacoustic Noise Shaped Improvements in CD and Other Linear Digital Media. 94th Convention of the Audio Engineering Society, Berlin. AES. Preprint 3501.
  3. "24/192 Music Downloads are Very Silly Indeed". xiph.org. Retrieved 2015-08-01.
  4. S. Lipschitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea" AES 109th Convention, Sep 2000
  5. S. Lipschitz and J. Vanderkooy, "Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" AES 110th convention, May 2001
  6. AD6677 80 MHz Bandwidth IF Receiver (on Page 23)
  7. Using Windowing With SNRBoost3G Technology (PDF)
  8. Understanding Low-Amplitude Behavior of 11-bit ADCs (PDF)