रव रूपण

शोर आकार देना एक ऐसी तकनीक है जिसका उपयोग आमतौर पर डिजिटल ऑडियो, मूर्ति प्रोद्योगिकी  और  वीडियो प्रसंस्करण  में किया जाता है, आमतौर पर डिजिटल सिग्नल की  परिमाणीकरण (सिग्नल प्रोसेसिंग)  या  ऑडियो बिट गहराई |बिट-डेप्थ कमी की प्रक्रिया के हिस्से के रूप में  कटौती  के संयोजन में। इसका उद्देश्य परिणामी सिग्नल के स्पष्ट सिग्नल-टू-शोर अनुपात को बढ़ाना है। यह त्रुटि के पावर स्पेक्ट्रम को बदलकर ऐसा करता है जो डिथरिंग और परिमाणीकरण द्वारा प्रस्तुत किया जाता है; जैसे कि ध्वनि शक्ति आवृत्ति बैंड में निचले स्तर पर होती है, जिस पर शोर कम वांछनीय माना जाता है और बैंड में तदनुरूप उच्च स्तर पर होता है, जहां इसे अधिक वांछनीय माना जाता है। छवि प्रसंस्करण में उपयोग किया जाने वाला एक लोकप्रिय शोर आकार देने वाला एल्गोरिदम 'फ्लोयड स्टाइनबर्ग डगमगाते हुए' के रूप में जाना जाता है; और ऑडियो प्रोसेसिंग में उपयोग किए जाने वाले कई शोर आकार देने वाले एल्गोरिदम 'सुनने की पूर्ण सीमा' मॉडल पर आधारित हैं।

ऑपरेशन
शोर को आकार देने का काम परिमाणीकरण त्रुटि को प्रतिक्रिया  लूप में डालकर किया जाता है। कोई भी फीडबैक लूप फ़िल्टर (सिग्नल प्रोसेसिंग) के रूप में कार्य करता है, इसलिए त्रुटि के लिए फीडबैक लूप बनाकर, त्रुटि को इच्छानुसार फ़िल्टर किया जा सकता है।

उदाहरण के लिए, फीडबैक प्रणाली पर विचार करें:


 * $$\ y[n] = x[n] + e[n-1],$$

कहाँ $y[n]$ आउटपुट नमूना मान है जो क्वांटिज़ेशन (सिग्नल प्रोसेसिंग) होना है, $x[n]$ इनपुट नमूना मान है, $n$ नमूना संख्या है, और $e[n]$ नमूने में प्रस्तुत परिमाणीकरण त्रुटि है $n$:


 * $$\ e[n] = y_\text{quantized}[n] - y[n].$$

इस मॉडल में, जब किसी नमूने की बिट गहराई कम हो जाती है, तो परिमाणित मान और मूल मान के बीच परिमाणीकरण त्रुटि को मापा और संग्रहीत किया जाता है। उस त्रुटि मान को उसके परिमाणीकरण से पहले अगले नमूने में फिर से जोड़ा जाता है। प्रभाव यह है कि परिमाणीकरण त्रुटि लो पास फिल्टर है | लो-पास को 2-सैंपल बॉक्सकार फ़ंक्शन फ़िल्टर द्वारा फ़िल्टर किया जाता है (जिसे मूविंग_एवरेज#सिंपल मूविंग एवरेज के रूप में भी जाना जाता है)। परिणामस्वरूप, पहले की तुलना में, परिमाणीकरण त्रुटि में उच्च आवृत्तियों पर कम शक्ति और कम आवृत्तियों पर उच्च शक्ति होती है।

ध्यान दें कि हम अनुपात को संशोधित करके फ़िल्टर की कटऑफ़ आवृत्ति को समायोजित कर सकते हैं, $b$, पिछले नमूने की त्रुटि के बारे में जिसे वापस फीड किया गया है:


 * $$\ y[n] = x[n] + b e[n-1] $$

अधिक सामान्यतः, किसी भी FIR फ़िल्टर या IIR फ़िल्टर का उपयोग अधिक जटिल आवृत्ति प्रतिक्रिया वक्र बनाने के लिए किया जा सकता है। ऐसे फ़िल्टरों को Least_squares#भारित न्यूनतम वर्ग विधि का उपयोग करके डिज़ाइन किया जा सकता है। डिजिटल ऑडियो के मामले में, आम तौर पर उपयोग किए जाने वाले वेटिंग फ़ंक्शन को श्रवण वक्र की पूर्ण सीमा से विभाजित किया जाता है, अर्थात।


 * $$\ W(f) = \frac{1}{A(f)}.$$

शोर को आकार देने में हमेशा प्रक्रिया के भीतर ही उचित मात्रा में तड़पना  शामिल होना चाहिए ताकि सिग्नल में निर्धारित और सहसंबद्ध त्रुटियों को रोका जा सके। यदि डिथर का उपयोग नहीं किया जाता है तो शोर आकार देना प्रभावी रूप से केवल विरूपण आकार देने के रूप में कार्य करता है - विरूपण ऊर्जा को विभिन्न आवृत्ति बैंडों में धकेलता है, लेकिन यह अभी भी विरूपण है। यदि इस प्रक्रिया में डीथर जोड़ा जाता है


 * $$\ y[n] = x[n] + b e[n-1] + \mathrm{dither},$$

तब परिमाणीकरण त्रुटि वास्तव में शोर बन जाती है, और प्रक्रिया वास्तव में शोर को आकार देती है।

डिजिटल ऑडियो में
ऑडियो में शोर को आकार देना आमतौर पर बिट-रिडक्शन योजना के रूप में लागू किया जाता है। डिथर का सबसे बुनियादी रूप सपाट, सफेद शोर है। हालाँकि, कान निम्न स्तर पर दूसरों की तुलना में कुछ आवृत्तियों के प्रति कम संवेदनशील होते हैं (समान-ज़ोर समोच्च देखें)। शोर को आकार देने का उपयोग करके परिमाणीकरण त्रुटि को प्रभावी ढंग से चारों ओर फैलाया जा सकता है ताकि इसका अधिक हिस्सा उन आवृत्तियों पर केंद्रित हो जिन्हें सुना नहीं जा सकता है और इसका कम हिस्सा उन आवृत्तियों पर केंद्रित है जिन्हें सुना जा सकता है। इसका परिणाम यह होता है कि जहां कान सबसे अधिक महत्वपूर्ण होते हैं, वहां परिमाणीकरण त्रुटि को काफी कम किया जा सकता है और जहां कान कम संवेदनशील होते हैं, वहां शोर बहुत अधिक होता है। यह सीधे डिथर की तुलना में 4 बिट्स की कथित शोर में कमी दे सकता है। जबकि 16-बिट ऑडियो को आमतौर पर 96 डीबी की गतिशील रेंज माना जाता है (क्वांटिज़ेशन विरूपण गणना देखें), इसे वास्तव में शोर-आकार के डिथर का उपयोग करके 120 डीबी तक बढ़ाया जा सकता है।

शोर आकार और 1-बिट कन्वर्टर्स
1989 के आसपास से, 1 बिट डेल्टा-सिग्मा मॉड्यूलेशन|डेल्टा-सिग्मा मॉड्यूलेटर का उपयोग एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण में किया गया है। इसमें बहुत उच्च दर पर ऑडियो का नमूना लेना शामिल है (उदाहरण के लिए 2.8224 नमूना आवृत्ति) लेकिन केवल एक बिट का उपयोग करना। क्योंकि केवल 1 बिट का उपयोग किया जाता है, इस कनवर्टर में केवल 6.02 डीबी की गतिशील रेंज होती है। हालाँकि, शोर तल 1.4112 मेगाहर्ट्ज की नाइक्विस्ट आवृत्ति के नीचे संपूर्ण गैर- एलियासिंग आवृत्ति रेंज में फैला हुआ है। शोर आकार देने का उपयोग श्रव्य सीमा (20 हर्ट्ज से 20 किलोहर्ट्ज़) में मौजूद शोर को कम करने और श्रव्य सीमा से ऊपर शोर को बढ़ाने के लिए किया जाता है। इसके परिणामस्वरूप ब्रॉडबैंड डानामिक रेंज केवल 7.78 डीबी है, लेकिन यह फ़्रीक्वेंसी बैंड के बीच सुसंगत नहीं है, और सबसे कम आवृत्तियों (श्रव्य रेंज) में डायनामिक रेंज बहुत अधिक है - 100 डीबी से अधिक। शोर आकार देना स्वाभाविक रूप से डेल्टा-सिग्मा मॉड्यूलेटर में बनाया गया है।

1 बिट कनवर्टर सोनी द्वारा डायरेक्ट स्ट्रीम डिजिटल प्रारूप का आधार है। 1 बिट कनवर्टर (और इस प्रकार डीएसडी सिस्टम) की एक आलोचना यह है कि क्योंकि सिग्नल और फीडबैक लूप दोनों में केवल 1 बिट का उपयोग किया जाता है, फीडबैक लूप में पर्याप्त मात्रा में डिथर का उपयोग नहीं किया जा सकता है और कुछ शर्तों के तहत विरूपण सुना जा सकता है।. 2000 के बाद से बनाए गए अधिकांश ए/डी कन्वर्टर्स मल्टी-बिट या मल्टी-लेवल डेल्टा सिग्मा मॉड्यूलेटर का उपयोग करते हैं जो 1 बिट से अधिक आउटपुट उत्पन्न करते हैं ताकि फीडबैक लूप में उचित डीथर जोड़ा जा सके। पारंपरिक पल्स कोड मॉडुलेशन  सैंपलिंग के लिए सिग्नल को डेसीमेशन (सिग्नल प्रोसेसिंग) से 44.1 kHz या अन्य उपयुक्त सैंपल दरों पर ले जाया जाता है।

आधुनिक एडीसी में
एनालॉग डिवाइसेज़ जिसे वे नॉइज़ शेपिंग रिक्वांटाइज़र के रूप में संदर्भित करते हैं, उसका उपयोग करते हैं, और टेक्सस उपकरण ्स जिसे वे SNRBoost के रूप में संदर्भित करते हैं उसका उपयोग करते हैं  आसपास की आवृत्तियों की तुलना में शोर स्तर को लगभग 30db कम करना। यह गैर-निरंतर संचालन की लागत पर आता है लेकिन स्पेक्ट्रम फर्श पर एक अच्छा बाथटब आकार तैयार करता है। इसे बिट-बूस्ट जैसी अन्य तकनीकों के साथ जोड़ा जा सकता है स्पेक्ट्रम के रिज़ॉल्यूशन को और बढ़ाने के लिए।