ऑडियो बिट डेप्थ

एनालॉग सिग्नल (लाल रंग में) 4-बिट पीसीएम डिजिटल नमूनों (नीले रंग में) के लिए एन्कोड किया गया; बिट डेप्थ चार है, इसलिए प्रत्येक नमूने का आयाम 16 संभावित मानों में से है।

डिजिटल ऑडियो में पल्स कोड मॉडुलेशन (पीसीएम) का उपयोग करते हुए, अंश डेप्थ प्रत्येक नमूनाकरण (सिग्नल प्रोसेसिंग) में सूचना के बिट्स की संख्या है और यह सीधे प्रत्येक नमूने के रिज़ॉल्यूशन से मेल खाती है। बिट डेप्थ के उदाहरणों में कॉम्पैक्ट डिस्क डिजिटल ऑडियो सम्मिलित है, जो प्रति नमूना 16 बिट का उपयोग करता है, और डीवीडी ऑडियो और ब्लू - रे डिस्क जो प्रति नमूना 24 बिट तक का समर्थन कर सकता है।

मूलभूत कार्यान्वयन में, बिट डेप्थ में भिन्नता मुख्य रूप से परिमाणीकरण त्रुटि से ध्वनि सिग्नल-टू-ध्वनि अनुपात (एसएनआर) और गतिशील सीमा स्तर को प्रभावित करती है। इस प्रकार चूँकि, तकनीकें जैसे ध्वनि को आकार देना और अधिप्रतिचयन इन प्रभावों को थोड़ा सा डेप्थ बदले बिना कम कर सकते हैं। बिट डेप्थ भी बिट दर और फ़ाइल आकार को प्रभावित करती है।

पीसीएम डिजिटल सिग्नल (सिग्नल प्रोसेसिंग) का वर्णन करने के लिए बिट डेप्थ उपयोगी है। गैर-पीसीएम प्रारूप, जैसे हानिपूर्ण संपीड़न का उपयोग करने वाले, संबंधित बिट डेप्थ नहीं रखते हैं।^{[lower-alpha 1]}

बाइनरी प्रतिनिधित्व

पीसीएम सिग्नल डिजिटल ऑडियो नमूनों का क्रम है जिसमें डेटा मूल एनालॉग संकेत के सिग्नल पुनर्निर्माण के लिए आवश्यक जानकारी प्रदान करता है। प्रत्येक नमूना समय में विशिष्ट बिंदु पर संकेत के आयाम का प्रतिनिधित्व करता है और नमूने समय में समान रूप से स्थान पर होते हैं। आयाम एकमात्र जानकारी है जो स्पष्ट रूप से नमूने में संग्रहीत है और यह सामान्यतः या तब पूर्णांक या फ़्लोटिंग पॉइंट नंबर के रूप में संग्रहीत होता है, जो अंकों की निश्चित संख्या के साथ बाइनरी संख्या के रूप में एन्कोड किया जाता है: नमूना की बिट डेप्थ, जिसे शब्द की लंबाई या शब्द का आकार भी कहा जाता है।

रिज़ॉल्यूशन असतत मानों की संख्या को इंगित करता है जिन्हें एनालॉग मानों की श्रेणी में प्रदर्शित किया जा सकता है। जैसे-जैसे शब्द की लंबाई बढ़ती है, बाइनरी पूर्णांकों का रिज़ॉल्यूशन घातांक बढ़ता है। बिट जोड़ने से रिज़ॉल्यूशन दोगुना हो जाता है, दो चौगुना जोड़ दिया जाता है, और इसी तरह। पूर्णांक बिट डेप्थ द्वारा प्रदर्शित किए जा सकने वाले संभावित मानों की संख्या की गणना दो की शक्ति का उपयोग करके की जा सकती हैएवं 2ⁿ, जहाँ n बिट डेप्थ है।^[1]इस प्रकार, 16-बिट सिस्टम का रिज़ॉल्यूशन 65,536 (2¹⁶) संभावित मान है।

पूर्णांक पीसीएम ऑडियो डेटा को सामान्यतः दो के पूरक प्रारूप में हस्ताक्षर संख्या के रूप में संग्रहीत किया जाता है।^[2]

आज, अधिकांश ऑडियो फ़ाइल स्वरूप और डिजिटल ऑडियो वर्कस्टेशन (डीएडब्ल्यू एस) पीसीएम स्वरूपों का समर्थन करते हैं, जिनमें फ़्लोटिंग पॉइंट नंबरों द्वारा दर्शाए गए नमूने हैं।^[3]^[4]^[5]^[6] डब्ल्यू ए वी फ़ाइल स्वरूप और ऑडियो इंटरचेंज फ़ाइल स्वरूप फ़ाइल स्वरूप दोनों फ़्लोटिंग पॉइंट प्रस्तुतियों का समर्थन करते हैं।^[7]^[8]पूर्णांकों के विपरीत, जिसका बिट पैटर्न बिट्स की एकल श्रृंखला है, इसके अतिरिक्त फ्लोटिंग पॉइंट नंबर भिन्न-भिन्न क्षेत्रों से बना होता है जिसका गणितीय संबंध संख्या बनाता है। सबसे आम मानक आई.ई.ई.ई 754 है जो तीन क्षेत्रों से बना है: साइन बिट जो दर्शाता है कि संख्या सकारात्मक है या नकारात्मक, एक्सपोनेंट, और महत्व जो एक्सपोनेंट द्वारा उठाया जाता है। मंटिसा को आई.ई.ई.ई बेस-दो फ़्लोटिंग पॉइंट स्वरूपों में बाइनरी अंश के रूप में व्यक्त किया गया है।^[9]

परिमाणीकरण

बिट डेप्थ पुनर्निर्मित सिग्नल के सिग्नल-टू-ध्वनि अनुपात (एसएनआर) को परिमाणीकरण त्रुटि द्वारा निर्धारित अधिकतम स्तर तक सीमित करती है। बिट डेप्थ का आवृत्ति प्रतिक्रिया पर कोई प्रभाव नहीं पड़ता है, जो नमूना दर से विवश है।

एनॉलॉग से डिजिटल परिवर्तित करने वाला उपकरण के समय क्वांटिज़ेशन त्रुटि प्रारंभ की गई एवं एनालॉग-टू-डिजिटल रूपांतरण (एडीसी) क्वांटिज़ेशन ध्वनि के रूप में मॉडल (सार) हो सकता है। यह एडीसी के अनुरूप इनपुट वोल्टेज और आउटपुट डिजीटल मान के मध्य राउंडिंग त्रुटि है। जो ध्वनि नॉनलाइनियर सिस्टम और सिग्नल पर निर्भर है।

8 बिट बाइनरी नंबर (दशमलव में 149), जिसमें एलएसबी हाइलाइट किया गया है

आदर्श एडीसी में, जहां क्वांटिज़ेशन त्रुटि समान रूप से वितरित की जाती है $\scriptstyle {\pm {\frac {1}{2}}}$ कम से कम महत्वपूर्ण बिट (एलएसबी) और जहां सिग्नल में सभी मात्राकरण स्तरों को कवर करने वाला समान वितरण होता है, सिग्नल-टू-क्वांटिज़ेशन-ध्वनि अनुपात (एसक्यूएनआर) की गणना की जा सकती है

\mathrm {SQNR} =20\log _{10}({\sqrt {1.5}}\cdot 2^{\mathrm {b} })\approx 1.76+6.02{\mathrm {b} }\;\mathrm {dB} \,\!

जहाँ b परिमाणीकरण बिट्स की संख्या है और परिणाम डेसिबल (डीबी) में मापा जाता है।^[10]^[11]

इसलिए, सीडी पर पाए जाने वाले 16-बिट डिजिटल ऑडियो में 98 डीबी का सैद्धांतिक अधिकतम एसएनआर होता है और प्रस्तुतेवर 24-बिट डिजिटल ऑडियो 146 डीबी के रूप में सबसे ऊपर होता है। डिजिटल ऑडियो कन्वर्टर तकनीक लगभग 123 डीबी के एसएनआर तक सीमित है^[12]^[13]^[14] (बिट्स 21-बिट्स की प्रभावी संख्या) एकीकृत सर्किट डिजाइन में वास्तविक दुनिया की सीमाओं के कारण है।^{[lower-alpha 2]} फिर भी, यह लगभग मानव श्रवण प्रणाली के प्रदर्शन से मेल खाता है।^[17]^[18] एकाधिक कन्वर्टर्स का उपयोग ही सिग्नल की विभिन्न श्रेणियों को कवर करने के लिए किया जा सकता है, लंबी अवधि में व्यापक गतिशील सीमा रिकॉर्ड करने के लिए संयुक्त किया जा रहा है, जबकि अभी भी लघु अवधि में एकल कनवर्टर की गतिशील सीमा द्वारा सीमित किया जा रहा है, जिसे डायनेमिक सीमा एक्सटेंशन कहा जाता है।^[19]^[20]

सिग्नल-टू-ध्वनि अनुपात और बिट डेप्थ का रिज़ॉल्यूशन (अनवेटेड)
# बिट्स	एसएनआर (ऑडियो)	एसएनआर (वीडियो)	न्यूनतम डीबी चरण अंतर (परिमाणीकरण पूर्णांकन त्रुटि)	संभावित मानों की संख्या (प्रति नमूना)	हस्ताक्षरित प्रतिनिधित्व के लिए सीमा (प्रति नमूना)।
4	25.84 डीबी	34.31 डीबी	1.578 डीबी	16	−8 to +7
8	49.93 डीबी	58.92 डीबी	0.1948 डीबी	256	−128 to +127
11	67.99 डीबी	77.01 डीबी	0.0331 डीबी	2,048	−1,024 to +1,023
12	74.01 डीबी	83.04 डीबी	0.01806 डीबी	4,096	−2,048 to +2,047
16	98.09 डीबी	107.12 डीबी	0.00598 डीबी	65,536	−32,768 to +32,767
18	110.13 डीबी	-	0.000420 डीबी	262,144	−131,072 to +131,071
20	122.17 डीबी	-	0.000116 डीबी	1,048,576	−524,288 to +524,287
24	146.26 डीबी	-	0.00000871 डीबी	16,777,216	−8,388,608 to +8,388,607
32	194.42 डीबी	-	4.52669337E−8 डीबी	4,294,967,296	−2,147,483,648 to +2,147,483,647
48	290.75 डीबी	-	1.03295150E−12 डीबी	281,474,976,710,656	−140,737,488,355,328 to +140,737,488,355,327
64	387.08 डीबी	-	2.09836488E−17 डीबी	18,446,744,073,709,551,616	−9,223,372,036,854,775,808 to +9,223,372,036,854,775,807

फ़्लोटिंग पॉइंट

फ़्लोटिंग-पॉइंट नमूनों का रिज़ॉल्यूशन पूर्णांक नमूनों की तुलना में कम सीधा होता है जिससे कि फ़्लोटिंग-पॉइंट मान समान रूप से नहीं होते हैं। इस प्रकार फ़्लोटिंग-पॉइंट प्रतिनिधित्व में, किन्हीं दो आसन्न मानों के मध्य का स्थान मान के अनुपात में होता है। यह पूर्णांक प्रणाली की तुलना में एसएनआर को बहुत बढ़ाता है, जिससे कि उच्च-स्तरीय सिग्नल की त्रुटिहीनता निम्न स्तर पर समान सिग्नल की त्रुटिहीनता के समान होती है।^[21]

फ़्लोटिंग पॉइंट्स और पूर्णांकों के मध्य ट्रेड-ऑफ़ यह है कि बड़े फ़्लोटिंग-पॉइंट मानों के मध्य का स्थान समान बिट डेप्थ के बड़े पूर्णांक मानों के मध्य के स्थान से अधिक होता है। बड़ी फ़्लोटिंग-पॉइंट संख्या को राउंड करने से छोटी फ़्लोटिंग-पॉइंट संख्या को राउंड करने की तुलना में अधिक त्रुटि होती है, जबकि पूर्णांक संख्या को राउंड करने से हमेशा समान स्तर की त्रुटि होती है। दूसरे शब्दों में, पूर्णांक में राउंड-ऑफ होता है जो एकसमान होता है, हमेशा एलएसबी को 0 या 1 पर गोल करता है और फ़्लोटिंग पॉइंट में समान एसएनआर होता है, परिमाणीकरण ध्वनि स्तर हमेशा सिग्नल स्तर के निश्चित अनुपात का होता है।^[21] फ़्लोटिंग-पॉइंट नॉइज़ फ़्लोर सिग्नल के ऊपर उठेगा और सिग्नल के गिरते ही गिर जाता है, जिसके परिणामस्वरूप श्रव्य विचरण होगा यदि बिट डेप्थ पर्याप्त कम होती है।^[22]

ऑडियो प्रोसेसिंग

सामान्यतः डिजिटल ऑडियो पर अधिकांश प्रोसेसिंग ऑपरेशंस में नमूनों का पुनः परिमाणीकरण सम्मिलित होता है और इस प्रकार एनालॉग-टू-डिजिटल रूपांतरण के समय प्रारंभ की गई मूल परिमाणीकरण त्रुटि के अनुरूप अतिरिक्त राउंडिंग त्रुटियां होती हैं। एडीसी के समय अन्तर्निहित त्रुटि से बड़ी राउंडिंग त्रुटियों को रोकने के लिए, प्रसंस्करण के समय गणना इनपुट नमूने की तुलना में उच्च त्रुटिहीनता पर की जाती है।^[23]

डिजिटल सिग्नल प्रोसेसिंग (डीएसपी) संचालन निश्चित बिंदु अंकगणितीय या फ़्लोटिंग-पॉइंट परिशुद्धता में किया जा सकता है। किसी भी स्थितियों में, प्रत्येक ऑपरेशन की त्रुटिहीनता प्रसंस्करण के प्रत्येक चरण को करने के लिए उपयोग किए जाने वाले हार्डवेयर संचालन की त्रुटिहीनता से निर्धारित होती है, न कि इनपुट डेटा के रिज़ॉल्यूशन से। उदाहरण के लिए, x86 प्रोसेसर पर, फ्लोटिंग-पॉइंट ऑपरेशंस एकल-परिशुद्धता फ़्लोटिंग-पॉइंट प्रारूप या डबल-त्रुटिहीन फ़्लोटिंग-पॉइंट प्रारूप और 16-, 32- या 64-बिट रेजोल्यूशन पर फिक्स्ड-पॉइंट ऑपरेशंस के साथ किए जाते हैं। परिणाम स्वरुप, इंटेल-आधारित हार्डवेयर पर किए गए सभी प्रसंस्करण इन बाधाओं के साथ स्रोत प्रारूप की परवाह किए बिना किए जाएंगे।^{[lower-alpha 3]}

निश्चित बिंदु डिजिटल सिग्नल प्रोसेसर अधिकांशतः विशिष्ट सिग्नल रिज़ॉल्यूशन का समर्थन करने के लिए विशिष्ट शब्द लंबाई का समर्थन करते हैं। उदाहरण के लिए, मोटोरोला 56000 डीएसपी चिप 24-बिट मल्टीप्लायरों और 56-बिट संचायक का उपयोग दो 24-बिट नमूनों पर अतिप्रवाह या ट्रंकेशन के बिना बहु-संचित संचालन करने के लिए करता है।^[24] उन उपकरणों पर जो बड़े संचायक का समर्थन नहीं करते हैं, त्रुटिहीनता को कम करते हुए निश्चित बिंदु परिणामों को छोटा किया जा सकता है। डीएसपी के कई चरणों के माध्यम से त्रुटियाँ दर पर मिश्रित होती हैं जो कि किए जा रहे संचालन पर निर्भर करती हैं। डीसी ऑफसेट के बिना ऑडियो डेटा पर असंबद्ध प्रसंस्करण चरणों के लिए, त्रुटियों को शून्य साधनों के साथ यादृच्छिक माना जाता है। इस धारणा के अनुसार , वितरण का मानक विचलन संचालन की संख्या के वर्गमूल के साथ त्रुटि संकेत और परिमाणीकरण त्रुटि पैमानों का प्रतिनिधित्व करता है।^[25] एल्गोरिदम के लिए उच्च स्तर की त्रुटिहीनता आवश्यक है जिसमें बार-बार प्रसंस्करण सम्मिलित होती है, जैसे कि कनवल्शन।^[23] पुनरावर्ती एल्गोरिदम में उच्च स्तर की त्रुटिहीनता भी आवश्यक होती है, जैसे कि अनंत आवेग प्रतिक्रिया (आईआईआर) फ़िल्टर।^[26] आईआईआर फ़िल्टर के विशेष स्थितियों में, राउंडिंग त्रुटि आवृत्ति प्रतिक्रिया को कम कर सकती है और अस्थिरता उत्पन्न कर सकती है।^[23]

डिथर

File:Lindos10.svg

ध्वनि स्तर के साथ तुलना के उद्देश्य के लिए ऑडियो प्रक्रिया चरणों में हेडरूम और ध्वनि तल

राउंडिंग एरर और ऑडियो प्रोसेसिंग के समय प्रारंभ की गई परिशुद्धता के नुकसान सहित परिमाणीकरण त्रुटि द्वारा प्रस्तुत किए गए ध्वनि को परिमाणित करने से पहले सिग्नल में थोड़ी मात्रा में रैंडम ध्वनि, जिसे डाइथर कहा जाता है, को जोड़कर कम किया जा सकता है। डिथरिंग गैर-रैखिक परिमाणीकरण त्रुटि व्यवहार को समाप्त करता है, किन्तु थोड़ा ऊंचा ध्वनि तल की कीमत पर बहुत कम विरूपण देता है। आईटीयू-आर 468 का उपयोग करके मापे गए 16-बिट डिजिटल ऑडियो के लिए अनुशंसित ध्वनि भार संरेखण स्तर से लगभग 66 डीबी नीचे है, या डिजिटल पूर्ण पैमाने से 84 डीबी नीचे है, जो माइक्रोफ़ोन और कमरे के ध्वनि स्तर के बराबर है और इसलिए 16-बिट ऑडियो में बहुत कम परिणाम है।

24-बिट और 32-बिट ऑडियो को डिथरिंग की आवश्यकता नहीं होती है, जिससे कि डिजिटल कन्वर्टर का ध्वनि स्तर हमेशा प्रयुक्त होने वाले किसी भी आवश्यक स्तर से अधिक होता है। सैद्धांतिक रूप से 24-बिट ऑडियो डायनामिक सीमा के 144 डीबी को एनकोड कर सकता है, और 32-बिट ऑडियो 192 डीबी प्राप्त कर सकता है, किन्तु वास्तविक दुनिया में इसे प्राप्त करना लगभग असंभव है, जिससे कि यहां तक कि सबसे अच्छे सेंसर और माइक्रोफ़ोन भी संभवतः ही कभी 130 डीबी से अधिक होते हैं।^[27]

प्रभावी गतिशील सीमा को बढ़ाने के लिए डाइथर का भी उपयोग किया जा सकता है। इस प्रकार 16-बिट ऑडियो की कथित डायनामिक सीमा नॉइज़ शेपिंगएवंनॉइज़-शेप्ड डिथर के साथ 120 डीबी या उससे अधिक हो सकती है, जो मानव कान की आवृत्ति प्रतिक्रिया का लाभ उठाती है।^[28]^[29]

डायनेमिक सीमा और हेडरूम

डायनेमिक सीमा सबसे बड़े और सबसे छोटे सिग्नल के मध्य का अंतर है जिसे सिस्टम रिकॉर्ड या पुन: प्रस्तुत कर सकता है। बिना किसी कठिनाई के, डायनेमिक सीमा क्वांटिज़ेशन नॉइज़ फ्लोर से संबंधित है। उदाहरण के लिए, 16-बिट पूर्णांक रिज़ॉल्यूशन लगभग 96 डीबी की गतिशील सीमा की अनुमति देता है। डिथर के उचित आवेदन के साथ, डिजिटल सिस्टम उनके संकल्प से कम स्तर के संकेतों को पुन: प्रस्तुत कर सकते हैं, सामान्य रूप से संकल्प द्वारा लगाए गए सीमा से अधिक प्रभावी गतिशील सीमा का विस्तार करते हैं।^[30] इस प्रकार ओवरसैंपलिंग और नॉइज़ शेपिंग जैसी तकनीकों का उपयोग ब्याज की आवृत्ति बैंड से परिमाणीकरण त्रुटि को स्थानांतरित करके नमूना ऑडियो की गतिशील सीमा को और बढ़ा सकता है।

यदि सिग्नल का अधिकतम स्तर बिट डेप्थ द्वारा अनुमत स्तर से कम है, तब रिकॉर्डिंग में हेडरूम (ऑडियो सिग्नल प्रोसेसिंग) है। रिकॉर्डिंग स्टूडियो के समय उच्च बिट डेप्थ का उपयोग करने से समान गतिशील सीमा बनाए रखते हुए हेडरूम उपलब्ध हो सकता है। यह कम मात्रा में परिमाणीकरण त्रुटियों को बढ़ाए बिना क्लिपिंग (ऑडियो) के जोखिम को कम करता है।

ओवरसैंपलिंग

प्रति नमूना बिट्स की संख्या को बदले बिना पीसीएम ऑडियो की गतिशील सीमा को बढ़ाने के लिए ओवरसैंपलिंग वैकल्पिक विधि है।^[31] ओवरसैंपलिंग में, वांछित नमूना दर के गुणकों पर ऑडियो नमूने प्राप्त किए जाते हैं। जिससे कि परिमाणीकरण त्रुटि को आवृत्ति के साथ समान रूप से वितरित माना जाता है, अधिकांश परिमाणीकरण त्रुटि को अल्ट्रासोनिक आवृत्तियों में स्थानांतरित कर दिया जाता है और प्लेबैक के समय डिज़िटल से एनालॉग कन्वर्टर द्वारा हटाया जा सकता है।

संकल्प एन के अतिरिक्त बिट्स के समतुल्य वृद्धि के लिए, सिग्नल को ओवरसैंपल किया जाना चाहिए।

\mathrm {number\ of\ samples} =(2^{n})^{2}=2^{2n}.

उदाहरण के लिए, 14-बिट ADC 16× ओवरसैंपलिंग या 768 किलोहर्ट्‍जपर संचालित होने पर 16-बिट 48 किलोहर्ट्‍जऑडियो उत्पन्न कर सकता है। इस प्रकार ओवरसैंपल्ड पीसीएम, इसलिए समान रिज़ॉल्यूशन प्राप्त करने के लिए अधिक नमूनों के लिए प्रति नमूना कम बिट्स का आदान-प्रदान करता है।

सिग्नल पुनर्निर्माण पर ओवरसैंपलिंग, स्रोत पर अनुपस्थित ओवरसैंपलिंग के साथ डायनेमिक सीमा को भी बढ़ाया जा सकता है। पुनर्निर्माण के समय 16× ओवरसैंपलिंग पर विचार करें। पुनर्निर्माण पर प्रत्येक नमूना अद्वितीय होगा जिसमें मूल नमूना बिंदुओं में से प्रत्येक के लिए सोलह सम्मिलित किए गए हैं, सभी की गणना डिजिटल पुनर्निर्माण फ़िल्टर द्वारा की गई है। बढ़ी हुई प्रभावी बिट डेप्थ का तंत्र जैसा कि पहले चर्चा की गई है, अर्थात क्वांटिज़ेशन ध्वनि शक्ति को कम नहीं किया गया है, किन्तु ध्वनि स्पेक्ट्रम को 16 × ऑडियो बैंडविड्थ में फैलाया गया है।

ऐतिहासिक नोट—कॉम्पैक्ट डिस्क मानक सोनी और फिलिप्स के सहयोग से विकसित किया गया था। पहली सोनी उपभोक्ता इकाई में 16-बिट डीएसी था। पहली फिलिप्स इकाइयों में दोहरे 14-बिट डीएसी थे। इसने बाज़ार और यहां तक कि प्रस्तुतेवर हलकों में भी भ्रमित किया, जिससे कि 14-बिट पीसीएम 84 डीबी एसएनआर, 12 डीबी 16-बिट पीसीएम से कम की अनुमति देता है। फिलिप्स ने पहले क्रम के नॉइज़ शेपिंग के साथ 4× ओवरसैंपलिंग को प्रयुक्त किया था जो सैद्धांतिक रूप से सीडी प्रारूप की पूर्ण 96 डीबी डायनेमिक सीमा को महसूस करता था।^[32] इस प्रकार व्यावहारिक रूप से फ़िलिप्स सीडी100 को 20 हर्ट्ज–20 किलोहर्ट्‍ज के ऑडियो बैंड में 90 डीबी एसएनआर पर रेट किया गया था, जो सोनी के सीडीपी-101 के समान था।^[33]^[34]

ध्वनि को आकार देना

किसी सिग्नल के ओवरसैंपलिंग से सभी फ्रीक्वेंसी पर बैंडविथ की प्रति यूनिट समान परिमाणीकरण ध्वनि होता है और डायनेमिक सीमा होती है जो ओवरसैंपलिंग अनुपात के केवल वर्गमूल के साथ उत्तम होती है। इस प्रकार नॉइज़ शेपिंग ऐसी तकनीक है जो उच्च आवृत्तियों पर अतिरिक्त ध्वनि जोड़ती है जो कम आवृत्तियों पर कुछ त्रुटि को रद्द कर देती है, जिसके परिणामस्वरूप ओवरसैंपलिंग के समय गतिशील सीमा में बड़ी वृद्धि होती है। nवें क्रम के नॉइज़ शेपिंग के लिए, ओवरसैंपल्ड सिग्नल की डायनेमिक सीमा बिना नॉइज़ शेपिंग के ओवरसैंपलिंग की तुलना में अतिरिक्त 6n डीबी से उत्तम हो जाती है।^[35] उदाहरण के लिए, दूसरे क्रम के नॉइज़ शेपिंग के साथ 4× ओवरसैंपलिंग पर सैंपल लिए गए 20 किलोहर्ट्‍जएनालॉग ऑडियो के लिए, डायनेमिक सीमा 30 डीबी बढ़ जाती है। इसलिए, 176 किलोहर्ट्‍ज पर सैंपल किए गए 16-बिट सिग्नल की थोड़ी डेप्थ 21-बिट सिग्नल के बराबर होती है, जो नॉइज़ शेपिंग के बिना 44.1 किलोहर्ट्‍जपर सैंपल किया जाता है।

नॉइज़ शेपिंग को सामान्यतः डेल्टा-सिग्मा मॉड्यूलेशन के साथ प्रयुक्त किया जाता है। इस प्रकार डेल्टा-सिग्मा मॉड्यूलेशन का उपयोग करके, डायरेक्ट स्ट्रीम डिजिटल 64× ओवरसैंपलिंग के साथ 1-बिट ऑडियो का उपयोग करके ऑडियो फ़्रीक्वेंसी पर सैद्धांतिक 120 डीबी एसएनआर प्राप्त करता है।

अनुप्रयोग

बिट डेप्थ डिजिटल ऑडियो कार्यान्वयन की मूलभूत संपत्ति है। आवेदन आवश्यकताओं और उपकरण क्षमताओं के आधार पर, भिन्न-भिन्न अनुप्रयोगों के लिए भिन्न-भिन्न बिट डेप्थ का उपयोग किया जाता है।

उदाहरण अनुप्रयोग और समर्थित ऑडियो बिट डेप्थ
आवेदन	विवरण	ऑडियो प्रारूप
सीडी-डीए (लाल किताब)^[36]	डिजीटल मीडिया	16-बिट एलपीसीएम
डीवीडी ऑडियो ^[37]	डिजीटल मीडिया	16-, 20- और 24-बिट एलपीसीएम^{[upper-alpha 1]}
सुपर ऑडियो सीडी ^[38]	डिजीटल मीडिया	1-बिट डायरेक्ट स्ट्रीम डिजिटल (पीडीएम)
ब्लू-रे डिस्क ऑडियो ^[39]	डिजीटल मीडिया	16-, 20- and 24-बिट एलपीसीएम और अन्य ^{[upper-alpha 2]}
डीवी ऑडियो ^[40]	डिजीटल मीडिया	12- और 16-बिट असम्पीडित पीसीएम
आईटीयू- टी अनुशंसा जी.711^[41]	टेलीफोनी के लिए संपीड़न मानक	8-बिट पीसीएम के साथ कंपैंडिंग ^{[upper-alpha 3]}
NICAM-1, NICAM-2 and NICAM-3^[42]	संपीड़न मानक के लिए प्रसारण	कंपाउंडिंग के साथ क्रमशः 10-, 11- और 10-बिट पीसीएम ^{[upper-alpha 4]}
ललक	डी ए डब्ल्यू द्वारा पॉल डेविस और अर्दोर समुदाय	32-बिट फ़्लोटिंग पॉइंट ^[43]
प्रो उपकरण 11	डीएडब्ल्यू द्वारा शौकीन चावला प्रौद्योगिकी	16- और 24-बिट या 32-बिट फ़्लोटिंग पॉइंट सत्र और 64-बिट फ़्लोटिंग पॉइंट मिश्रण ^[44]
तर्क प्रो एक्स	डीएडब्ल्यू द्वारा एप्पल इंक.	16- और 24-बिट प्रोजेक्ट और 32-बिट या 64-बिट फ़्लोटिंग पॉइंट मिश्रण^[45]
घनफल	डीएडब्ल्यू द्वारा स्टाइनबर्ग	32-बिट फ्लोट या 64-बिट फ्लोट के लिए ऑडियो प्रोसेसिंग त्रुटिहीनता की अनुमति देता है ^[46]
एबलटन लाइव ^[6]	डीएडब्ल्यू द्वारा एबलटन	32-बिट फ्लोटिंग पॉइंट बिट डेप्थ और 64-बिट समिंग
कारण 7	डीएडब्ल्यू द्वारा प्रोपेलरहेड सॉफ्टवेयर	16-, 20- और 24-बिट I/O, 32-बिट फ्लोटिंग पॉइंट अंकगणित और 64-बिट योग ^[47]
रीपर 5	डीएडब्ल्यू द्वारा कोकोस इंक	8-बिट पीसीएम, 16-बिट पीसीएम, 24-बिट पीसीएम, 32-बिट पीसीएम, 32-बिट एफपी, 64-बिट एफपी, 4-बिट आईएमए एडीपीसीएम और 2-बिट सीएडीपीसीएम प्रतिपादन; 8-बिट इंट, 16-बिट इंट, 24-बिट इंट, 32-बिट इंट, 32-बिट फ्लोट और 64-बिट फ्लोट मिश्रण
गैराज बैण्ड '11 (संस्करण 6)	ऐप्पल इंक द्वारा डीएडब्ल्यू।	24-बिट वास्तविक उपकरण रिकॉर्डिंग के साथ 16-बिट डिफ़ॉल्ट ^[48]
धृष्टता	ओपन सोर्स ऑडियो एडिटर	16- और 24-बिट एलपीसीएम और 32-बिट फ्लोटिंग पॉइंट ^[49]
एफएल स्टूडियो	डीएडब्ल्यू द्वारा छवि लाइन	16- और 24-बिट इंट और 32-बिट फ्लोटिंग पॉइंट (OS द्वारा नियंत्रित) ^[50]

बिट दर और फ़ाइल का आकार

बिट डेप्थ बिट दर और फ़ाइल आकार को प्रभावित करती है। बिट्स कंप्यूटिंग और डिजिटल संचार में उपयोग की जाने वाली डेटा की मूल इकाई है। बिट दर डेटा की मात्रा को संदर्भित करती है, विशेष रूप से बिट्स, प्रेषित या प्रति सेकंड प्राप्त होती है। इस प्रकार बिका हुआ और अन्य हानिकारक संपीड़ित ऑडियो प्रारूपों में, बिट दर ऑडियो सिग्नल को एन्कोड करने के लिए उपयोग की जाने वाली जानकारी की मात्रा का वर्णन करती है। अतः इसे सामान्यतः केबी/एस में मापा जाता है।^[51]

यह भी देखें

[lower-alpha 1]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[lower-alpha 2]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[lower-alpha 3]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[upper-alpha 1]

[38]

[39]

[upper-alpha 2]

[40]

[41]

[upper-alpha 3]

[42]

[upper-alpha 4]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

Anonymous

Search