डेटा संपीड़न अनुपात

डेटा संपीड़न अनुपात, जिसे संपीड़न शक्ति के रूप में भी जाना जाता है, डेटा संपीड़न एल्गोरिदम द्वारा उत्पादित डेटा प्रतिनिधित्व के आकार में सापेक्ष कमी का माप है। इसे आम तौर पर संपीड़ित आकार द्वारा असम्पीडित आकार के विभाजन के रूप में व्यक्त किया जाता है।

परिभाषा
डेटा संपीड़न अनुपात को असम्पीडित आकार और संपीड़ित आकार के बीच के अनुपात के रूप में परिभाषित किया गया है:
 * $$ {\rm Compression\;Ratio} = \frac{\rm Uncompressed\;Size}{\rm Compressed\;Size}$$

इस प्रकार, प्रतिनिधित्व जो किसी फ़ाइल के भंडारण आकार को 10 एमबी से 2 एमबी तक संपीड़ित करता है, उसका संपीड़न अनुपात 10/2 = 5 होता है, जिसे अक्सर स्पष्ट अनुपात, 5:1 (पांच से पढ़ें), या अंतर्निहित अनुपात के रूप में नोट किया जाता है। 5/1. यह सूत्रीकरण संपीड़न के लिए समान रूप से लागू होता है, जहां असम्पीडित आकार मूल का होता है; और डीकंप्रेसन के लिए, जहां असम्पीडित आकार प्रजनन का होता है।

कभी-कभी इसके स्थान पर स्थान की बचत दी जाती है, जिसे असम्पीडित आकार के सापेक्ष आकार में कमी के रूप में परिभाषित किया जाता है:


 * $${\rm Space\;Saving} = 1 - \frac{\rm Compressed\;Size}{\rm Uncompressed\;Size}$$

इस प्रकार, प्रतिनिधित्व जो फ़ाइल के भंडारण आकार को 10 एमबी से 2 एमबी तक संपीड़ित करता है, 1 - 2/10 = 0.8 की स्थान बचत उत्पन्न करता है, जिसे अक्सर प्रतिशत, 80% के रूप में नोट किया जाता है।

अनिश्चित आकार के संकेतों के लिए, जैसे कि ऑडियो और वीडियो स्ट्रीमिंग, संपीड़न अनुपात को डेटा आकार के बजाय असंपीड़ित और संपीड़ित बिट दर के संदर्भ में परिभाषित किया गया है:


 * $$ {\rm Compression\;Ratio} = \frac{\rm Uncompressed\;Data\;Rate}{\rm Compressed\;Data\;Rate}$$

और स्थान की बचत के बजाय, कोई डेटा-दर बचत की बात करता है, जिसे असम्पीडित डेटा दर के सापेक्ष डेटा-दर में कमी के रूप में परिभाषित किया गया है:


 * $${\rm Data\;Rate\;Saving} = 1 - \frac{\rm Compressed\;Data\;Rate}{\rm Uncompressed\;Data\;Rate}$$

उदाहरण के लिए, सीडी प्रारूप में असम्पीडित गीतों की डेटा दर 16 बिट/चैनल x 2 चैनल x 44.1 kHz ≅ 1.4 Mbit/s है, जबकि iPod पर उन्नत ऑडियो कोडिंग फ़ाइलें आमतौर पर 128 kbit/s तक संपीड़ित होती हैं, जिससे संपीड़न अनुपात प्राप्त होता है। 0.91, या 91% की डेटा-दर बचत के लिए 10.9 का।

जब असम्पीडित डेटा दर ज्ञात होती है, तो संपीड़न अनुपात का अनुमान संपीड़ित डेटा दर से लगाया जा सकता है।

हानिरहित बनाम हानिपूर्ण
वीडियो, डिजीटल फिल्म और ऑडियो जैसे डिजीटल डेटा का दोषरहित संपीड़न सभी सूचनाओं को संरक्षित करता है, लेकिन डेटा की आंतरिक सूचना एन्ट्रापी के कारण यह आम तौर पर 2:1 से बेहतर संपीड़न अनुपात प्राप्त नहीं कर पाता है। संपीड़न एल्गोरिदम जो उच्च अनुपात प्रदान करते हैं या तो बहुत बड़े ओवरहेड खर्च करते हैं या केवल विशिष्ट डेटा अनुक्रमों के लिए काम करते हैं (उदाहरण के लिए अधिकतर शून्य वाली फ़ाइल को संपीड़ित करना)। इसके विपरीत, हानिपूर्ण संपीड़न (उदाहरण के लिए छवियों के लिए जेपीईजी, या ऑडियो के लिए बिका हुआ 3 और ओपस (ऑडियो प्रारूप)) गुणवत्ता में कमी की कीमत पर बहुत अधिक संपीड़न अनुपात प्राप्त कर सकते हैं, जैसे ब्लूटूथ ऑडियो स्ट्रीमिंग, दृश्य या ऑडियो संपीड़न कलाकृतियों के रूप में महत्वपूर्ण जानकारी की हानि का परिचय दिया जाता है। 1080i वीडियो को 20 Mbit/s एमपीईजी ट्रांसपोर्ट स्ट्रीम में लाने के लिए कम से कम 50:1 का संपीड़न अनुपात आवश्यक है।

उपयोग
डेटा संपीड़न अनुपात डेटा सेट या सिग्नल की जटिलता के माप के रूप में काम कर सकता है। विशेष रूप से इसका उपयोग एल्गोरिथम सूचना सिद्धांत का अनुमान लगाने के लिए किया जाता है। इसका उपयोग यह देखने के लिए भी किया जाता है कि किसी फ़ाइल का मूल आकार बढ़ाए बिना कितना संपीड़ित किया जा सकता है।

बाहरी संबंध

 * Nondegrading lossy compression