डेटा संपीड़न अनुपात

डेटा संपीड़न अनुपात, जिसे संपीड़न शक्ति के रूप में भी जाना जाता है, डेटा संपीड़न एल्गोरिदम द्वारा उत्पादित डेटा प्रतिनिधित्व के आकार में सापेक्ष कमी का माप है। अतः इसे सामान्यतः संपीड़ित आकार द्वारा असम्पीडित आकार के विभाजन के रूप में व्यक्त किया जाता है।

परिभाषा
इस प्रकार से डेटा संपीड़न अनुपात को असम्पीडित आकार और संपीड़ित आकार के बीच के अनुपात के रूप में पूर्ण रूप से परिभाषित किया गया है:
 * $$ {\rm Compression\;Ratio} = \frac{\rm Uncompressed\;Size}{\rm Compressed\;Size}$$

अतः इस प्रकार, प्रतिनिधित्व जो किसी फ़ाइल के भंडारण आकार को 10 एमबी से 2 एमबी तक संपीड़ित करता है, उसका संपीड़न अनुपात 10/2 = 5 होता है, जिसे प्रायः स्पष्ट अनुपात, 5:1 (पांच से पढ़ें), या अंतर्निहित अनुपात, 5/1 के रूप में नोट किया जाता है। यह सूत्रीकरण संपीड़न के लिए समान रूप से लागू होता है, जहां असम्पीडित आकार मूल का होता है; और डीकंप्रेसन के लिए, जहां असम्पीडित आकार की पुनरुत्पत्ति होती है।

इस प्रकार से कभी-कभी इसके स्थान पर एक स्थान की बचत दी जाती है, जिसे असम्पीडित आकार के सापेक्ष आकार में कमी के रूप में परिभाषित किया जाता है:


 * $${\rm Space\;Saving} = 1 - \frac{\rm Compressed\;Size}{\rm Uncompressed\;Size}$$

इस प्रकार, प्रतिनिधित्व जो फ़ाइल के भंडारण आकार को 10 एमबी से 2 एमबी तक संपीड़ित करता है, यह 1 - 2/10 = 0.8 के स्थान बचत को उत्पन्न करता है, जिसे प्रायः प्रतिशत, 80% के रूप में नोट किया जाता है।

अतः इस प्रकार से अनिश्चित आकार के संकेतों के लिए, जैसे कि ऑडियो और वीडियो स्ट्रीमिंग, संपीड़न अनुपात को डेटा आकार के अतिरिक्त असंपीड़ित और संपीड़ित बिट दर के संदर्भ में परिभाषित किया गया है:


 * $$ {\rm Compression\;Ratio} = \frac{\rm Uncompressed\;Data\;Rate}{\rm Compressed\;Data\;Rate}$$

और स्थान की बचत के अतिरिक्त, कोई डेटा-दर बचत की बात करता है, जिसे असम्पीडित डेटा दर के सापेक्ष डेटा-दर में कमी के रूप में इस प्रकार परिभाषित किया गया है:


 * $${\rm Data\;Rate\;Saving} = 1 - \frac{\rm Compressed\;Data\;Rate}{\rm Uncompressed\;Data\;Rate}$$

उदाहरण के लिए, सीडी प्रारूप में असम्पीडित गीतों की डेटा दर 16 बिट/चैनल x 2 चैनल x 44.1 kHz ≅ 1.4 Mbit/s है, जबकि आईपोड पर उन्नत ऑडियो कोडिंग फ़ाइलें सामान्यतः 128 kbit/s तक संपीड़ित होती हैं, जिससे 0.91, या 91% की डेटा-दर बचत के लिए 10.9 का संपीड़न अनुपात पूर्ण रूप से प्राप्त होता है।

इस प्रकार से जब असम्पीडित डेटा दर ज्ञात होती है, तो संपीड़न अनुपात का अनुमान संपीड़ित डेटा दर से लगाया जा सकता है।

हानिरहित बनाम हानिपूर्ण
अतः वीडियो, डिजीटल फिल्म और ऑडियो जैसे डिजीटल डेटा का दोषरहित संपीड़न सभी सूचनाओं को संरक्षित करता है, परन्तु डेटा की आंतरिक सूचना एन्ट्रापी के कारण यह सामान्यतः 2:1 से स्पष्ट संपीड़न अनुपात प्राप्त नहीं कर पाता है। इस प्रकार से संपीड़न एल्गोरिदम जो उच्च अनुपात प्रदान करते हैं या तो बहुत बड़े अतिरिक्त व्यय करते हैं या मात्र विशिष्ट डेटा अनुक्रमों के लिए कार्य करते हैं (उदाहरण के लिए अधिकांशतः शून्य वाली फ़ाइल को संपीड़ित करना)। अतः इसके विपरीत, हानिपूर्ण संपीड़न (उदाहरण के लिए प्रतिरूपों के लिए जेपीईजी, या ऑडियो के लिए एमपी3 और ओपस (ऑडियो प्रारूप)) गुणवत्ता में कमी की लागत पर बहुत अधिक संपीड़न अनुपात प्राप्त कर सकते हैं, जैसे ब्लूटूथ ऑडियो स्ट्रीमिंग, दृश्य या ऑडियो संपीड़न कलाकृतियों के रूप में महत्वपूर्ण सूचना की हानि का परिचय पूर्ण रूप से दिया जाता है। इस प्रकार से 1080i वीडियो को 20 Mbit/s एमपीईजी ट्रांसपोर्ट स्ट्रीम में लाने के लिए कम से कम 50:1 का संपीड़न अनुपात आवश्यक है।

उपयोग
अतः डेटा संपीड़न अनुपात डेटा सेट या सिग्नल की जटिलता के माप के रूप में कार्य कर सकता है। विशेष रूप से इसका उपयोग एल्गोरिदम सूचना सिद्धांत का अनुमान लगाने के लिए किया जाता है। इस प्रकार से इसका उपयोग यह देखने के लिए भी किया जाता है कि किसी फ़ाइल का मूल आकार बढ़ाए बिना कितना संपीड़ित किया जा सकता है।

बाहरी संबंध

 * Nondegrading lossy compression