डेटा संपीड़न

सूचना सिद्धांत में, डेटा कम्प्रेशन, सोर्स कोडिंग, या बिट -दर में कमी मूल प्रतिनिधित्व की तुलना में कम बिट्स का उपयोग करके जानकारी एन्कोड करने की प्रक्रिया है। कोई विशेष कम्प्रेशन या तो लोस्सी या लॉसलेस होता है। लॉसलेस कम्प्रेशन सांख्यिकीय अतिरेक की पहचान करके और उसे समाप्त करके बिट्स को कम करता है। लॉसलेस कम्प्रेशन में कोई भी जानकारी नष्ट नहीं होती है। लॉसलेस कम्प्रेशन अनावश्यक या कम महत्वपूर्ण जानकारी को हटाकर बिट्स को कम करता है। सामान्यतः, एक उपकरण जो डेटा कम्प्रेशन करता है, उसे एनकोडर के रूप में संदर्भित किया जाता है और जो प्रक्रिया को उलट देता है (डिकम्प्रेस) उसे डिकोडर के रूप में संदर्भित किया जाता है।

डेटा फ़ाइल के आकार को कम करने की प्रक्रिया को प्रायः डेटा कम्प्रेशन के रूप में संदर्भित किया जाता है। डेटा प्रेषण के संदर्भ में, इसे सोर्स कोडिंग कहा जाता है; डेटा को संग्रहीत या प्रसारित करने से पहले उसके सोर्स पर एन्कोडिंग की जाती है। सोर्स कोडिंग को चैनल कोडिंग के साथ भ्रमित नहीं किया जाना चाहिए, एरर का पता लगाने और सुधार या लाइन कोडिंग के लिए, संकेत पर डेटा को मैप करने के लिए साधन है।

कम्प्रेशन उपयोगी है क्योंकि यह डेटा को संग्रहीत और प्रसारित करने के लिए आवश्यक संसाधनों को कम करता है। कम्प्यूटेशनल संसाधनों का उपभोग कम्प्रेशन और डिकम्प्रेस प्रक्रियाओं में किया जाता है। डेटा कम्प्रेशन स्पेस टाइम कम्प्लेक्सिटी ट्रेडऑफ के अधीन है। उदाहरण के लिए, वीडियो के लिए एक कम्प्रेशन योजना के लिए महंगे हार्डवेयर की आवश्यकता हो सकती है, ताकि वीडियो को तेजी से डिकम्प्रेस किया जा सके ताकि इसे डीकंप्रेस किया जा सके, और वीडियो को देखने से पहले पूर्णतया से डीकंप्रेस करने का विकल्प असुविधाजनक हो सकता है या अतिरिक्त भंडारण की आवश्यकता हो सकती है। डेटा कम्प्रेशन योजनाओं के डिजाइन में विभिन्न कारकों के मध्य दुविधा सम्मिलित हैं, जिनमें कम्प्रेशन की डिग्री, पुरःस्थापित विकृति की मात्रा (लॉसलेस डेटा कम्प्रेशन का उपयोग करते समय), और डेटा को कम्प्रेस और डिकम्प्रेस करने के लिए आवश्यक कम्प्यूटेशनल संसाधन सम्मिलित हैं।

लॉसलेस
लॉसलेस डेटा कम्प्रेशन एल्गोरिदम सामान्यतः किसी भी जानकारी को खोए बिना डेटा का प्रतिनिधित्व करने के लिए सांख्यिकीय अतिरेक का उपयोग करते हैं, ताकि प्रक्रिया प्रतिवर्ती हो। लॉसलेस कम्प्रेशन संभव है क्योंकि अधिकांश वास्तविक जगत का डेटा सांख्यिकीय अतिरेक प्रदर्शित करता है। उदाहरण के लिए, एक छवि में रंग के क्षेत्र हो सकते हैं जो कई पिक्सेल में नहीं बदलते हैं; लाल पिक्सेल को कोड करने के बजाय डेटा को "279 लाल पिक्सेल" के रूप में एन्कोड किया जा सकता है। यह रन-लेंथ एन्कोडिंग का एक बुनियादी उदाहरण है; अतिरेक को समाप्त करके फ़ाइल का आकार कम करने की कई योजनाएँ हैं।

लेम्पेल-ज़िव (LZ) कम्प्रेशन विधियाँ लॉसलेस भंडारण के लिए सबसे लोकप्रिय एल्गोरिदम में से एक हैं। डीईएफएलएटीई डीकंप्रेसन गति और कम्प्रेशन अनुपात के लिए अनुकूलित एलजेड पर एक भिन्नता है, लेकिन कम्प्रेशन धीमा हो सकता है। 1980 के दशक के मध्य में, टेरी वेल्च के कार्य के बाद, लेम्पेल-ज़िव-वेल्च (LZW) एल्गोरिदम तेजी से अधिकांश सामान्य प्रयोजन कम्प्रेशन प्रणालियों के लिए चयन का तरीका बन गया।एलजेडडब्ल्यू का उपयोग जीआईएफ छवियों, पीकेजेडआईपी जैसे प्रोग्राम और मोडेम जैसे हार्डवेयर उपकरणों में किया जाता है। एलजेड विधियाँ एक व्याकरण आधारित कोड मॉडल का उपयोग करती हैं जहां टेबल प्रविष्टियों को डेटा के बार-बार तार के लिए प्रतिस्थापित किया जाता है।अधिकांश एलजेड विधियों के लिए, यह टेबल इनपुट में पहले के डेटा से गतिशील रूप से उत्पन्न होती है।टेबल ही प्रायः हफ़मैन कोडिंग होती है।इस तरह के  व्याकरण-आधारित कोड  अत्यधिक दोहरावदार इनपुट को बहुत प्रभावी ढंग से संपीड़ित कर सकते हैं, उदाहरण के लिए, समान या निकट से संबंधित प्रजातियों का एक जैविक डेटा संग्रह, एक विशाल संस्करण संग्रह संग्रह, इंटरनेट अभिलेखीय, आदि। व्याकरण-आधारित कोड का मूल कार्य निर्माण कर रहा हैएक संदर्भ-मुक्त व्याकरण एक एकल श्रृंखला प्राप्त करता है।अन्य व्यावहारिक व्याकरण कम्प्रेशन कलनविधि में अनुक्रमिक कलनविधि और फिर से जोड़ी सम्मिलित हैं।

सबसे प्रबल आधुनिक लॉसलेस कंप्रेशर्स यादृच्छिक कलनविधि मॉडल का उपयोग करते हैं, जैसे कि आंशिक मिलान द्वारा भविष्यवाणी ।बरोज़ -व्हीलर ट्रांसफॉर्म को सांख्यिकीय मॉडलिंग के अप्रत्यक्ष रूप के रूप में भी देखा जा सकता है।  संभाव्य मॉडल िंग के प्रत्यक्ष उपयोग के एक और शोधन में, सांख्यिकीय अनुमानों को अंकगणित कोडिंग नामक एक कलनविधि के लिए युग्मित किया जा सकता है। अंकगणित कोडिंग एक अधिक आधुनिक कोडिंग तकनीक है जो इनपुट डेटा प्रतीकों की एक श्रृंखला से एन्कोडेड बिट्स की एक श्रृंखला का उत्पादन करने के लिए एक परिमित-राज्य मशीन की गणितीय गणना का उपयोग करती है। यह अन्य तकनीकों जैसे कि बेहतर-ज्ञात हफमैन कलनविधि की तुलना में बेहतर कम्प्रेशन प्राप्त कर सकता है। यह एक आंतरिक मेमोरी स्टेट का उपयोग करता है, जो अलग-अलग प्रतिनिधित्व के लिए व्यक्तिगत इनपुट प्रतीकों के एक-से-एक मैपिंग करने की आवश्यकता से बचता है जो बिट्स की एक पूर्णांक संख्या का उपयोग करते हैं, और यह डेटा प्रतीकों के पूरे श्रृंखला को कोडिंग के बाद ही आंतरिक मेमोरी को साफ करता है । अंकगणित कोडिंग विशेष रूप से अनुकूली डेटा कम्प्रेशन कार्यों पर अनुप्रयुक्त होती है जहां आँकड़े भिन्न होते हैं और संदर्भ-निर्भर होते हैं, क्योंकि इसे सरलता से इनपुट डेटा के संभाव्यता वितरण के एक अनुकूली मॉडल के साथ मिलाया जा सकता है। अंकगणित कोडिंग के उपयोग का एक प्रारंभिक उदाहरण  JPEG  छवि कोडिंग मानक के एक वैकल्पिक (लेकिन व्यापक रूप से उपयोग नहीं किया गया) सुविधा में था। यह तब से विभिन्न अन्य डिजाइनों में अनुप्रयुक्त किया गया है जिसमें वीडियो कोडिंग के लिए H.263, H.264/MPEG-4 AVC और  HEVC  सम्मिलित हैं।

आर्काइव सॉफ्टवेयर में सामान्यतः शब्दकोश आकार को समायोजित करने की क्षमता होती है, जहां एक बड़ा आकार कम्प्रेशन और विघटन के पर्यन्त अधिक यादृच्छिक एक्सेस मेमोरी की मांग करता है, लेकिन प्रबल को संपीड़ित करता है, विशेष रूप से फ़ाइलों की सामग्री में पैटर्न को दोहराने पर।

हानि
1980 के दशक के उत्तरार्ध में, डिजिटल छवियां अधिक सामान्य हो गईं, और लॉसलेस छवि कम्प्रेशन के लिए मानक उभरे।1990 के दशक की शुरुआत में, हानिपूर्ण कम्प्रेशन विधियों का व्यापक रूप से उपयोग किया जाने लगा। इन योजनाओं में, जानकारी के कुछ नुकसान को स्वीकार किया जाता है क्योंकि गैर -विस्तार को छोड़ने से भंडारण स्थान को बचा सकता है।जानकारी को संरक्षित करने और आकार को कम करने के मध्य एक समान व्यापार बंद है।हानि डेटा कम्प्रेशन योजनाओं को शोध द्वारा डिज़ाइन किया गया है कि लोग प्रश्न में डेटा को कैसे देखते हैं।उदाहरण के लिए, मानव आंख रंग में भिन्नता की तुलना में  luminance  में सूक्ष्म विविधताओं के लिए अधिक संवेदनशील है।JPEG छवि कम्प्रेशन सूचना के गैर -बिट्स को गोल करके भाग में काम करता है।  कई लोकप्रिय कम्प्रेशन प्रारूप इन अवधारणात्मक अंतरों का फायदा उठाते हैं, जिसमें ध्वनि के लिए  मनो विश्लेषण, और छवियों और वीडियो के लिए मनोचिकित्सा सम्मिलित हैं।

हानिपूर्ण कम्प्रेशन के अधिकांश रूप ट्रांसफ़ॉर्म कोडिंग पर आधारित होते हैं, विशेष रूप से असतत कोसाइन परिवर्तन  (डीसीटी)।यह पहली बार 1972 में एन। अहमद द्वारा प्रस्तावित किया गया था, जिन्होंने जनवरी 1974 में इसे प्रारंभ करने से पहले 1973 में टी। नटराजन और के। आर। राव के साथ एक कामकाजी कलनविधि विकसित किया था। DCT सबसे व्यापक रूप से उपयोग किया जाने वाला लॉसलेस कम्प्रेशन विधि है, और इसका उपयोग छवि कम्प्रेशन (जैसे JPEG और  HEIF ) के लिए मल्टीमीडिया प्रारूपों में किया जाता है, वीडियो कम्प्रेशन (जैसे कि  MPEG, H.264/AVC और HEVC) और श्रव्य (जैसे  MP3 ,  उन्नत श्रव्य कोडिंग और VORBIS)।

भंडारण क्षमता बढ़ाने के लिए, डिजिटल कैमरा  में हानिपूर्ण छवि कम्प्रेशन का उपयोग किया जाता है।इसी तरह,  डीवीडी,  ब्लू-राई  और स्ट्रीमिंग वीडियो हानि वीडियो कोडिंग प्रारूपों का उपयोग करते हैं।वीडियो में बड़े पैमाने पर कम्प्रेशन का बड़े पैमाने पर उपयोग किया जाता है।

हानिपूर्ण श्रव्य कम्प्रेशन में, श्रव्य संकेत  के गैर-ऑडिबल (या कम श्रव्य) घटकों को हटाने के लिए मनोविश्लेषण के तरीकों का उपयोग किया जाता है।मानव भाषण का कम्प्रेशन प्रायः और भी अधिक विशिष्ट तकनीकों के साथ किया जाता है;स्पीच कोडिंग को सामान्य-उद्देश्य श्रव्य कम्प्रेशन से एक अलग अनुशासन के रूप में प्रतिष्ठित किया जाता है।स्पीच कोडिंग का उपयोग  इंटरनेट टेलीफ़ोनी  में किया जाता है, उदाहरण के लिए, श्रव्य कम्प्रेशन का उपयोग सीडी रिपिंग के लिए किया जाता है और इसे श्रव्य खिलाड़ियों द्वारा डिकोड किया जाता है।

हानिपूर्ण कम्प्रेशन से पीढ़ी के नुकसान का कारण बन सकता है।

सिद्धांत
कम्प्रेशन के लिए सैद्धांतिक आधार सूचना सिद्धांत द्वारा प्रदान किया जाता है और, विशेष रूप से, लॉसलेस कम्प्रेशन के लिए एल्गोरिथम सूचना सिद्धांत  और लॉसलेस कम्प्रेशन के लिए दर -विवाद सिद्धांत।अध्ययन के इन क्षेत्रों को अनिवार्य रूप से  क्लाउड शैनन  द्वारा बनाया गया था, जिन्होंने 1940 के दशक के अंत और 1950 के दशक की शुरुआत में इस विषय पर मौलिक पत्र प्रकाशित किए थे।कम्प्रेशन से जुड़े अन्य विषयों में कोडिंग सिद्धांत और सांख्यिकीय अनुमान सम्मिलित हैं।

यंत्र अधिगम
यंत्र अधिगमऔर कम्प्रेशन के मध्य घनिष्ठ संबंध है।एक प्रणाली जो अपने पूरे इतिहास को दिए गए अनुक्रम की पोस्टीरियर संभावनाओं की भविष्यवाणी करती है, इसका उपयोग इष्टतम डेटा कम्प्रेशन (आउटपुट वितरण पर अंकगणित कोडिंग का उपयोग करके) के लिए किया जा सकता है।इसके विपरीत, एक इष्टतम कंप्रेसर का उपयोग भविष्यवाणी के लिए किया जा सकता है (प्रतीक को खोजकर जो पिछले इतिहास को देखते हुए सबसे अच्छा संकुचित करता है)।इस तुल्यता का उपयोग सामान्य बुद्धि के लिए एक बेंचमार्क के रूप में डेटा कम्प्रेशन का उपयोग करने के औचित्य के रूप में किया गया है।

एक वैकल्पिक दृश्य कम्प्रेशन कलनविधि को निहित सुविधा समष्टि सदिश में स्पष्ट रूप से मैप स्ट्रिंग्स दिखा सकता है, और कम्प्रेशन-आधारित समानता उपाय इन फीचर रिक्त स्थान के भीतर समानता की गणना करते हैं।प्रत्येक कंप्रेसर c (।) के लिए हम एक संबद्ध वेक्टर समष्टि को परिभाषित करते हैं, जैसे कि c (।) एक इनपुट श्रृंखला x को मैप करता है, वेक्टर मानदंड के अनुरूप || ~ x ||सभी कम्प्रेशन कलनविधि को अंतर्निहित सुविधा स्थानों की एक विस्तृत परीक्षा समष्टि द्वारा रोक दी गई है;इसके बजाय, फीचर सदिश तीन प्रतिनिधि लॉसलेस कम्प्रेशन विधियों, LZW, LZ77 और PPM की जांच करने के लिए चुनता है।

Aixi थ्योरी के अनुसार, हटर पुरस्कार में सीधे एक कनेक्शन अधिक समझाया गया है, इस तरह  का सबसे अच्छा संभव कम्प्रेशन सबसे छोटा संभव सॉफ्टवेयर है जो एक्स उत्पन्न करता है।उदाहरण के लिए, उस मॉडल में, एक ज़िप फ़ाइल के संपीड़ित आकार में ज़िप फ़ाइल और अनजिंग सॉफ्टवेयर दोनों सम्मिलित हैं, क्योंकि आप इसे दोनों के बिना अनजान नहीं कर सकते हैं, लेकिन एक भी छोटा संयुक्त रूप हो सकता है।

डेटा विभेदक
डेटा कम्प्रेशन को डेटा भिन्नता के एक विशेष स्थिति के रूप में देखा जा सकता है। डेटा डिफरेंसिंग में एक सोर्स और एक लक्ष्य को देखते हुए एक अंतर का उत्पादन होता है, जिसमें एक सोर्स और एक अंतर दिए गए लक्ष्य को पुन: प्रस्तुत करने के साथ।चूंकि डेटा कम्प्रेशन में कोई अलग सोर्स और लक्ष्य नहीं है, इसलिए कोई भी डेटा कम्प्रेशन को खाली सोर्स डेटा के साथ डेटा विभेदन के रूप में मान सकता है, कुछ भी नहीं से अंतर के अनुरूप संपीड़ित फ़ाइल।यह पूर्ण एन्ट्रापी (सूचना सिद्धांत) (डेटा कम्प्रेशन के अनुरूप) पर विचार करने के समान है, जो बिना किसी प्रारंभिक डेटा के सापेक्ष एन्ट्रापी (डेटा भिन्नता के अनुरूप) के एक विशेष स्थिति के रूप में है।

डेटा डिफरेंसिंग कनेक्शन पर जोर देने के लिए टर्म डिफरेंशियल कम्प्रेशन शब्द का उपयोग किया जाता है।

छवि
एन्ट्रॉपी कोडन की उत्पत्ति 1940 के दशक में शैनन -फानो कोडिंग की शुरूआत के साथ हुई, हफमैन कोडिंग का आधार जो 1950 में विकसित किया गया था। 1960 के दशक के उत्तरार्ध में ट्रांसफॉर्म कोडिंग की तारीखें, 1968 में  फास्ट फूरियर ट्रांसफॉर्म  (एफएफटी) कोडिंग और 1969 में  हदामार्ड ट्रांसफॉर्म  की शुरूआत के साथ।

एक महत्वपूर्ण छवि कम्प्रेशन तकनीक 1970 के दशक की शुरुआत में विकसित की गई एक तकनीक है। DCT JPEG के लिए आधार है, एक हानिपूर्ण कम्प्रेशन प्रारूप जो 1992 में संयुक्त फोटोग्राफिक विशेषज्ञों समूह (JPEG) द्वारा प्रस्तुत किया गया था। JPEG छवि गुणवत्ता में अपेक्षाकृत कम कमी की लागत पर एक छवि का प्रतिनिधित्व करने के लिए आवश्यक डेटा की मात्रा को कम करता है और सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है। इसका अत्यधिक कुशल डीसीटी-आधारित कम्प्रेशन कलनविधि डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था। Lempel -Ziv -Welch (LZW) 1984 में विकसित एक लॉसलेस कम्प्रेशन कलनविधि है। इसका उपयोग GIF  प्रारूप में किया जाता है, जिसे 1987 में प्रस्तुत किया गया था। 1996 में निर्दिष्ट एक लॉसलेस कम्प्रेशन कलनविधि को  हवा निकालना,  पोर्टेबल नेटवर्क ग्राफ़िक्स  (पीएनजी) प्रारूप में उपयोग किया जाता है। वेवलेट कम्प्रेशन, छवि कम्प्रेशन में तरंगों का उपयोग, डीसीटी कोडिंग के विकास के बाद प्रारंभ हुआ। JPEG 2000  मानक 2000 में प्रस्तुत किया गया था। मूल JPEG प्रारूप द्वारा उपयोग किए जाने वाले DCT कलनविधि के विपरीत, JPEG 2000 इसके बजाय  असतत तरंग रूपांतरण  (DWT) कलनविधि का उपयोग करता है।  JPEG 2000 तकनीक, जिसमें मोशन JPEG 2000 एक्सटेंशन सम्मिलित है, को 2004 में  अंकीय सिनेमा  के लिए वीडियो कोडिंग मानक के रूप में चुना गया था।

श्रव्य
श्रव्य डेटा कम्प्रेशन, गतिशील रेंज कम्प्रेशन के साथ भ्रमित नहीं होने के लिए, ट्रांसमिशन बैंडविड्थ (कम्प्यूटिंग)  और श्रव्य डेटा की भंडारण आवश्यकताओं को कम करने की क्षमता है।Codecs#श्रव्य की सूची श्रव्य  कोडेक  के रूप में सॉफ्टवेयर में अनुप्रयुक्त की जाती है।हानिपूर्ण और लॉसलेस कम्प्रेशन दोनों में, अतिरेक (सूचना सिद्धांत) को कम कर दिया जाता है, कोडिंग सिद्धांत,  परिमाणीकरण  (संकेत प्रोसेसिंग), असतत कोसाइन ट्रांसफॉर्म और  रैखिक भविष्यवाणी  जैसे तरीकों का उपयोग करते हुए, जो कि असम्पीडित डेटा का प्रतिनिधित्व करने के लिए उपयोग की जाने वाली जानकारी की मात्रा को कम करते हैं।

हानि श्रव्य कम्प्रेशन कलनविधि उच्च कम्प्रेशन प्रदान करते हैं और वोरबिस और एमपी 3 सहित कई श्रव्य अनुप्रयोगों में उपयोग किए जाते हैं।ये कलनविधि लगभग सभी कम श्रव्य ध्वनियों की निष्ठा को खत्म करने या कम करने के लिए मनोविश्लेषण पर भरोसा करते हैं, जिससे उन्हें स्टोर या संचारित करने के लिए आवश्यक स्थान को कम किया जाता है। श्रव्य गुणवत्ता और संचरण या भंडारण आकार के नुकसान के मध्य स्वीकार्य व्यापार-बंद आवेदन पर निर्भर करता है।उदाहरण के लिए, एक 640 एमबी कॉम्पैक्ट डिस्क  (सीडी) लगभग एक घंटे का असम्पीडित  उच्च निष्ठा  संगीत, 2 घंटे से कम संगीत संपीड़ित हानिकारक, या 7 घंटे से कम संगीत एमपी 3 प्रारूप में एक मध्यम  बिट दर  पर संपीड़ित होता है।एक डिजिटल साउंड रिकॉर्डर सामान्यतः 640 एमबी में स्पष्ट रूप से समझदार भाषण के लगभग 200 घंटे स्टोर कर सकता है।

लॉसलेस श्रव्य कम्प्रेशन डिजिटल डेटा का एक प्रतिनिधित्व करता है जिसे मूल के सटीक डिजिटल डुप्लिकेट के लिए डिकोड किया जा सकता है।कम्प्रेशन अनुपात मूल आकार के लगभग 50-60% हैं, जो कि जेनेरिक लॉसलेस डेटा कम्प्रेशन के लिए समान है।लॉसलेस कोडेक संकेत का आकलन करने के लिए एक आधार के रूप में वक्र फिटिंग  या रैखिक भविष्यवाणी का उपयोग करते हैं।अनुमान का वर्णन करने वाले पैरामीटर और अनुमान और वास्तविक संकेत के मध्य अंतर को अलग से कोडित किया जाता है।

कई लॉसलेस श्रव्य कम्प्रेशन प्रारूप मौजूद हैं। एक सूची के लिए कोडेक्स#लॉसलेस कम्प्रेशन की सूची देखें। कुछ प्रारूप एक अलग प्रणाली से जुड़े होते हैं, जैसे कि प्रत्यक्ष धारा अंतरण, सुपर श्रव्य सीडी और  मेरिडियन लॉसलेस पैकिंग में उपयोग किया जाता है, जिसका उपयोग  DVD श्रव्य ,  डॉल्बी ट्रूहद , ब्लू-रे और  एचडी डीवीडी  में किया जाता है।

कुछ श्रव्य फ़ाइल स्वरूपों में एक हानिपूर्ण प्रारूप और एक लॉसलेस सुधार का संयोजन होता है; यह सुधार को सरलता से एक हानिपूर्ण फ़ाइल प्राप्त करने की अनुमति देता है। इस तरह के प्रारूपों में MPEG-4 SLS  (स्केलेबल टू लॉसलेस), WAVPACK और ITTEMFROG ड्यूलस्ट्रीम सम्मिलित हैं।

जब श्रव्य फ़ाइलों को संसाधित किया जाना है, या तो आगे कम्प्रेशन द्वारा या श्रव्य संपादन के लिए, यह एक अपरिवर्तित मूल (असम्पीडित या लॉसलेस रूप से संपीड़ित) से काम करने के लिए वांछनीय है। किसी उद्देश्य के लिए एक हानिकारक संपीड़ित फ़ाइल का प्रसंस्करण सामान्यतः एक असम्पीडित मूल से एक ही संपीड़ित फ़ाइल के निर्माण के लिए एक अंतिम परिणाम हीन होता है। ध्वनि संपादन या मिश्रण के अतिरिक्त, लॉसलेस श्रव्य कम्प्रेशन का उपयोग प्रायः अभिलेखीय भंडारण के लिए, या मास्टर प्रतियों के रूप में किया जाता है।

हानि श्रव्य कम्प्रेशन
हानि श्रव्य कम्प्रेशन का उपयोग अनुप्रयोगों की एक विस्तृत श्रृंखला में किया जाता है।एमपी 3 खिलाड़ियों या कंप्यूटरों में फाइल प्लेबैक के केवल स्टैंडअलोन श्रव्य-केवल एप्लिकेशन के अतिरिक्त, डिजिटल रूप से संपीड़ित श्रव्य स्ट्रीम का उपयोग अधिकांश वीडियो डीवीडी, डिजिटल टेलीविजन, इंटरनेट  पर स्ट्रीमिंग मीडिया, सैटेलाइट और केबल रेडियो में किया जाता है, और टेरस्ट्रियल रेडियो प्रसारण में तेजी से होता है।हानिपूर्ण कम्प्रेशन सामान्यतः  मनो विश्लेषण अनुकूलन के आधार पर कम-आलोचनात्मक डेटा को छोड़कर, लॉसलेस कम्प्रेशन की तुलना में कहीं अधिक कम्प्रेशन प्राप्त करता है।

मनोविश्लेषक मानता है कि श्रव्य स्ट्रीम में सभी डेटा मानव श्रवण प्रणाली  द्वारा नहीं माना जा सकता है।अधिकांश हानिपूर्ण कम्प्रेशन पहले अवधारणात्मक रूप से अप्रासंगिक ध्वनियों की पहचान करके अतिरेक को कम कर देता है, अर्थात लगता है कि सुनने में बहुत मुश्किल है।विशिष्ट उदाहरणों में उच्च आवृत्तियों या ध्वनियों को सम्मिलित किया जाता है जो एक ही समय में लाउड साउंड्स के रूप में होते हैं।उन अप्रासंगिक ध्वनियों को कम सटीकता के साथ कोडित किया जाता है या बिल्कुल नहीं।

हानिपूर्ण कलनविधि की प्रकृति के कारण, श्रव्य गुणवत्ता एक डिजिटल पीढ़ी के नुकसान का सामना करती है जब एक फ़ाइल को विघटित और पुन: व्यवस्थित किया जाता है।यह पेशेवर श्रव्य इंजीनियरिंग अनुप्रयोगों में मध्यवर्ती परिणामों को संग्रहीत करने के लिए हानिकारक कम्प्रेशन को अनुपयुक्त बनाता है, जैसे कि साउंड एडिटिंग और मल्टीट्रैक रिकॉर्डिंग।हालांकि, एमपी 3 जैसे हानिपूर्ण प्रारूप अंत-उपयोगकर्ताओं के साथ बहुत लोकप्रिय हैं क्योंकि फ़ाइल का आकार मूल आकार के 5-20% तक कम हो जाता है और एक मेगाबाइट पर्याप्त गुणवत्ता पर एक मिनट के संगीत के बारे में एक मिनट के लायक हो सकता है।

कोडिंग विधियाँ
यह निर्धारित करने के लिए कि एक श्रव्य संकेत में क्या जानकारी अवधारणात्मक रूप से अप्रासंगिक है, अधिकांश लॉसलेस कम्प्रेशन कलनविधि परिवर्तन का उपयोग करते हैं जैसे कि संशोधित असतत कोसाइन ट्रांसफॉर्म (MDCT) समय कार्यक्षेत्र नमूना तरंगों को एक ट्रांसफ़ॉर्म कार्यक्षेत्र में परिवर्तित करने के लिए, सामान्यतः आवृत्ति कार्यक्षेत्र में।एक बार रूपांतरित होने के बाद, घटक आवृत्तियों को प्राथमिकता दी जा सकती है कि वे कितने श्रव्य हैं।वर्णक्रमीय घटकों की ऑडिबिलिटी का मूल्यांकन सुनने की पूर्ण सीमा और एक साथ मास्किंग के सिद्धांतों का उपयोग करके किया जाता है - घटना जिसमें एक संकेत आवृत्ति द्वारा अलग किए गए एक अन्य संकेत द्वारा मास्क किया जाता है - और, कुछ स्थितियों में, टेम्पोरल मास्किंग -जहां एक संकेत एक अन्य संकेत द्वारा मास्क किया जाता है।समय के साथ अलग हो गया।घटकों के अवधारणात्मक महत्व को तौलने के लिए समान-लाउडनेस आकृति का भी उपयोग किया जा सकता है।इस तरह के प्रभावों को सम्मिलित करने वाले मानव कान-मस्तिष्क संयोजन के मॉडल को प्रायः  मनोविश्लेषण मॉडल  कहा जाता है।

अन्य प्रकार के हानिपूर्ण कंप्रेशर्स, जैसे कि रैखिक भविष्य कहनेवाला कोडिंग (एलपीसी) का उपयोग भाषण के साथ किया जाता है, सोर्स-आधारित कोडर्स हैं।एलपीसी भाषण ध्वनियों का विश्लेषण करने के लिए मानव मुखर पथ के एक मॉडल का उपयोग करता है और मॉडल द्वारा उपयोग किए जाने वाले मापदंडों का अनुमान लगाता है ताकि उन्हें पल -पल का उत्पादन किया जा सके।ये बदलते मापदंडों को प्रेषित या संग्रहीत किया जाता है और कूटवाचक में एक और मॉडल को चलाने के लिए उपयोग किया जाता है जो ध्वनि को पुन: प्रस्तुत करता है।

घातक प्रारूपों का उपयोग प्रायः स्ट्रीमिंग श्रव्य या इंटरैक्टिव संचार (जैसे सेल फोन नेटवर्क में) के वितरण के लिए किया जाता है।ऐसे अनुप्रयोगों में, डेटा प्रवाह के रूप में डेटा को विघटित किया जाना चाहिए, बजाय इसके कि पूरे डेटा स्ट्रीम को प्रेषित किया गया है।सभी श्रव्य कोडेक का उपयोग स्ट्रीमिंग अनुप्रयोगों के लिए नहीं किया जा सकता है।

विलंबता (इंजीनियरिंग) को डेटा को एनकोड और डिकोड करने के लिए उपयोग किए जाने वाले तरीकों से प्रस्तुत किया जाता है। कुछ कोडेक एक लंबे खंड का विश्लेषण करेंगे, जो दक्षता का अनुकूलन करने के लिए डेटा का एक फ्रेम कहा जाता है, और फिर इसे इस तरह से कोडित करेगा कि डिकोड करने के लिए एक समय में डेटा के एक बड़े सेगमेंट की आवश्यकता होती है। कोडिंग कलनविधि की अंतर्निहित विलंबता महत्वपूर्ण हो सकती है; उदाहरण के लिए, जब डेटा का दो-तरफ़ा ट्रांसमिशन होता है, जैसे कि टेलीफोन बातचीत के साथ, महत्वपूर्ण देरी कथित गुणवत्ता को गंभीरता से कम कर सकती है।

कम्प्रेशन की गति के विपरीत, जो कलनविधि द्वारा आवश्यक संचालन की संख्या के लिए आनुपातिक है, यहां विलंबता उन नमूनों की संख्या को संदर्भित करती है, जिन्हें श्रव्य के एक खंड से पहले विश्लेषण किया जाना चाहिए। न्यूनतम स्थिति में, विलंबता शून्य नमूने है (जैसे, यदि कोडर/कूटवाचक संकेत को मात्राबद्ध करने के लिए उपयोग किए जाने वाले बिट्स की संख्या को कम कर देता है)। एलपीसी जैसे समय कार्यक्षेत्र कलनविधि में भी प्रायः कम विलंबता होती है, इसलिए टेलीफोनी के लिए भाषण कोडिंग में उनकी लोकप्रियता। एमपी 3 जैसे कलनविधि में, हालांकि, आवृत्ति कार्यक्षेत्र में एक मनोविश्लेषण मॉडल को अनुप्रयुक्त करने के लिए बड़ी संख्या में नमूनों का विश्लेषण किया जाना चाहिए, और विलंबता 23 & nbsp; एमएस के आदेश पर है।

भाषण कोडिंग
भाषण कोडिंग श्रव्य डेटा कम्प्रेशन की एक महत्वपूर्ण श्रेणी है।अवधारणात्मक मॉडल यह अनुमान लगाने के लिए उपयोग किए जाते हैं कि एक मानव कान के भाषण के कौन से पहलू सुन सकते हैं, सामान्यतः संगीत के लिए उपयोग किए जाने वाले लोगों से कुछ अलग हैं।मानवीय आवाज की आवाज़ों को व्यक्त करने के लिए आवश्यक आवृत्तियों की सीमा सामान्य रूप से संगीत के लिए आवश्यक की तुलना में बहुत अधिक संकीर्ण है, और ध्वनि सामान्य रूप से कम जटिल है।नतीजतन, भाषण को अपेक्षाकृत कम बिट दर का उपयोग करके उच्च गुणवत्ता पर एन्कोड किया जा सकता है।

यह सामान्य रूप से, दो दृष्टिकोणों के कुछ संयोजन द्वारा पूरा किया जाता है:
 * केवल कोडिंग ध्वनियों को एक ही मानवीय आवाज द्वारा बनाया जा सकता है।
 * संकेत में डेटा को और अधिक फेंकना - मानव सुनवाई (सेंस) की पूर्ण आवृत्ति रेंज के बजाय एक समझदार आवाज को फिर से बनाने के लिए पर्याप्त है।

भाषण कोडिंग (और सामान्य रूप से श्रव्य डेटा कम्प्रेशन) में उपयोग किए जाने वाले शुरुआती कलनविधि ए-लॉ कलनविधि और μ- कानून कलनविधि थे।

इतिहास
बेल लैब्स में प्रारंभिक श्रव्य अनुसंधान आयोजित किया गया था।वहां, 1950 में, सी। चैपिन कटलर ने  विभेदक पल्स-कोड मॉड्यूलेशन  (DPCM) पर पेटेंट दायर किया। 1973 में,  अनुकूली DPCM  (एडीपीसीएम) को पी। कमिसकी, निकिल जयंत | निकिल एस। जयंत और जेम्स एल। फ्लैगन द्वारा प्रस्तुत किया गया था। रेखीय कोडिंग कम्प्रेशन के लिए सबसे पहले, रेखीय भविष्य कहनेवाला कोडिंग (एलपीसी) के साथ अवधारणात्मक कोडिंग का उपयोग किया गया था। एलपीसी के लिए प्रारंभिक अवधारणाएं 1966 में फुमितादा इताकुरा ( नागोया विश्वविद्यालय ) और शुजो सैटो ( निप्पॉन टेलीग्राफ और टेलीफोन ) के काम के लिए वापस आ गईं। 1970 के दशक के पर्यन्त, बेल लैब्स में बिशनू एस। अटल और मैनफ्रेड आर। श्रोएडर ने एलपीसी का एक रूप विकसित किया, जिसे अनुकूली भविष्य कहनेवाला कोडिंग (एपीसी) कहा जाता था, एक अवधारणात्मक कोडिंग कलनविधि जिसने मानव कान के मास्किंग गुणों का शोषण किया, 1980 के दशक की शुरुआत में 1980 के दशक में इसके बाद के साथ किया। कोड-उत्तेजित रैखिक भविष्यवाणी  (CELP) कलनविधि जिसने अपने समय के लिए एक महत्वपूर्ण कम्प्रेशन अनुपात प्राप्त किया। अवधारणात्मक कोडिंग का उपयोग आधुनिक श्रव्य कम्प्रेशन प्रारूपों जैसे एमपी 3 द्वारा किया जाता है और  उन्नत श्रव्य कोडेक ।

1974 में एन। अहमद, टी। नटराजन और के। आर। राव द्वारा विकसित असतत कोसाइन ट्रांसफॉर्म (डीसीटी), आधुनिक श्रव्य कम्प्रेशन प्रारूपों जैसे एमपी 3 द्वारा उपयोग किए जाने वाले संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी) के लिए आधार प्रदान किया गया, डॉल्बी डिजिटल, और एएसी। एमडीसीटी को जे। पी। प्रिंसेन, ए। डब्ल्यू। जॉनसन और ए। बी। ब्रैडली ने 1987 में प्रस्तावित किया था, 1986 में प्रिंसन और ब्रैडली द्वारा पहले के काम के बाद। दुनिया का पहला वाणिज्यिक प्रसारण स्वचालन  श्रव्य कम्प्रेशन प्रणाली ऑस्कर बोनेलो द्वारा विकसित की गई थी, जो ब्यूनस आयर्स विश्वविद्यालय में एक इंजीनियरिंग प्रोफेसर है।  1983 में, 1967 में पहली बार प्रकाशित क्रिटिकल बैंड के मास्किंग के मनोचिकित्सा सिद्धांत का उपयोग करते हुए, उन्होंने हाल ही में विकसित  आईबीएम पीसी  कंप्यूटर के आधार पर एक व्यावहारिक अनुप्रयोग विकसित करना प्रारंभ कर दिया, और प्रसारण स्वचालन प्रणाली को 1987 में  ऑडिकॉम  के नाम से लॉन्च किया गया था।बीस साल बाद, दुनिया के लगभग सभी रेडियो स्टेशन कई कंपनियों द्वारा निर्मित समान तकनीक का उपयोग कर रहे थे।

श्रव्य कोडिंग सिस्टम की एक बड़ी विविधता के लिए एक साहित्य संकलन, फरवरी 1988 में IEEE's जर्नल ऑन चयने्टेड एरियाज इन कम्युनिकेशंस (JSAC) में प्रकाशित किया गया था। जबकि उस समय से पहले से कुछ पेपर थे, इस संग्रह ने पूर्णतया से समाप्त कर दिया, काम कर रहे थे, काम कर रहे थे, काम कर रहे थे।श्रव्य कोडर्स, उनमें से लगभग सभी अवधारणात्मक तकनीकों और कुछ प्रकार के आवृत्ति विश्लेषण और बैक-एंड नीरव कोडिंग का उपयोग करते हैं।

वीडियो
असम्पीडित वीडियो के लिए एक बहुत ही उच्चतर वीडियो#स्टोरेज और डेटा दरों को असम्पीडित वीडियो के लिए आवश्यकता होती है।यद्यपि CODECS की सूची#लॉसलेस वीडियो कम्प्रेशन कोडेक्स 5 से 12 के एक कम्प्रेशन कारक पर प्रदर्शन करते हैं, एक विशिष्ट H.264/MPEG-4 AVC | H.264 लॉसलेस कम्प्रेशन वीडियो में 20 और 200 के मध्य एक कम्प्रेशन कारक है।

वीडियो कोडिंग मानकों में उपयोग की जाने वाली दो प्रमुख वीडियो कम्प्रेशन तकनीक असतत कोसाइन ट्रांसफॉर्म (डीसीटी) और मोशन मुआवजा (एमसी) हैं।अधिकांश वीडियो कोडिंग मानक, जैसे कि H.26X और MPEG प्रारूप, सामान्यतः गति-मुआवजा DCT वीडियो कोडिंग (खंड मोशन मुआवजा) का उपयोग करते हैं। अधिकांश वीडियो कोडक का उपयोग श्रव्य कम्प्रेशन तकनीकों के साथ किया जाता है, जो तथाकथित डिजिटल कंटेनर प्रारूपों का उपयोग करके एक संयुक्त पैकेज के रूप में अलग लेकिन पूरक डेटा स्ट्रीम को संग्रहीत करने के लिए होता है।

कोडिंग सिद्धांत
वीडियो डेटा को अभी भी छवि फ्रेम की एक श्रृंखला के रूप में दर्शाया जा सकता है।इस तरह के डेटा में सामान्यतः प्रचुर मात्रा में स्थानिक और लौकिक अतिरेक (सूचना सिद्धांत) होता है।वीडियो कम्प्रेशन कलनविधि अतिरेक को कम करने और जानकारी को अधिक कॉम्पैक्ट रूप से संग्रहीत करने का प्रयास करता है।

अधिकांश वीडियो कम्प्रेशन प्रारूप और वीडियो कोडेक दोनों स्थानिक और अस्थायी अतिरेक दोनों का शोषण करते हैं (उदाहरण के लिए गति मुआवजे के साथ अंतर कोडिंग के माध्यम से)।समानताएं केवल उदा।अस्थायी रूप से आसन्न फ्रेम (इंटर-फ्रेम कोडिंग) या स्थानिक रूप से आसन्न पिक्सेल ( इंट्रा फ्रेम कोडिंग )। अंतर -फ्रेम | इंटर-फ्रेम कम्प्रेशन (एक टेम्पोरल  डेल्टा कोडिंग ) (आरई) वर्तमान फ्रेम का वर्णन करने के लिए एक अनुक्रम में एक या उससे पहले या बाद के फ्रेम से डेटा का उपयोग करता है।दूसरी ओर, इंट्रा-फ्रेम कोडिंग, वर्तमान फ्रेम के भीतर से केवल डेटा का उपयोग करता है, प्रभावी रूप से अभी भी-छवि कम्प्रेशन है।

वीडियो कोडिंग प्रारूप#इंट्रा-फ्रेम वीडियो कोडिंग प्रारूप | इंट्रा-फ्रेम वीडियो कोडिंग प्रारूप कैमकॉर्डर्स और वीडियो एडिटिंग में उपयोग किए जाने वाले सरल कम्प्रेशन को नियोजित करते हैं जो केवल इंट्रा-फ्रेम भविष्यवाणी का उपयोग करता है।यह वीडियो एडिटिंग सॉफ्टवेयर को सरल बनाता है, क्योंकि यह एक ऐसी स्थिति को रोकता है जिसमें एक संपीड़ित फ्रेम डेटा को संदर्भित करता है जिसे संपादक ने हटा दिया है।

सामान्यतः, वीडियो कम्प्रेशन अतिरिक्त रूप से परिमाणीकरण  (छवि प्रसंस्करण) जैसी हानिपूर्ण कम्प्रेशन तकनीकों को नियोजित करता है जो सोर्स डेटा के पहलुओं को कम करता है जो मानव दृष्टि की अवधारणात्मक विशेषताओं का शोषण करके मानव दृश्य धारणा के लिए (अधिक या कम) अप्रासंगिक हैं।उदाहरण के लिए, रंग में छोटे अंतर चमक में परिवर्तन की तुलना में अधिक कठिन होते हैं।कम्प्रेशन कलनविधि जेपीईजी छवि कम्प्रेशन में उपयोग किए जाने वाले लोगों के समान इन समान क्षेत्रों में एक रंग का औसत कर सकता है। जैसा कि सभी हानिपूर्ण कम्प्रेशन में, वीडियो गुणवत्ता और बिट दर, कम्प्रेशन और विघटन, और सिस्टम आवश्यकताओं के प्रसंस्करण की लागत के मध्य एक व्यापार-बंद है।अत्यधिक संपीड़ित वीडियो दृश्यमान या विचलित करने वाले कम्प्रेशन कलाकृतियों को प्रस्तुत कर सकता है।

प्रचलित डीसीटी-आधारित ट्रांसफॉर्म प्रारूपों के अतिरिक्त अन्य तरीके, जैसे कि फ्रैक्टल कम्प्रेशन, मैचिंग का पीछा और असतत वेवलेट ट्रांसफॉर्म (डीडब्ल्यूटी) का उपयोग, कुछ शोधों का विषय रहा है, लेकिन सामान्यतः व्यावहारिक उत्पादों में उपयोग नहीं किया जाता है।वेवलेट कम्प्रेशन का उपयोग अभी भी-छवि कोडर्स और वीडियो कोडर्स में गति मुआवजे के बिना किया जाता है।हाल ही में सैद्धांतिक विश्लेषण के कारण फ्रैक्टल कम्प्रेशन में रुचि इस तरह के तरीकों की प्रभावशीलता की तुलनात्मक कमी दिखाती है।

इंटर-फ्रेम कोडिंग
इंटर-फ्रेम कोडिंग में, एक वीडियो अनुक्रम के व्यक्तिगत फ्रेम की तुलना एक फ्रेम से दूसरे फ्रेम से की जाती है, और वीडियो कोडेक अवशिष्ट फ्रेम को संदर्भ फ्रेम में रिकॉर्ड करता है। यदि फ्रेम में ऐसे क्षेत्र हैं जहां कुछ भी नहीं स्थानांतरित किया गया है, तो सिस्टम बस एक छोटी कमांड जारी कर सकता है जो पिछले फ्रेम के उस हिस्से को अगले एक में कॉपी करता है। यदि फ्रेम के खंड एक साधारण तरीके से चलते हैं, तो कंप्रेसर एक (थोड़ा लंबा) कमांड का उत्सर्जन कर सकता है जो डिकम्प्रेसर को शिफ्ट, रोटेट, हल्का या कॉपी को काला करने के लिए कहता है। यह लंबा कमांड अभी भी इंट्रा-फ्रेम कम्प्रेशन द्वारा उत्पन्न डेटा की तुलना में बहुत कम है। सामान्यतः, एनकोडर एक अवशेष संकेत भी प्रसारित करेगा जो संदर्भ इमेजरी के लिए शेष अधिक सूक्ष्म अंतरों का वर्णन करता है। एन्ट्रापी कोडिंग का उपयोग करते हुए, इन अवशेषों के संकेतों में पूर्ण संकेत की तुलना में अधिक कॉम्पैक्ट प्रतिनिधित्व होता है। अधिक गति वाले वीडियो के क्षेत्रों में, कम्प्रेशन को बड़ी संख्या में पिक्सेल के साथ रखने के लिए अधिक डेटा को एन्कोड करना चाहिए जो बदल रहे हैं। सामान्यतः विस्फोट, आग की लपटों, जानवरों के झुंड, और कुछ पैनिंग शॉट्स में, उच्च-आवृत्ति विस्तार से गुणवत्ता में कमी आती है या चर बिटरेट में वृद्धि होती है।

हाइब्रिड खंड-आधारित ट्रांसफॉर्म प्रारूप
आज, लगभग सभी सामान्यतः उपयोग किए जाने वाले वीडियो कम्प्रेशन विधियों (जैसे, ITU-T  या अंतर्राष्ट्रीय संगठन द्वारा अनुमोदित मानकों में, मानकीकरण के लिए अंतर्राष्ट्रीय संगठन) उसी मूल वास्तुकला को साझा करते हैं जो H.261 से वापस आता है जिसे 1988 में ITU-T द्वारा मानकीकृत किया गया था। वे ज्यादातर डीसीटी पर भरोसा करते हैं, पड़ोसी  पिक्सेल  के आयताकार खंडों पर अनुप्रयुक्त होते हैं, और गति सदिश का उपयोग करके अस्थायी भविष्यवाणी, साथ ही आजकल भी एक इन-लूप फ़िल्टरिंग कदम भी है।

भविष्यवाणी चरण में, विभिन्न आंकड़ा समर्पण  और अंतर-कोडिंग तकनीक अनुप्रयुक्त की जाती हैं जो डेटा को डिकॉर्लेट करने में सहायता करती हैं और पहले से प्रेषित डेटा के आधार पर नए डेटा का वर्णन करती हैं।

फिर शेष पिक्सेल डेटा के आयताकार खंड आवृत्ति कार्यक्षेत्र में बदल जाते हैं। मुख्य हानिपूर्ण प्रसंस्करण चरण में, आवृत्ति कार्यक्षेत्र डेटा मानव दृश्य धारणा के लिए अप्रासंगिक जानकारी को कम करने के लिए मात्राबद्ध हो जाता है।

अंतिम चरण में सांख्यिकीय अतिरेक काफी हद तक एक एन्ट्रॉपी कोडिंग द्वारा समाप्त हो जाता है जो प्रायः अंकगणित कोडिंग के कुछ रूप को अनुप्रयुक्त करता है।

एक अतिरिक्त इन-लूप फ़िल्टरिंग चरण में विभिन्न फ़िल्टर को पुनर्निर्मित छवि संकेत पर अनुप्रयुक्त किया जा सकता है। इन फिल्टर को कोडिंग लूप के अंदर भी गणना करके वे कम्प्रेशन में मदद कर सकते हैं क्योंकि उन्हें भविष्यवाणी प्रक्रिया में उपयोग करने से पहले संदर्भ सामग्री पर अनुप्रयुक्त किया जा सकता है और उन्हें मूल संकेत का उपयोग करके निर्देशित किया जा सकता है। सबसे लोकप्रिय उदाहरण फ़िल्टर को डीबॉकिंग कर रहे हैं जो कि ट्रांसफ़ॉर्मेशन खंड सीमाओं पर मात्रा में छूट से कलाकृतियों को अवरुद्ध करते हैं।

इतिहास
1967 में, ए.एच. रॉबिन्सन और सी। चेरी ने एनालॉग टेलीविजन संकेतों के प्रसारण के लिए एक रन-लंबाई कोडिंग बैंडविड्थ कम्प्रेशन योजना का प्रस्ताव रखा। असतत कोसाइन ट्रांसफॉर्म (डीसीटी), जो आधुनिक वीडियो कम्प्रेशन के लिए मौलिक है, 1974 में एन। अहमद, टी। नटराजन और के। आर। राव द्वारा प्रस्तुत किया गया था।

H.261, जिसने 1988 में शुरुआत की थी, ने व्यावसायिक रूप से वीडियो कम्प्रेशन प्रौद्योगिकी के प्रचलित बुनियादी वास्तुकला की शुरुआत की। यह डीसीटी कम्प्रेशन पर आधारित पहला वीडियो कोडिंग प्रारूप था। H.261 को कई कंपनियों द्वारा विकसित किया गया था, जिसमें Hitachi,  पिक्टुरिटेल , निप्पॉन टेलीग्राफ और टेलीफोन,  बीटी पीएलसी  और तोशिबा सम्मिलित हैं। CODECs के लिए उपयोग किए जाने वाले सबसे लोकप्रिय वीडियो कोडिंग मानक MPEG मानक हैं। MPEG-1 को 1991 में  मोशन पिक्चर एक्सपर्ट्स ग्रुप  (MPEG) द्वारा विकसित किया गया था, और इसे VHS- गुणवत्ता वाले वीडियो को संपीड़ित करने के लिए डिज़ाइन किया गया था।यह 1994 में  MPEG-2 /H.262/MPEG-2 भाग 2 | H.262 द्वारा सफल हुआ था, जिसे कई कंपनियों द्वारा विकसित किया गया था, मुख्य रूप से सोनी, टेक्नीकलर एसए और  मित्सुबिशी इलेक्ट्रिक । MPEG-2 डीवीडी और एसडी डिजिटल टेलीविजन के लिए मानक वीडियो प्रारूप बन गया। 1999 में, इसके बाद  MPEG-4 Visual  | MPEG-4/H.263 यह कई कंपनियों द्वारा भी विकसित किया गया था, मुख्य रूप से मित्सुबिशी इलेक्ट्रिक, हिताची और  पैनासोनिक । H.264/MPEG-4 AVC को 2003 में कई संगठनों, मुख्य रूप से पैनासोनिक, पचास -क्लास कंपनी  और  एलजी इलेक्ट्रॉनिक्स  द्वारा विकसित किया गया था। AVC ने व्यावसायिक रूप से आधुनिक संदर्भ-अनुकूली बाइनरी अंकगणित कोडिंग (CABAC) और  संदर्भ-अनुकूली चर-लंबाई कोडिंग (CAVLC) कलनविधि प्रस्तुत किया।AVC  ब्लू - रे डिस्क  के लिए मुख्य वीडियो कोडिंग मानक है, और व्यापक रूप से वीडियो साझा करने वाली वेबसाइटों और YouTube,  Netflix, Vimeo, और  iTunes Store , वेब सॉफ़्टवेयर जैसे  Adobe Flash Player  और  Microsoft Silverlight , और विभिन्न जैसे इंटरनेट सेवाओं को स्ट्रीमिंग द्वारा उपयोग किया जाता है। एचडीटीवी  स्थलीय और उपग्रह टेलीविजन पर प्रसारण करता है।

जेनेटिक्स
जीनोमिक री-सीक्वेंसिंग डेटा का कम्प्रेशन लॉसलेस कलनविधि की नवीनतम पीढ़ी है जो पारंपरिक कम्प्रेशन कलनविधि और विशिष्ट डेटाटाइप के अनुकूल दोनों पारंपरिक कम्प्रेशन कलनविधि और आनुवंशिक कलनविधि दोनों का उपयोग करके डेटा (सामान्यतः न्यूक्लियोटाइड्स के अनुक्रम) को संपीड़ित करता है।2012 में, जॉन्स हॉपकिंस विश्वविद्यालय के वैज्ञानिकों की एक टीम ने एक आनुवंशिक कम्प्रेशन कलनविधि प्रकाशित किया जो कम्प्रेशन के लिए एक संदर्भ जीनोम का उपयोग नहीं करता है।Hapzipper को अंतरराष्ट्रीय HAPMAP परियोजना डेटा के लिए सिलवाया गया था और 20-गुना कम्प्रेशन (फ़ाइल आकार में 95% की कमी) से अधिक प्राप्त होता है, जो 2- से 4 गुना बेहतर कम्प्रेशन प्रदान करता है और प्रमुख सामान्य-उद्देश्य कम्प्रेशन उपयोगिताओं की तुलना में कम कम्प्यूटेशनल रूप से गहन होता है।इसके लिए, चंदा, एलहाइक और बैडर ने MAF- आधारित कोडिंग (MAFE) प्रस्तुत किया, जो अपने मामूली एलील आवृत्ति द्वारा SNPs को छांटकर डेटासेट की विषमता को कम करता है, इस प्रकार डेटासेट को समरूप बनाता है। 2009 और 2013 में विकसित अन्य कलनविधि (DNAZIP और GENOMEZIP) में 1200-गुना तक का कम्प्रेशन अनुपात है-2.5 मेगाबाइट्स (एक संदर्भ जीनोम के सापेक्ष या कई जीनोम पर औसतन) में संग्रहीत किए जाने वाले 6 बिलियन बेसपेयर द्विगुणित मानव जीनोम की अनुमति दी गई है। जेनेटिक्स/जीनोमिक्स डेटा कंप्रेशर्स में एक बेंचमार्क के लिए, देखें

आउटलुक और वर्तमान में अप्रयुक्त क्षमता
यह अनुमान लगाया जाता है कि दुनिया के भंडारण उपकरणों पर संग्रहीत डेटा की कुल मात्रा 4.5: 1 के शेष औसत कारक द्वारा मौजूदा कम्प्रेशन कलनविधि के साथ और संपीड़ित की जा सकती है। यह अनुमान लगाया जाता है कि जानकारी को संग्रहीत करने के लिए दुनिया की संयुक्त तकनीकी क्षमता 2007 में 1,300 एक्साबाइट  हार्डवेयर अंक प्रदान करती है, लेकिन जब इसी सामग्री को बेहतर रूप से संपीड़ित किया जाता है, तो यह केवल शैनन जानकारी के 295 एक्सबाइट्स का प्रतिनिधित्व करता है।

यह भी देखें

 * HTTP संपीड़न
 * कोलमोगोरोव जटिलता
 * न्यूनतम विवरण लंबाई
 * मोडुलो-एन कोड
 * मोशन कोडिंग
 * रेंज कोडिंग
 * अतिरेक संपीड़न सेट करें
 * उप-बैंड कोडिंग
 * यूनिवर्सल कोड (डेटा संपीड़न)
 * वेक्टर परिमाणीकरण

इस पृष्ठ में गुम आंतरिक लिंक की सूची

 * हानिक डेटा कम्प्रेशन
 * लॉसलेस आंकड़ा कम्प्रेशन
 * हवा निकालना
 * प्रायिकता वितरण
 * अंकगणितीय कोडन
 * परिमित अवस्था मशीन
 * मनोभ्रंश संबंधी
 * सृजन हानि
 * कोडन सिद्धांत
 * पीछे की संभावनाएं
 * समष्टि वेक्टर की सुविधा
 * हटर प्राइज़
 * आँकड़ा विभाजन
 * एन्ट्रॉपी (सूचना सिद्धांत)
 * फ़ोटोग्राफ़ी संबंधी विशेषज्ञों का संयुक्त समूह
 * छवि संचिका प्रारूप
 * डिजिटल फोटो
 * अंकीय छवि
 * मोशन जेपीईजी 2000
 * गतिशील सीमा कम्प्रेशन
 * इष्टतम द्वंद्व
 * श्रव्य संचिका प्रारूप
 * श्रव्य संपादन
 * डिजिटल पीढ़ी हानि
 * सुनवाई की पूर्ण सीमा
 * समानता समोच्च
 * संशोधित असतत कोसाइन परिवर्तन
 * सुनवाई (भावना)
 * अवधारणात्मक कोडन
 * सजा जस्ट कडकुरा
 * दबाव अनुपात
 * प्रस्ताव मुआवजा
 * अंकीय कंटेनर प्रारूप
 * कम्प्रेशन कलाकृतियाँ
 * मिलान का पीछा
 * निरंकुश फ़िल्टर
 * अंतरराष्ट्रीय मानकीकरण संगठन
 * गति वेक्टर
 * संदर्भ-अनुकूली द्विआधारी अंकगणितीय कोडिंग
 * अंतर्राष्ट्रीय हापमप परियोजना
 * जीनोमिक पुन: अनुक्रमण डेटा का कम्प्रेशन

बाहरी संबंध

 * Data Compression Basics (Video)
 * Video compression 4:2:2 10-bit and its benefits
 * Why does 10-bit save bandwidth (even when content is 8-bit)?
 * Which compression technology should be used
 * Wiley – Introduction to Compression Theory
 * EBU subjective listening tests on low-bitrate audio codecs
 * Audio Archiving Guide: Music Formats (Guide for helping a user pick out the right codec)
 * hydrogenaudio wiki comparison
 * Introduction to Data Compression by Guy E Blelloch from CMU
 * HD Greetings – 1080p Uncompressed source material for compression testing and research
 * Explanation of lossless signal compression method used by most codecs
 * Interactive blind listening tests of audio codecs over the internet
 * TestVid – 2,000+ HD and other uncompressed source video clips for compression testing
 * Videsignline – Intro to Video Compression
 * Data Footprint Reduction Technology
 * What is Run length Coding in video compression.
 * What is Run length Coding in video compression.