गति प्रतिकरण

कंप्यूटिंग में गति प्रतिकरण, एक कलन विधि तकनीक है जिसका उपयोग वीडियो में कैमरे और/या वस्तुओं की गति के हिसाब से पिछले और/या भविष्य के प्रधार दिए जाने पर वीडियो में एक प्रधार का पूर्वानुमान करने के लिए किया जाता है। यह वीडियो संपीड़न के लिए वीडियो डेटा के कूटलेखन में कार्यरत है, उदाहरण के लिए MPEG-2 संचिकाओं की पीढ़ी में कार्यरत है। गति प्रतिकरण एक तस्वीर का वर्णन एक संदर्भ तस्वीर को वर्तमान तस्वीर में बदलने के संदर्भ में करता है। संदर्भ चित्र समय से पहले या भविष्य से भी हो सकता है। जब छवियों को पहले प्रेषित/संग्रहीत छवियों से यथार्थ रूप से संश्लेषित किया जा सकता है, तो संपीड़न दक्षता में सुधार किया जा सकता है।

असतत कोटिज्या परिवर्तन (डीसीटी) के साथ-साथ गति प्रतिकरण वीडियो कूटलेखन मानकों में उपयोग की जाने वाली दो प्रमुख वीडियो संपीड़न तकनीकों में से एक है। अधिकांश वीडियो कूटलेखन मानक, जैसे कि H.26x और MPEG प्रारूप, सामान्यतः गति-क्षतिपूर्ति DCT संकर कूटलेखन का उपयोग करते हैं, ब्लॉक गति प्रतिकरण (बीएमसी) या गति-प्रतिकरण डीसीटी (एमसी डीसीटी) के रूप में जाना जाता है।

कार्यक्षमता
गति प्रतिकरण इस तथ्य का लाभ उठाता है कि, प्रायः, एक चलचित्र के कई फिल्म प्रधार के लिए, एक प्रधार और दूसरे के बीच एकमात्र अंतर या तो कैमरे के हिलने या प्रधार में किसी वस्तु के हिलने का परिणाम होता है। एक वीडियो संचिका के संदर्भ में, इसका अर्थ है कि एक प्रधार का प्रतिनिधित्व करने वाली अधिकांश जानकारी अगले प्रधार में उपयोग की जाने वाली जानकारी के समान होगी।

गति प्रतिकरण का उपयोग करते हुए, एक वीडियो स्ट्रीम में कुछ पूर्ण (संदर्भ) प्रधार होंगे; तब बीच में प्रधार के लिए संग्रहीत एकमात्र जानकारी पिछले प्रधार को अगले प्रधार में बदलने के लिए आवश्यक जानकारी होगी।

सचित्र उदाहरण
गति क्षतिपूर्ति कैसे काम करती है, इसकी एक सरल सचित्र व्याख्या निम्नलिखित है। हाथी का सपना चलचित्र से लगातार दो प्रधार लिए गए। जैसा कि छवियों से देखा जा सकता है, दो प्रधारों के बीच नीचे (गति प्रतिकरण) अंतर में पहले की छवियों की तुलना में काफी कम विवरण होता है, और इस प्रकार यह बाकी की तुलना में बहुत बेहतर होता है। इस प्रकार प्रतिकरण प्रधार को कोडित करने के लिए आवश्यक जानकारी अंतर प्रधार के मुकाबले बहुत छोटी होगी। इसका अर्थ यह भी है कि कम संपीड़न दक्षता की लागत पर अंतर छवि का उपयोग करके जानकारी को सांकेतिक शब्दों में बदलना भी संभव है, लेकिन बिना गति प्रतिपूर्ति कूटलेखन के कूटलेखन जटिलता को बचाकर; वस्तुतः गति प्रतिपूर्ति कूटलेखन (गति आकलन, गति क्षतिपूर्ति सहित) कूटलेखन जटिलता के 90% से अधिक पर अधिग्रहण कर लेती है।

एमपीईजी
MPEG में, छवियों का पूर्वानुमान पिछले प्रधारों से लगाया जाता है (P frames) या पिछले और भविष्य के प्रधार से अप्रत्यक्ष रूप से (B frames). B frames अधिक जटिल हैं क्योंकि छवि अनुक्रम को प्रेषित किया जाना चाहिए और ऑर्डर से बाहर संग्रहीत किया जाना चाहिए ताकि भविष्य का प्रधार उत्पन्न करने के लिए उपलब्ध हो B frames. गति प्रतिकरण का उपयोग करके प्रधार की भविष्यवाणी करने के बाद, सांकेतिक शब्दों में बदलनेवाला अवशिष्ट पाता है, जो तब संकुचित और प्रसारित होता है।

वैश्विक गति प्रतिकरण
वैश्विक गति प्रतिकरण में, गति मॉडल मूल रूप से कैमरा गतियों को दर्शाता है जैसे:
 * डॉली — कैमरे को आगे या पीछे ले जाना
 * ट्रैक — कैमरे को बाएँ या दाएँ ले जाना
 * बूम — कैमरे को ऊपर या नीचे ले जाना
 * पैन — कैमरे को उसके Y अक्ष के चारों ओर घुमाते हुए, दृश्य को बाएँ या दाएँ घुमाते हुए
 * झुकाएँ — कैमरे को उसके X अक्ष के चारों ओर घुमाना, दृश्य को ऊपर या नीचे ले जाना
 * रोल - व्यू एक्सिस के चारों ओर कैमरे को घुमाना

यह गतिमान वस्तुओं के बिना स्थिर दृश्यों के लिए सबसे अच्छा काम करता है।

वैश्विक गति प्रतिकरण के कई फायदे हैं:
 * यह सामान्यतः वीडियो अनुक्रमों में पाए जाने वाले प्रमुख गति को केवल कुछ मापदंडों के साथ मॉडल करता है। इन पैरामीटरों की बिट-दर में हिस्सेदारी नगण्य है।
 * यह प्रधार का विभाजन नहीं करता है। यह विभाजन सीमाओं पर कलाकृतियों से बचा जाता है।
 * प्रधार में समान स्थानिक स्थिति वाले पिक्सेल की एक सीधी रेखा (समय की दिशा में) वास्तविक दृश्य में एक निरंतर गतिमान बिंदु से मेल खाती है। अन्य एमसी योजनाएं समय की दिशा में निरंतरता का परिचय देती हैं।

एमपीईजी-4 एएसपी तीन संदर्भ बिंदुओं के साथ वैश्विक गति प्रतिकरण का समर्थन करता है, हालांकि कुछ कार्यान्वयन केवल एक का उपयोग कर सकते हैं। एक एकल संदर्भ बिंदु केवल ट्रांसलेशनल गति की अनुमति देता है जो अपेक्षाकृत बड़ी प्रदर्शन लागत के लिए ब्लॉक आधारित गति प्रतिकरण पर थोड़ा लाभ प्रदान करता है।

एक प्रधार के भीतर चलती वस्तुओं को वैश्विक गति प्रतिकरण द्वारा पर्याप्त रूप से प्रदर्शित नहीं किया जाता है। इस प्रकार, स्थानीय गति अनुमान भी आवश्यक है।

ब्लॉक गति प्रतिकरण
ब्लॉक गति प्रतिकरण (बीएमसी), जिसे गति-प्रतिकरण असतत कोटिज्या ट्रांसफॉर्म (एमसी डीसीटी) के रूप में भी जाना जाता है, सबसे व्यापक रूप से इस्तेमाल की जाने वाली गति प्रतिकरण तकनीक है। BMC में, प्रधार को पिक्सेल के ब्लॉक में विभाजित किया जाता है (उदाहरण के लिए MPEG में 16×16 पिक्सेल के मैक्रो-ब्लॉक)। संदर्भ प्रधार में समान आकार के ब्लॉक से प्रत्येक ब्लॉक की भविष्यवाणी की जाती है। पूर्वानुमानित ब्लॉक की स्थिति में स्थानांतरित किए जाने के अलावा ब्लॉक किसी भी तरह से रूपांतरित नहीं होते हैं। यह बदलाव एक गति वेक्टर द्वारा दर्शाया गया है।

पड़ोसी ब्लॉक वैक्टर के बीच अतिरेक का लाभ उठाने के लिए, (उदाहरण के लिए कई ब्लॉकों द्वारा कवर की गई एकल चलती वस्तु के लिए) बिट-स्ट्रीम में केवल वर्तमान और पिछले गति वेक्टर के बीच के अंतर को सांकेतिक शब्दों में बदलना आम है। इस विभेदीकरण प्रक्रिया का परिणाम गणितीय रूप से पैनिंग करने में सक्षम वैश्विक गति प्रतिकरण के बराबर है। आगे कूटलेखन पाइपलाइन के नीचे, एक एन्ट्रापी कूटलेखन आउटपुट आकार को कम करने के लिए शून्य वेक्टर के आसपास गति वैक्टरों के परिणामी सांख्यिकीय वितरण का लाभ उठाएगी।

पिक्सेल की एक गैर-पूर्णांक संख्या द्वारा एक ब्लॉक को स्थानांतरित करना संभव है, जिसे उप-पिक्सेल परिशुद्धता कहा जाता है। इन-बीच के पिक्सेल पड़ोसी पिक्सेल को प्रक्षेपित करके उत्पन्न होते हैं। सामान्यतः, आधा-पिक्सेल या चौथाई पिक्सेल परिशुद्धता (Qpel, H.264 और MPEG-4/ASP द्वारा उपयोग किया जाता है) का उपयोग किया जाता है। उप-पिक्सेल परिशुद्धता का कम्प्यूटेशनल खर्च इंटरपोलेशन के लिए आवश्यक अतिरिक्त प्रसंस्करण और कोडितर पक्ष पर, संभावित स्रोत ब्लॉकों की एक बड़ी संख्या के मूल्यांकन के कारण बहुत अधिक है।

ब्लॉक गति प्रतिकरण का मुख्य नुकसान यह है कि यह ब्लॉक सीमाओं (अवरुद्ध कलाकृतियों) पर असंतोष का परिचय देता है। ये कलाकृतियां तेज क्षैतिज और ऊर्ध्वाधर किनारों के रूप में दिखाई देती हैं जो मानव आंखों द्वारा आसानी से देखी जाती हैं और फूरियर-संबंधित परिवर्तनों की सूची के गुणांकों के परिमाणीकरण के कारण झूठे किनारों और रिंगिंग प्रभाव (उच्च आवृत्ति उप-बैंड में बड़े गुणांक) उत्पन्न करती हैं। |फूरियर से संबंधित कूटलेखन बदलना उपयोग अवशिष्ट प्रधार के कूटलेखन को बदलने के लिए किया जाता है ब्लॉक गति प्रतिकरण मौजूदा प्रधार को नॉन-अतिछादितिंग ब्लॉक्स में विभाजित करता है, और गति प्रतिकरण वेक्टर बताता है कि वे ब्लॉक कहां से आए हैं (एक आम ग़लतफ़हमी यह है कि पिछले प्रधार को गैर-अतिव्यापी ब्लॉकों में विभाजित किया गया है, और गति क्षतिपूर्ति वैक्टर बताते हैं कि वे ब्लॉक कहाँ जाते हैं)। स्रोत ब्लॉक सामान्यतः स्रोत प्रधार में अतिछादित होते हैं। कुछ वीडियो संपीड़न एल्गोरिदम वर्तमान प्रधार को कई अलग-अलग पूर्व-संचारित प्रधारों के टुकड़ों से इकट्ठा करते हैं।

प्रधार्स को भविष्य के प्रधार से भी भविष्यवाणी की जा सकती है। भविष्य के प्रधार को अनुमानित प्रधार से पहले कोडित करने की आवश्यकता होती है और इस प्रकार, कूटलेखन ऑर्डर वास्तविक प्रधार ऑर्डर से मेल नहीं खाता है। इस तरह के प्रधारों की भविष्यवाणी सामान्यतः दो दिशाओं से की जाती है, यानी I- या P-प्रधार से जो अनुमानित प्रधार से तुरंत पहले या बाद में होते हैं। इन द्विदिश रूप से अनुमानित प्रधारों को वीडियो संपीड़न चित्र प्रकार | बी-प्रधार कहा जाता है। उदाहरण के लिए, एक कूटलेखन योजना IBBPBBPBBBPBB हो सकती है।

इसके अलावा, गति क्षतिपूर्ति के लिए त्रिकोणीय टाइलों का उपयोग भी प्रस्तावित किया गया है। इस योजना के तहत, प्रधार को त्रिकोणों के साथ टाइल किया जाता है, और इन त्रिकोणों पर एक परिशोधन परिवर्तन करके अगला प्रधार उत्पन्न किया जाता है। केवल एफ़िन परिवर्तन रिकॉर्ड/प्रेषित किए जाते हैं। यह जूमिंग, रोटेशन, ट्रांसलेशन आदि से निपटने में सक्षम है।

परिवर्तनीय ब्लॉक-आकार गति प्रतिकरण
वेरिएबल ब्लॉक-साइज़ गति कंपनसेशन (VBSMC) BMC का उपयोग है जिसमें एनकोडर के लिए गतिशील रूप से ब्लॉक के आकार का चयन करने की क्षमता होती है। वीडियो कूटलेखन करते समय, बड़े ब्लॉकों का उपयोग गति वैक्टर का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या को कम कर सकता है, जबकि छोटे ब्लॉकों के उपयोग से कोडित करने के लिए भविष्यवाणी की अवशिष्ट जानकारी कम हो सकती है। कार्य के अन्य क्षेत्रों ने ब्लॉक सीमाओं से परे चर-आकार सुविधा मेट्रिक्स के उपयोग की जांच की है, जिससे इंटरप्रधार वैक्टर की गणना की जा सकती है। पुराने डिज़ाइन जैसे H.261 और MPEG-1 वीडियो सामान्यतः एक निश्चित ब्लॉक आकार का उपयोग करते हैं, जबकि नए जैसे H.263, MPEG-4 भाग 2, H.264/MPEG-4 AVC, और VC-1 एनकोडर देते हैं गति का प्रतिनिधित्व करने के लिए किस ब्लॉक आकार का उपयोग किया जाएगा, इसे गतिशील रूप से चुनने की क्षमता।

अतिछादित्ड ब्लॉक गति प्रतिकरण
अतिछादित्ड ब्लॉक गति प्रतिकरण (ओबीएमसी) इन समस्याओं का एक अच्छा समाधान है क्योंकि यह न केवल भविष्यवाणी यथार्थता को बढ़ाता है बल्कि कलाकृतियों को अवरुद्ध करने से भी बचाता है। ओबीएमसी का उपयोग करते समय, ब्लॉक सामान्यतः प्रत्येक आयाम में दोगुने बड़े होते हैं और सभी 8 पड़ोसी ब्लॉकों के साथ चतुर्भुज-वार अतिछादित होते हैं। इस प्रकार, प्रत्येक पिक्सेल 4 ब्लॉकों से संबंधित है। ऐसी योजना में, प्रत्येक पिक्सेल के लिए 4 भविष्यवाणियाँ होती हैं जिन्हें एक भारित माध्य तक अभिव्यक्त किया जाता है। इस उद्देश्य के लिए, ब्लॉक एक विंडो फ़ंक्शन से जुड़े होते हैं जिसमें गुण होता है कि 4 अतिछादित्ड विंडो का योग हर जगह 1 के बराबर होता है।

ओबीएमसी की जटिलता को कम करने के तरीकों के अध्ययन से पता चला है कि तिरछे-आसन्न ब्लॉक के लिए विंडो फ़ंक्शन में योगदान सबसे छोटा है। इस योगदान के लिए वजन को शून्य तक कम करने और अन्य वजन को समान मात्रा में बढ़ाने से गुणवत्ता में बड़े दंड के बिना जटिलता में पर्याप्त कमी आती है। ऐसी योजना में, प्रत्येक पिक्सेल तब 4 के बजाय 3 ब्लॉकों से संबंधित होता है, और 8 पड़ोसी ब्लॉकों का उपयोग करने के बजाय, प्रत्येक ब्लॉक के मुआवजे के लिए केवल 4 का उपयोग किया जाता है। ऐसी योजना H.263 अनुलग्नक F उन्नत भविष्यवाणी मोड में पाई जाती है

क्वार्टर पिक्सेल (QPel) और आधा पिक्सेल गति प्रतिकरण
गति प्रतिकरण में, चौथाई या आधे नमूने वस्तुतः भिन्नात्मक गति वैक्टर के कारण प्रक्षेपित उप-नमूने होते हैं। वैक्टर और पूर्ण-नमूने के आधार पर, उप-नमूने की गणना बाइबिक या बिलिनियर 2-डी फ़िल्टरिंग का उपयोग करके की जा सकती है। H.264 मानक के उपखंड 8.4.2.2 भिन्नात्मक नमूना प्रक्षेप प्रक्रिया देखें।

3डी इमेज कूटलेखन तकनीक
गति क्षतिपूर्ति का उपयोग स्टीरियोस्कोपिक वीडियो कूटलेखन में किया जाता है

वीडियो में, समय को प्रायः तीसरे आयाम के रूप में माना जाता है। स्टिल इमेज कूटलेखन तकनीकों को एक अतिरिक्त आयाम में विस्तारित किया जा सकता है।

जेपीईजी 2000 वेवलेट्स का उपयोग करता है, और इन्हें अनुकूली तरीके से ब्लॉक के बीच अंतराल के बिना गति को कोडित करने के लिए भी इस्तेमाल किया जा सकता है। फ्रैक्शनल पिक्सेल affine परिवर्तन से आसन्न पिक्सेल के बीच रक्तस्राव होता है। यदि कोई उच्च आंतरिक रिज़ॉल्यूशन का उपयोग नहीं किया जाता है, तो मई + डेल्टा छवियां ज्यादातर छवि को धुंधला करने के खिलाफ लड़ती हैं। डेल्टा छवि को वेवलेट्स के रूप में भी कोडित किया जा सकता है, ताकि अनुकूली ब्लॉकों की सीमाएं मेल खा सकें।

2D+डेल्टा कूटलेखन तकनीक H.264 और MPEG-2 संगत कूटलेखन का उपयोग करती है और त्रिविम छवियों के बीच संपीड़ित करने के लिए गति क्षतिपूर्ति का उपयोग कर सकती है।

इतिहास
गति प्रतिकरण की अवधारणा का एक अग्रदूत 1929 से शुरू होता है, जब ब्रिटेन में आर.डी. केल ने एक एनालॉग वीडियो दृश्य के केवल भागों को प्रसारित करने की अवधारणा का प्रस्ताव रखा था जो प्रधार-टू-प्रधार से बदल गया था। 1959 में, एनएचके के शोधकर्ताओं वाई. टाकी, एम. होतोरी और एस. तनाका द्वारा अंतर-प्रधार गति प्रतिकरण की अवधारणा प्रस्तावित की गई थी, जिन्होंने अस्थायी आयाम में अनुमानित इंटर-प्रधार वीडियो कूटलेखन प्रस्तावित की थी।

गति-प्रतिकरण डीसीटी
प्रैक्टिकल गति-प्रतिकरण वीडियो संपीड़न गति-प्रतिकरण असतत कोटिज्या ट्रांसफ़ॉर्म (MC DCT) कूटलेखन के विकास के साथ उभरा, ब्लॉक गति प्रतिकरण (BMC) या DCT गति प्रतिकरण भी कहा जाता है। यह एक हाइब्रिड कूटलेखन कलन विधि है, जो दो प्रमुख डेटा संपीड़न तकनीकों को जोड़ती है: असतत कोटिज्या ट्रांसफ़ॉर्म (DCT) कूटलेखन स्थानिक आयाम में, और लौकिक आयाम में भविष्य कहनेवाला गति प्रतिकरण। डीसीटी कूटलेखन एक हानिपूर्ण संपीड़न ब्लॉक संपीड़न परिवर्तन कूटलेखन तकनीक है जिसे पहली बार एन. अहमद द्वारा प्रस्तावित किया गया था, जो शुरू में इसे 1972 में छवि संपीड़न के लिए अभिप्रेत था। 1974 में, दक्षिणी कैलिफोर्निया विश्वविद्यालय में अली हबीबी ने हाइब्रिड कूटलेखन की शुरुआत की, जो प्रिडिक्टिव कूटलेखन को ट्रांसफॉर्म कूटलेखन के साथ जोड़ती है। हालाँकि, उनका एल्गोरिथ्म शुरू में स्थानिक आयाम में इंट्रा-प्रधार कूटलेखन तक सीमित था। 1975 में, जॉन ए. रोएज़ और गनर एस. रॉबिन्सन ने हबीबी के हाइब्रिड कूटलेखन एल्गोरिद्म को टेम्पोरल डाइमेंशन में ट्रांसफ़ॉर्म कूटलेखन और टेम्पोरल डायमेंशन में प्रेडिक्टिव कूटलेखन का उपयोग करते हुए इंटर-प्रधार गति-मुआवज़ा हाइब्रिड कूटलेखन विकसित करते हुए, टेम्पोरल डायमेंशन तक बढ़ाया। स्थानिक परिवर्तन कूटलेखन के लिए, उन्होंने डीसीटी और फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के साथ प्रयोग किया, दोनों के लिए इंटर-प्रधार हाइब्रिड कोडर विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे कुशल है, छवि डेटा को कम करने में सक्षम है 2- अंश प्रति पिक्सेल की आवश्यकता वाले इंट्रा-प्रधार कोडर की तुलना में छवि गुणवत्ता वाले videotelephone दृश्य के लिए 0.25-बिट प्रति पिक्सेल।

1977 में, वेन-सिउंग चेन ने सी.एच. के साथ एक तेज़ डीसीटी एल्गोरिदम विकसित किया। स्मिथ और एस.सी. फ्रलिक। 1979 में, अनिल के. जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के. जैन और जसवंत आर. जैन ने गति-प्रतिपूर्ति डीसीटी वीडियो संपीड़न विकसित किया, ब्लॉक गति प्रतिकरण भी कहा जाता है। इसने 1981 में चेन को एक व्यावहारिक वीडियो संपीड़न एल्गोरिथ्म विकसित करने के लिए प्रेरित किया, जिसे गति-क्षतिपूर्ति DCT या अनुकूली दृश्य कूटलेखन कहा जाता है। गति-प्रतिकरण DCT बाद में 1980 के दशक के अंत से वीडियो संपीड़न के लिए मानक कूटलेखन तकनीक बन गया।

पहला डिजिटल वीडियो कूटलेखन मानक H.120 था, जिसे 1984 में ITU-T (अब ITU-T) द्वारा विकसित किया गया था। H.120 ने गति-क्षतिपूर्ति DPCM कूटलेखन का उपयोग किया, जो वीडियो कूटलेखन के लिए अक्षम था, और H.120 इस प्रकार कम प्रदर्शन के कारण अव्यावहारिक था। H.261 मानक 1988 में गति-क्षतिपूर्ति DCT संपीड़न के आधार पर विकसित किया गया था, और यह पहला व्यावहारिक वीडियो कूटलेखन मानक था। तब से, गति-कंपेंसेटेड DCT कम्प्रेशन को सभी प्रमुख वीडियो कूटलेखन मानकों (H.26x और MPEG फॉर्मेट सहित) द्वारा अपनाया गया है।

यह भी देखें

 * गति अनुमान
 * छवि स्थिरीकरण
 * इंटर प्रधार
 * एचडीटीवी धुंधला
 * टेलीविजन मानक रूपांतरण
 * विडफायर
 * एक्स-वीडियो गति प्रतिकरण

अनुप्रयोग

 * वीडियो संपीड़न
 * 60 हर्ट्ज एलसीडी या 100 हर्ट्ज interlaced  कैथोड रे ट्यूब पर 24 प्रधार प्रति सेकेंड मूवी प्लेबैक के लिए प्रधार रेट का परिवर्तन

बाहरी संबंध

 * Temporal Rate Conversion - article giving an overview of motion compensation techniques.
 * A New FFT Architecture and Chip Design for Motion Compensation based on Phase Correlation
 * DCT and DFT coefficients are related by simple factors
 * DCT better than DFT also for video
 * John Wiseman, An Introduction to MPEG Video Compression
 * DCT and motion compensation
 * Compatibility between DCT, motion compensation and other methods