असतत कोसाइन परिवर्तन: Difference between revisions
No edit summary |
m (10 revisions imported from alpha:असतत_कोसाइन_परिवर्तन) |
||
(3 intermediate revisions by 2 users not shown) | |||
Line 35: | Line 35: | ||
{{columns-list|colwidth=50em|*[[ऑडियो सिग्नल प्रोसेसिंग]] - [[ऑडियो कोडिंग]], [[ऑडियो डेटा संपीड़न]] (हानिपूर्ण और दोषरहित),<ref name="Ochoa129">{{cite book |last1=Ochoa-Dominguez |first1=Humberto |last2=Rao |first2=K. R. |author2-link=K. R. Rao |title=Discrete Cosine Transform, Second Edition |date=2019 |publisher=[[CRC Press]] |isbn=9781351396486 |pages=1–3, 129 |url=https://books.google.com/books?id=dVOWDwAAQBAJ}}</ref> [[चारों ओर ध्वनि]],<ref name="Luo"/> [[ध्वनिक प्रतिध्वनि रद्दीकरण|ध्वनिक प्रतिध्वनि]] और [[अनुकूली प्रतिक्रिया रद्दीकरण|प्रतिक्रिया रद्दीकरण]], [[ध्वनि]] मान्यता, [[समय-डोमेन अलियासिंग रद्दीकरण]] (टीडीएसी)<ref name="Ochoa"/> | {{columns-list|colwidth=50em|*[[ऑडियो सिग्नल प्रोसेसिंग]] - [[ऑडियो कोडिंग]], [[ऑडियो डेटा संपीड़न]] (हानिपूर्ण और दोषरहित),<ref name="Ochoa129">{{cite book |last1=Ochoa-Dominguez |first1=Humberto |last2=Rao |first2=K. R. |author2-link=K. R. Rao |title=Discrete Cosine Transform, Second Edition |date=2019 |publisher=[[CRC Press]] |isbn=9781351396486 |pages=1–3, 129 |url=https://books.google.com/books?id=dVOWDwAAQBAJ}}</ref> [[चारों ओर ध्वनि]],<ref name="Luo"/> [[ध्वनिक प्रतिध्वनि रद्दीकरण|ध्वनिक प्रतिध्वनि]] और [[अनुकूली प्रतिक्रिया रद्दीकरण|प्रतिक्रिया रद्दीकरण]], [[ध्वनि]] मान्यता, [[समय-डोमेन अलियासिंग रद्दीकरण]] (टीडीएसी)<ref name="Ochoa"/> | ||
**[[डिजिटल ऑडियो]]<ref name="Stankovic"/> | **[[डिजिटल ऑडियो]]<ref name="Stankovic"/> | ||
**[[डिजिटल रेडियो]] - [[डिजिटल ऑडियो प्रसारण]] (डी ए बी+),<ref name="Britanak"/> [[ | **[[डिजिटल रेडियो]] - [[डिजिटल ऑडियो प्रसारण]] (डी ए बी+),<ref name="Britanak"/> [[एचडी रेडियो]]<ref name="Jones">{{cite book |last1=Jones |first1=Graham A. |last2=Layer |first2=David H. |last3=Osenkowsky |first3=Thomas G. |title=National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook |date=2013 |publisher=[[Taylor & Francis]] |isbn=978-1-136-03410-7 |pages=558–9 |url=https://books.google.com/books?id=K9N1TVhf82YC&pg=PA558}}</ref> | ||
**[[भाषण प्रसंस्करण]] — [[भाषण कोडिंग]]<ref name="Hersent"/><ref name="AppleInsider standards 1"/> [[वाक् पहचान]], [[आवाज गतिविधि पहचान]] (वीएडी)<ref name="Ochoa"/> | **[[भाषण प्रसंस्करण]] — [[भाषण कोडिंग]]<ref name="Hersent"/><ref name="AppleInsider standards 1"/> [[वाक् पहचान]], [[आवाज गतिविधि पहचान]] (वीएडी)<ref name="Ochoa"/> | ||
**[[डिजिटल टेलीफोनी]] — [[वॉयस-ओवर-आईपी]] (वीओआईपी),<ref name="Hersent"/> [[मोबाइल टेलीफोनी]], [[वीडियो टेलीफोनी]],<ref name="AppleInsider standards 1"/> [[टेलीकांफ्रेंसिंग]], [[वीडियोकांफ्रेंसिंग]]<ref name="Stankovic"/> | **[[डिजिटल टेलीफोनी]] — [[वॉयस-ओवर-आईपी]] (वीओआईपी),<ref name="Hersent"/> [[मोबाइल टेलीफोनी]], [[वीडियो टेलीफोनी]],<ref name="AppleInsider standards 1"/> [[टेलीकांफ्रेंसिंग]], [[वीडियोकांफ्रेंसिंग]]<ref name="Stankovic"/> | ||
Line 241: | Line 241: | ||
=== एमडी डीसीटी === | === एमडी डीसीटी === | ||
{{See also|जेडपीईजी}} | {{See also|जेडपीईजी}} | ||
बहुआयामी डीसीटी (एमडी डीसीटी) में कई अनुप्रयोग हैं, मुख्य रूप से 3- | बहुआयामी डीसीटी (एमडी डीसीटी) में कई अनुप्रयोग हैं, मुख्य रूप से 3-डी डीसीटी जैसे 3-डी डीसीटी-II, जिसमें कई नए एप्लिकेशन हैं जैसे हाइपरस्पेक्ट्रल इमेजिंग कोडिंग सिस्टम,<ref name="appDCT">{{Citation |first1=G. P. |last1=Abousleman |first2=M. W. |last2=Marcellin |first3=B. R. |last3=Hunt |title=Compression of hyperspectral imagery using 3-D DCT and hybrid DPCM/DCT |journal=IEEE Trans. Geosci. Remote Sens. |date=January 1995 |volume=33 |issue=1 |pages=26–34 |doi=10.1109/36.368225|bibcode=1995ITGRS..33...26A }}</ref> परिवर्तनीय अस्थायी लंबाई 3-डी डीसीटी कोडिंग,<ref name="app2DCT">{{Citation |first1=Y. |last1=Chan |first2=W. |last2=Siu |title= Variable temporal-length 3-D discrete cosine transform coding |journal=IEEE Trans. Image Processing. |date=May 1997 |volume=6 |issue=5 |pages=758–763 |doi=10.1109/83.568933|pmid=18282969 |bibcode=1997ITIP....6..758C |url=http://www.en.polyu.edu.hk/~wcsiu/paper_store/Journal/1997/1997_J3-IEEE-Chan%26Siu.pdf |citeseerx=10.1.1.516.2824 }}</ref> वीडियो कोडिंग (डाक बाजार) एल्गोरिदम,<ref name="app3DCT">{{Citation |first1=J. |last1=Song |first2=Z. |last2=SXiong |first3=X. |last3=Liu |first4=Y. |last4=Liu |title= An algorithm for layered video coding and transmission| journal= Proc. Fourth Int. Conf./Exh. High Performance Comput. Asia-Pacific Region |volume=2 |pages=700–703}}</ref> अनुकूली वीडियो कोडिंग <ref name="app4DCT">{{Citation |first1=S.-C |last1=Tai |first2=Y. |last2=Gi |first3=C.-W. |last3=Lin |title= An adaptive 3-D discrete cosine transform coder for medical image compression |journal= IEEE Trans. Inf. Technol. Biomed. |date=September 2000 |volume=4 |issue=3 |pages=259–263 |doi=10.1109/4233.870036|pmid=11026596 |s2cid=18016215 }}</ref> और 3-डी कंप्रेस्ड।<ref name="app5DCT">{{Citation |first1=B. |last1=Yeo |first2=B. |last2=Liu |title= Volume rendering of DCT-based compressed 3D scalar data |journal=IEEE Trans. Comput. Graphics. |date=May 1995 |volume=1 |pages=29–43 |doi=10.1109/2945.468390}}</ref> हार्डवेयर, सॉफ्टवेयर और कई फास्ट एल्गोरिदम के परिचय में वृद्धि के कारण, एम-डी डीसीटी का उपयोग करने की आवश्यकता तेजी से बढ़ रही है। डीसीटी-IV ने वास्तविक-मूल्य वाले पॉलीफेज़ फ़िल्टरिंग बैंकों के तेजी से कार्यान्वयन में अपने अनुप्रयोगों के लिए लोकप्रियता प्राप्त की है,<ref>{{cite book| doi=10.1109/ISCAS.2000.856261 | chapter=Perfect reconstruction modulated filter banks with sum of powers-of-two coefficients | title=2000 IEEE International Symposium on Circuits and Systems. Emerging Technologies for the 21st Century. Proceedings (IEEE Cat No.00CH36353) | year=2000 | last1=Chan | first1=S.C. | last2=Liu | first2=W. | last3=Ho | first3=K.I. | volume=2 | pages=73–76 | hdl=10722/46174 | isbn=0-7803-5482-6 | s2cid=1757438 }}</ref> जो लैप्ड ऑर्थोगोनल परिवर्तन<ref>{{cite journal |last1=Queiroz |first1=R. L. |last2=Nguyen |first2=T. Q. |title=Lapped transforms for efficient transform/subband coding |journal=IEEE Trans. Signal Process. |date=1996 |volume=44 |issue=5 |pages=497–507}}</ref>{{sfn|Malvar|1992}} और कोसाइन-मॉड्यूलेटेड वेवलेट बेस हैं।<ref>{{cite journal |last1=Chan |first1=S. C. |last2=Luo |first2=L. |last3=Ho |first3=K. L. |title=M-Channel compactly supported biorthogonal cosine-modulated wavelet bases |journal=IEEE Trans. Signal Process. |date=1998 |volume=46 |issue=2 |pages=1142–1151|doi=10.1109/78.668566 |bibcode=1998ITSP...46.1142C |hdl=10722/42775 |hdl-access=free }}</ref> | ||
=== डिजिटल सिग्नल प्रोसेसिंग === | === डिजिटल सिग्नल प्रोसेसिंग === | ||
डिजिटल सिग्नल प्रोसेसिंग में डीसीटी बहुत महत्वपूर्ण भूमिका निभाता है। डीसीटी का उपयोग करके, संकेतों को संपीड़ित किया जा सकता है। डीसीटी का उपयोग ईसीजी संकेतों के कंप्रेस्ड के लिए [[ विद्युतहृद्लेख |विद्युतहृद्लेख]] में किया जा सकता है। इसके आधार पर डीसीटी2 डीसीटी की तुलना में | डिजिटल सिग्नल प्रोसेसिंग में डीसीटी बहुत महत्वपूर्ण भूमिका निभाता है। डीसीटी का उपयोग करके, संकेतों को संपीड़ित किया जा सकता है। डीसीटी का उपयोग ईसीजी संकेतों के कंप्रेस्ड के लिए [[ विद्युतहृद्लेख |विद्युतहृद्लेख]] में किया जा सकता है। इसके आधार पर डीसीटी2 डीसीटी की तुलना में उत्तम कंप्रेस्ड अनुपात प्रदान करता है। | ||
डीसीटी को व्यापक रूप से [[ अंकीय सिग्नल प्रोसेसर |अंकीय सिग्नल प्रोसेसर]] (डीएसपी), साथ ही डिजिटल सिग्नल प्रोसेसिंग सॉफ्टवेयर में लागू किया जाता है।कई कंपनियों ने डीसीटी प्रौद्योगिकी के आधार पर डीएसपी विकसित किए हैं। डीसीटी व्यापक रूप से [[ एन्कोडिंग |एन्कोडिंग]] , डिकोडिंग, वीडियो, ऑडियो, मल्टीप्लेक्सिंग, कंट्रोल सिग्नल, सिग्नलिंग और एनालॉग-टू-डिजिटल रूपांतरण जैसे अनुप्रयोगों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग सामान्यतः उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर एकीकृत सर्किट के लिए भी किया जाता है।<ref name="Stankovic"/> | डीसीटी को व्यापक रूप से [[ अंकीय सिग्नल प्रोसेसर |अंकीय सिग्नल प्रोसेसर]] (डीएसपी), साथ ही डिजिटल सिग्नल प्रोसेसिंग सॉफ्टवेयर में लागू किया जाता है।कई कंपनियों ने डीसीटी प्रौद्योगिकी के आधार पर डीएसपी विकसित किए हैं। डीसीटी व्यापक रूप से [[ एन्कोडिंग |एन्कोडिंग]] , डिकोडिंग, वीडियो, ऑडियो, मल्टीप्लेक्सिंग, कंट्रोल सिग्नल, सिग्नलिंग और एनालॉग-टू-डिजिटल रूपांतरण जैसे अनुप्रयोगों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग सामान्यतः उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर एकीकृत सर्किट के लिए भी किया जाता है।<ref name="Stankovic"/> | ||
Line 259: | Line 259: | ||
[[Image:DCT-symmetries.svg|thumb|right|350px|डीसीटी इनपुट डेटा के निहित/विषम एक्सटेंशन का चित्रण, एन = 11 डेटा बिंदुओं (लाल डॉट्स) के लिए, डीसीटी के चार सबसे सामान्य प्रकारों के लिए (प्रकार I-IV)।]] | [[Image:DCT-symmetries.svg|thumb|right|350px|डीसीटी इनपुट डेटा के निहित/विषम एक्सटेंशन का चित्रण, एन = 11 डेटा बिंदुओं (लाल डॉट्स) के लिए, डीसीटी के चार सबसे सामान्य प्रकारों के लिए (प्रकार I-IV)।]] | ||
चूंकि, क्योंकि डीसीटी परिमित, असतत अनुक्रमों पर कार्य करते हैं, दो मुद्दे उत्पन्न होते हैं जो निरंतर कोसाइन ट्रांसफ़ॉर्म के लिए लागू नहीं होते हैं। सबसे पहले, किसी को यह निर्दिष्ट करना होगा कि क्या फ़ंक्शन डोमेन के बाएं और दाएं दोनों सीमाओं पर भी या विषम है ( | चूंकि, क्योंकि डीसीटी परिमित, असतत अनुक्रमों पर कार्य करते हैं, दो मुद्दे उत्पन्न होते हैं जो निरंतर कोसाइन ट्रांसफ़ॉर्म के लिए लागू नहीं होते हैं। सबसे पहले, किसी को यह निर्दिष्ट करना होगा कि क्या फ़ंक्शन डोमेन के बाएं और दाएं दोनों सीमाओं पर भी या विषम है (अर्ताथ नीचे दी गई परिभाषाओं में मिन-एन और मैक्स-एन सीमाएं)। दूसरा, किसी को यह निर्दिष्ट करना होगा कि फ़ंक्शन किस बिंदु पर या विषम है। विशेष रूप से, चार समान रूप से स्पेस किए गए डेटा बिंदुओं के अनुक्रम एबीसीडी पर विचार करें, और कहते हैं कि हम बाईं सीमा भी निर्दिष्ट करते हैं। दो समझदार संभावनाएं हैं: या तो डेटा नमूना ए के बारे में भी हैं, जिस स्थिति में भी विस्तार डीसीबीएबीसीडी है, या डेटा A और पिछले बिंदु के बीच बिंदु आधे रास्ते के बारे में भी है, इस स्थिति में भी विस्तार डीसीबीएबीसीडी है, यहाँ पर ए को दोहराया जाता है। | ||
ये विकल्प डीसीटी के सभी मानक विविधताओं को जन्म देते हैं और साइन परिवर्तन (डीएसटीएस) को भी असतत करते हैं। | ये विकल्प डीसीटी के सभी मानक विविधताओं को जन्म देते हैं और साइन परिवर्तन (डीएसटीएस) को भी असतत करते हैं। | ||
Line 267: | Line 267: | ||
ये विभिन्न सीमा स्थितियां परिवर्तन के अनुप्रयोगों को दृढ़ता से प्रभावित करती हैं, और विभिन्न डीसीटी प्रकारों के लिए विशिष्ट रूप से उपयोगी गुणों को ले जाती हैं। सबसे सीधे, जब वर्णक्रमीय तरीकों से आंशिक अंतर समीकरणों को हल करने के लिए फूरियर-संबंधित रूपांतरण का उपयोग करते हैं, तो सीमा की स्थिति को सीधे समस्या के भाग के रूप में निर्दिष्ट किया जाता है। संशोधित असतत कोसाइन परिवर्तन (टाइप-आईवी डीसीटी के आधार पर) के लिए, सीमा की स्थिति एमडीसीटी की महत्वपूर्ण संपत्ति में समय-डोमेन अलियासिंग रद्दीकरण की महत्वपूर्ण संपत्ति में सम्मिलित है। अधिक सूक्ष्म फैशन में, सीमा की स्थिति ऊर्जा कॉम्पैक्टिफिकेशन गुणों के लिए उत्तरदायी होते हैं, जो डीसीटी को इमेज और ऑडियो कंप्रेस्ड के लिए उपयोगी बनाते हैं, क्योंकि सीमाएं किसी भी फूरियर जैसी श्रृंखला के अभिसरण की दर को प्रभावित करती हैं। | ये विभिन्न सीमा स्थितियां परिवर्तन के अनुप्रयोगों को दृढ़ता से प्रभावित करती हैं, और विभिन्न डीसीटी प्रकारों के लिए विशिष्ट रूप से उपयोगी गुणों को ले जाती हैं। सबसे सीधे, जब वर्णक्रमीय तरीकों से आंशिक अंतर समीकरणों को हल करने के लिए फूरियर-संबंधित रूपांतरण का उपयोग करते हैं, तो सीमा की स्थिति को सीधे समस्या के भाग के रूप में निर्दिष्ट किया जाता है। संशोधित असतत कोसाइन परिवर्तन (टाइप-आईवी डीसीटी के आधार पर) के लिए, सीमा की स्थिति एमडीसीटी की महत्वपूर्ण संपत्ति में समय-डोमेन अलियासिंग रद्दीकरण की महत्वपूर्ण संपत्ति में सम्मिलित है। अधिक सूक्ष्म फैशन में, सीमा की स्थिति ऊर्जा कॉम्पैक्टिफिकेशन गुणों के लिए उत्तरदायी होते हैं, जो डीसीटी को इमेज और ऑडियो कंप्रेस्ड के लिए उपयोगी बनाते हैं, क्योंकि सीमाएं किसी भी फूरियर जैसी श्रृंखला के अभिसरण की दर को प्रभावित करती हैं। | ||
विशेष रूप से, यह सर्वविदित है कि फ़ंक्शन में असंतोष का कोई भी वर्गीकरण फूरियर श्रृंखला के अभिसरण की दर को कम करता है, जिससे कि किसी दिए गए सटीकता के साथ फ़ंक्शन का प्रतिनिधित्व करने के लिए अधिक साइनसोइड की आवश्यकता हो। ही सिद्धांत सिग्नल कंप्रेस्ड के लिए डीएफटी और अन्य रूपांतरण की उपयोगिता को नियंत्रित करता है, यह एक फ़ंक्शन है, इसके डीएफटी या डीसीटी में कम शर्तों को इसका सटीक रूप से प्रतिनिधित्व करने की आवश्यकता होती है, और जितना अधिक इसे संकुचित किया जा सकता है। (यहां, हम डीएफटी या डीसीटी को फ़ंक्शन की फूरियर सीरीज़ या [[ कोसाइन श्रृंखला |कोसाइन श्रृंखला]] के लिए क्रमशः अनुमान के रूप में सोचते हैं, जिससे कि इसकी चिकनाई के बारे में बात की जा सके।) चूंकि, डीएफटी की अंतर्निहित आवधिकता का अर्थ है कि डिसकंटिनिटी सामान्यतः सीमाओं पर होती हैं। सिग्नल के किसी भी यादृच्छिक खंड को बाएं और दाएं दोनों सीमाओं पर समान मूल्य होने की संभावना नहीं है। (डीएसटी के लिए समान समस्या उत्पन्न होती है, जिसमें विषम वाम सीमा की स्थिति किसी भी फ़ंक्शन के लिए असंतोष का अर्थ है जो उस सीमा पर शून्य नहीं होता है।) इसके विपरीत, डीसीटी जहां दोनों सीमाएं सदैव निरंतर विस्तार करती हैं। सीमाएं (चूंकि ढलान सामान्यतः असंतोष है)। यही कारण है कि डीसीटी, और विशेष रूप से I, II, V, और VI के प्रकारों के डीसीटी (जिन प्रकारों में दो भी सीमाएँ हैं) सामान्यतः जीएफटी और डीएसटीएस की तुलना में सिग्नल कंप्रेस्ड के लिए | विशेष रूप से, यह सर्वविदित है कि फ़ंक्शन में असंतोष का कोई भी वर्गीकरण फूरियर श्रृंखला के अभिसरण की दर को कम करता है, जिससे कि किसी दिए गए सटीकता के साथ फ़ंक्शन का प्रतिनिधित्व करने के लिए अधिक साइनसोइड की आवश्यकता हो। ही सिद्धांत सिग्नल कंप्रेस्ड के लिए डीएफटी और अन्य रूपांतरण की उपयोगिता को नियंत्रित करता है, यह एक फ़ंक्शन है, इसके डीएफटी या डीसीटी में कम शर्तों को इसका सटीक रूप से प्रतिनिधित्व करने की आवश्यकता होती है, और जितना अधिक इसे संकुचित किया जा सकता है। (यहां, हम डीएफटी या डीसीटी को फ़ंक्शन की फूरियर सीरीज़ या [[ कोसाइन श्रृंखला |कोसाइन श्रृंखला]] के लिए क्रमशः अनुमान के रूप में सोचते हैं, जिससे कि इसकी चिकनाई के बारे में बात की जा सके।) चूंकि, डीएफटी की अंतर्निहित आवधिकता का अर्थ है कि डिसकंटिनिटी सामान्यतः सीमाओं पर होती हैं। सिग्नल के किसी भी यादृच्छिक खंड को बाएं और दाएं दोनों सीमाओं पर समान मूल्य होने की संभावना नहीं है। (डीएसटी के लिए समान समस्या उत्पन्न होती है, जिसमें विषम वाम सीमा की स्थिति किसी भी फ़ंक्शन के लिए असंतोष का अर्थ है जो उस सीमा पर शून्य नहीं होता है।) इसके विपरीत, डीसीटी जहां दोनों सीमाएं सदैव निरंतर विस्तार करती हैं। सीमाएं (चूंकि ढलान सामान्यतः असंतोष है)। यही कारण है कि डीसीटी, और विशेष रूप से I, II, V, और VI के प्रकारों के डीसीटी (जिन प्रकारों में दो भी सीमाएँ हैं) सामान्यतः जीएफटी और डीएसटीएस की तुलना में सिग्नल कंप्रेस्ड के लिए उत्तम प्रदर्शन करती हैं। व्यवहार में, टाइप- II डीसीटी सामान्यतः ऐसे अनुप्रयोगों के लिए पसंद किया जाता है, कम्प्यूटेशनल सुविधा के कारण हैं। | ||
== औपचारिक परिभाषा == | == औपचारिक परिभाषा == | ||
औपचारिक रूप से, असतत कोसाइन परिवर्तन [[ रैखिक |रैखिक]] , व्युत्क्रम फंक्शन (गणित) <math> f : \R^{N} \to \R^{N} </math> है (जहाँ | औपचारिक रूप से, असतत कोसाइन परिवर्तन [[ रैखिक |रैखिक]] , व्युत्क्रम फंक्शन (गणित) <math> f : \R^{N} \to \R^{N} </math> है (जहाँ पर <math> \R</math> वास्तविक संख्याओं के सेट को दर्शाता है), या बराबर रूप से उल्टा {{mvar|N}} × {{mvar|N}} स्क्वायर आव्यूह हैं। जो थोड़ी संशोधित परिभाषाओं के साथ डीसीटी के कई वेरिएंट हैं। इसके आधार पर {{mvar|N}} }} वास्तविक संख्या <math>~ x_0,\ \ldots\ x_{N - 1} ~</math> में परिवर्तित हो गए हैं, इसके आधार पर {{mvar|N}} वास्तविक संख्या <math> X_0,\, \ldots,\, X_{N - 1} </math> सूत्रों में से के अनुसार: | ||
=== डीसीटी-i === | === डीसीटी-i === | ||
Line 290: | Line 290: | ||
डीसीटी-II संभवतः सबसे अधिक उपयोग किया जाने वाला रूप है, और अधिकांशतः इसे केवल डीसीटी के रूप में संदर्भित किया जाता है।<ref name="pubDCT"/><ref name="pubRaoYip"/> | डीसीटी-II संभवतः सबसे अधिक उपयोग किया जाने वाला रूप है, और अधिकांशतः इसे केवल डीसीटी के रूप में संदर्भित किया जाता है।<ref name="pubDCT"/><ref name="pubRaoYip"/> | ||
यह रूपांतरण बिल्कुल समतुल्य है (2 के समग्र पैमाने के कारक तक) असतत फूरियर परिवर्तन के लिए <math>4N</math> समरूपता के वास्तविक इनपुट जहां समरूपता वाले तत्व शून्य हैं। यही है, यह असतत फूरियर परिवर्तन का आधा है, इस प्रकार <math>4N</math> आदानों <math> y_n ,</math> जहाँ | यह रूपांतरण बिल्कुल समतुल्य है (2 के समग्र पैमाने के कारक तक) असतत फूरियर परिवर्तन के लिए <math>4N</math> समरूपता के वास्तविक इनपुट जहां समरूपता वाले तत्व शून्य हैं। यही है, यह असतत फूरियर परिवर्तन का आधा है, इस प्रकार <math>4N</math> आदानों <math> y_n ,</math> जहाँ पर <math> y_{2n} = 0 ,</math> <math> y_{2n+1} = x_n </math> के लिये <math> 0 \leq n < N ,</math> <math> y_{2N} = 0 ,</math> तथा <math> y_{4N-n} = y_n </math> के लिये <math> 0 < n < 2N .</math> डीसीटी-II परिवर्तन भी 2 का उपयोग करके संभव है{{mvar|N}} सिग्नल के बाद आधी पारी से गुणा किया जाता है।यह [[ जॉन मखौल |जॉन मखौल]] द्वारा प्रदर्शित किया गया है। | ||
कुछ लेखक आगे गुणा करते हैं <math> X_0 </math> के द्वारा <math> 1/\sqrt{2\,} \, .</math> और परिणामी आव्यूह को समग्र पैमाने के कारक <math display="inline">\sqrt{{2}/{N}}</math> द्वारा गुणा करते हैं। इसके लिए डीसीटी-III में संबंधित परिवर्तन के लिए नीचे देखें। यह डीसीटी-II आव्यूह ऑर्थोगोनल आव्यूह बनाता है, किन्तु आधे-शिफ्ट किए गए इनपुट के वास्तविक-ईवन असतत फूरियर रूपांतरण के साथ प्रत्यक्ष पत्राचार को तोड़ता है। यह मैटलैब द्वारा उपयोग किया जाने वाला सामान्यीकरण है, उदाहरण के लिए, देखें।<ref>{{cite web |url=https://www.mathworks.com/help/signal/ref/dct.html |title=Discrete cosine transform - MATLAB dct |website=www.mathworks.com |access-date=2019-07-11}}</ref> कई अनुप्रयोगों में, जैसे कि जेपीईजी, स्केलिंग है, क्योंकि पैमाने के कारकों को बाद के कम्प्यूटेशनल चरण (जैसे कि जेपीईजी में परिमाणीकरण (सिग्नल प्रोसेसिंग) चरण के साथ जोड़ा जा सकता है<ref>{{cite book |isbn=9780442012724 |title=JPEG: Still Image Data Compression Standard |last1=Pennebaker |first1=William B. |last2=Mitchell |first2=Joan L. |date=31 December 1992}}</ref>), और स्केलिंग को चुना जा सकता है जो डीसीटी को कम गुणन के साथ गणना करने की अनुमति देता है।<ref>{{cite journal |url=https://search.ieice.org/bin/summary.php?id=e71-e_11_1095 |first1=Y. |last1=Arai |first2=T. |last2=Agui |first3=M. |last3=Nakajima |title=A fast DCT-SQ scheme for images |journal=IEICE Transactions |volume=71 |issue=11 |pages= 1095–1097 |year=1988}}</ref><ref>{{cite journal |doi=10.1016/j.sigpro.2008.01.004 |title=Type-II/III DCT/DST algorithms with reduced number of arithmetic operations |year=2008 |last1=Shao |first1=Xuancheng |last2=Johnson |first2=Steven G. |journal=Signal Processing |volume=88 |issue=6 |pages=1553–1564 |arxiv=cs/0703150 |s2cid=986733}}</ref> | कुछ लेखक आगे गुणा करते हैं <math> X_0 </math> के द्वारा <math> 1/\sqrt{2\,} \, .</math> और परिणामी आव्यूह को समग्र पैमाने के कारक <math display="inline">\sqrt{{2}/{N}}</math> द्वारा गुणा करते हैं। इसके लिए डीसीटी-III में संबंधित परिवर्तन के लिए नीचे देखें। यह डीसीटी-II आव्यूह ऑर्थोगोनल आव्यूह बनाता है, किन्तु आधे-शिफ्ट किए गए इनपुट के वास्तविक-ईवन असतत फूरियर रूपांतरण के साथ प्रत्यक्ष पत्राचार को तोड़ता है। यह मैटलैब द्वारा उपयोग किया जाने वाला सामान्यीकरण है, उदाहरण के लिए, देखें।<ref>{{cite web |url=https://www.mathworks.com/help/signal/ref/dct.html |title=Discrete cosine transform - MATLAB dct |website=www.mathworks.com |access-date=2019-07-11}}</ref> कई अनुप्रयोगों में, जैसे कि जेपीईजी, स्केलिंग है, क्योंकि पैमाने के कारकों को बाद के कम्प्यूटेशनल चरण (जैसे कि जेपीईजी में परिमाणीकरण (सिग्नल प्रोसेसिंग) चरण के साथ जोड़ा जा सकता है<ref>{{cite book |isbn=9780442012724 |title=JPEG: Still Image Data Compression Standard |last1=Pennebaker |first1=William B. |last2=Mitchell |first2=Joan L. |date=31 December 1992}}</ref>), और स्केलिंग को चुना जा सकता है जो डीसीटी को कम गुणन के साथ गणना करने की अनुमति देता है।<ref>{{cite journal |url=https://search.ieice.org/bin/summary.php?id=e71-e_11_1095 |first1=Y. |last1=Arai |first2=T. |last2=Agui |first3=M. |last3=Nakajima |title=A fast DCT-SQ scheme for images |journal=IEICE Transactions |volume=71 |issue=11 |pages= 1095–1097 |year=1988}}</ref><ref>{{cite journal |doi=10.1016/j.sigpro.2008.01.004 |title=Type-II/III DCT/DST algorithms with reduced number of arithmetic operations |year=2008 |last1=Shao |first1=Xuancheng |last2=Johnson |first2=Steven G. |journal=Signal Processing |volume=88 |issue=6 |pages=1553–1564 |arxiv=cs/0703150 |s2cid=986733}}</ref> | ||
Line 321: | Line 321: | ||
चूंकि, ये वेरिएंट व्यवहार में संभवतः ही कभी उपयोग किए जाते हैं। जिसके कारण संभवतः यह विषम-लंबाई वाले डीएफटी के लिए फास्ट फूरियर परिवर्तन एल्गोरिदम सामान्यतः फास्ट फूरियर परिवर्तन एल्गोरिदम की तुलना में भी अधिक जटिल होते हैं, जो कि भी लंबाई वाले डीएफटी के लिए एल्गोरिदम होते हैं (जैसे कि सबसे सरल रेडिक्स -2 एल्गोरिदम केवल लंबाई के लिए भी होते हैं), और यह बढ़ी हुई गहनता कैरी करता हैनीचे वर्णित के रूप में डीसीटी पर। | चूंकि, ये वेरिएंट व्यवहार में संभवतः ही कभी उपयोग किए जाते हैं। जिसके कारण संभवतः यह विषम-लंबाई वाले डीएफटी के लिए फास्ट फूरियर परिवर्तन एल्गोरिदम सामान्यतः फास्ट फूरियर परिवर्तन एल्गोरिदम की तुलना में भी अधिक जटिल होते हैं, जो कि भी लंबाई वाले डीएफटी के लिए एल्गोरिदम होते हैं (जैसे कि सबसे सरल रेडिक्स -2 एल्गोरिदम केवल लंबाई के लिए भी होते हैं), और यह बढ़ी हुई गहनता कैरी करता हैनीचे वर्णित के रूप में डीसीटी पर। | ||
(तुच्छ रियल-ईवन सरणी, एकल संख्या की लंबाई-एक डीएफटी (विषम लंबाई) {{mvar|a}} | (तुच्छ रियल-ईवन सरणी, एकल संख्या की लंबाई-एक डीएफटी (विषम लंबाई) {{mvar|a}}, लंबाई के डीसीटी-v से मेल खाती है <math> N = 1 .</math>) | ||
== व्युत्क्रम रूपांतरण == | == व्युत्क्रम रूपांतरण == | ||
उपरोक्त सामान्यीकरण सम्मेलनों का उपयोग करते हुए, डीसीटी-I का व्युत्क्रम डीसीटी-I को 2/ | उपरोक्त सामान्यीकरण सम्मेलनों का उपयोग करते हुए, डीसीटी-I का व्युत्क्रम डीसीटी-I को 2/1 से गुणा किया जाता है।डीसीटी-IV का व्युत्क्रम डीसीटी-IV 2/n से गुणा किया गया है।डीसीटी-II का व्युत्क्रम डीसीटी-III को 2/n और इसके विपरीत से गुणा किया जाता है।<ref name="pubRaoYip"/> | ||
असतत फूरियर ट्रांसफ़ॉर्म के लिए, इन परिवर्तन परिभाषाओं के सामने सामान्यीकरण कारक केवल सम्मेलन है और उपचारों के बीच भिन्न होता है।उदाहरण के लिए, कुछ लेखक | असतत फूरियर ट्रांसफ़ॉर्म के लिए, इन परिवर्तन परिभाषाओं के सामने सामान्यीकरण कारक केवल सम्मेलन है और उपचारों के बीच भिन्न होता है।उदाहरण के लिए, कुछ लेखक <math display="inline">\sqrt{2/N}</math> द्वारा परिवर्तन को गुणा करते हैं, जिससे कि व्युत्क्रम किसी भी अतिरिक्त गुणक कारक की आवश्यकता न हो।के उचित कारकों के साथ संयुक्त {{sqrt|2}} (ऊपर देखें), इसका उपयोग परिवर्तन आव्यूह ऑर्थोगोनल आव्यूह बनाने के लिए किया जा सकता है। | ||
== बहुआयामी डीसीटी == | == बहुआयामी डीसीटी == | ||
Line 332: | Line 332: | ||
विभिन्न डीसीटी प्रकारों के बहुआयामी वेरिएंट एक-आयामी परिभाषाओं से सीधे तौर पर पालन करते हैं: वे प्रत्येक आयाम के साथ डीसीटी के अलग उत्पाद (समकक्ष, रचना) हैं। | विभिन्न डीसीटी प्रकारों के बहुआयामी वेरिएंट एक-आयामी परिभाषाओं से सीधे तौर पर पालन करते हैं: वे प्रत्येक आयाम के साथ डीसीटी के अलग उत्पाद (समकक्ष, रचना) हैं। | ||
=== | === एम-डी डीसीटी-II === | ||
उदाहरण के लिए, इमेज या आव्यूह का दो-आयामी डीसीटी-II बस एक-आयामी डीसीटी-II है, ऊपर से, पंक्तियों के साथ और फिर कॉलम (या इसके विपरीत) के साथ प्रदर्शन किया जाता है।अर्थात्, 2 डी डीसीटी- II को सूत्र द्वारा दिया गया है (सामान्यीकरण और अन्य पैमाने के कारकों को छोड़ देना, जैसा कि ऊपर): | उदाहरण के लिए, इमेज या आव्यूह का दो-आयामी डीसीटी-II बस एक-आयामी डीसीटी-II है, ऊपर से, पंक्तियों के साथ और फिर कॉलम (या इसके विपरीत) के साथ प्रदर्शन किया जाता है।अर्थात्, 2 डी डीसीटी- II को सूत्र द्वारा दिया गया है (सामान्यीकरण और अन्य पैमाने के कारकों को छोड़ देना, जैसा कि ऊपर): | ||
Line 351: | Line 351: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
: एक बहु-आयामी डीसीटी का व्युत्क्रम संबंधित एक-आयामी डीसीटी (ऊपर देखें) के व्युत्क्रमों का अलग उत्पाद है, | : एक बहु-आयामी डीसीटी का व्युत्क्रम संबंधित एक-आयामी डीसीटी (ऊपर देखें) के व्युत्क्रमों का अलग उत्पाद है, उदाहरण के लिए एक आयामी इनवर्स पंक्ति-स्तंभ एल्गोरिथ्म में समय में आयाम के साथ लागू होते हैं। | ||
3- | 3-डी डीसीटी-II केवल तीन आयामी स्थान में 2-डी डीसीटी-II का विस्तार है और गणितीय रूप से सूत्र द्वारा गणना की जा सकती है | ||
:<math> | :<math> | ||
Line 366: | Line 366: | ||
\text{for } k_i = 0,1,2,\dots,N_i-1. | \text{for } k_i = 0,1,2,\dots,N_i-1. | ||
</math> | </math> | ||
3- | 3-डी डीसीटी-II का व्युत्क्रम 3-डी डीसीटी-III है और इसे दिए गए सूत्र से गणना की जा सकती है | ||
:<math> | :<math> | ||
x_{n_1,n_2,n_3} = | x_{n_1,n_2,n_3} = | ||
Line 378: | Line 378: | ||
\text{for } n_i=0,1,2,\dots,N_i-1. | \text{for } n_i=0,1,2,\dots,N_i-1. | ||
</math> | </math> | ||
तकनीकी रूप से, प्रत्येक आयाम के साथ एक-आयामी डीसीटी के अनुक्रमों द्वारा दो-, तीन- (या - | तकनीकी रूप से, प्रत्येक आयाम के साथ एक-आयामी डीसीटी के अनुक्रमों द्वारा दो-, तीन- (या -मल्टी) आयामी डीसीटी की गणना पंक्ति-स्तंभ एल्गोरिथ्म के रूप में जाना जाता है। फास्ट फूरियर परिवर्तन के लिए बहुआयामी एफएफटी के साथ, चूंकि, अलग क्रम में गणना करते समय ही चीज़ की गणना करने के लिए अन्य तरीके उपस्थित हैं (अर्ताथ विभिन्न आयामों के लिए एल्गोरिदम को इंटरलेविंग/संयोजन/संयोजन)।3-डी डीसीटी के आधार पर अनुप्रयोगों में तेजी से वृद्धि के कारण, 3-डी डीसीटी-II की गणना के लिए कई फास्ट एल्गोरिदम विकसित किए जाते हैं।वेक्टर-रेडिक्स एल्गोरिदम को कम्प्यूटेशनल जटिलता को कम करने और कम्प्यूटेशनल गति बढ़ाने के लिए एम-डी डीसीटी की गणना के लिए लागू किया जाता है।3-डी डीसीटी-II कुशलता से गणना करने के लिए, फास्ट एल्गोरिथ्म, वेक्टर-रेडिक्स डिकिमेशन इन फ्रीक्वेंसी (वीआर डीआईएफ) एल्गोरिथ्म विकसित किया गया था। | ||
==== 3-डी डीसीटी-II | ==== 3-डी डीसीटी-II वीआर डीआईएफ ==== | ||
वीआर डीआईएफ एल्गोरिथ्म को लागू करने के लिए इनपुट डेटा को तैयार किया जाना है और निम्नानुसार पुनर्व्यवस्थित किया जाना है।<ref>{{cite journal|doi=10.1049/ip-f-2.1990.0063|title=Direct methods for computing discrete sinusoidal transforms|year=1990|last1=Chan|first1=S.C.|last2=Ho|first2=K.L.|journal=IEE Proceedings F Radar and Signal Processing|volume=137|issue=6|page=433}}</ref><ref name=":0">{{cite journal|first1=O.|last1=Alshibami|first2=S.|last2=Boussakta|title=Three-dimensional algorithm for the 3-D DCT-III|journal=Proc. Sixth Int. Symp. Commun., Theory Applications|date=July 2001|pages=104–107}}</ref> परिवर्तन आकार n × n × n को माना जाता | वीआर डीआईएफ एल्गोरिथ्म को लागू करने के लिए इनपुट डेटा को तैयार किया जाना है, और यह निम्नानुसार पुनर्व्यवस्थित किया जाना है।<ref>{{cite journal|doi=10.1049/ip-f-2.1990.0063|title=Direct methods for computing discrete sinusoidal transforms|year=1990|last1=Chan|first1=S.C.|last2=Ho|first2=K.L.|journal=IEE Proceedings F Radar and Signal Processing|volume=137|issue=6|page=433}}</ref><ref name=":0">{{cite journal|first1=O.|last1=Alshibami|first2=S.|last2=Boussakta|title=Three-dimensional algorithm for the 3-D DCT-III|journal=Proc. Sixth Int. Symp. Commun., Theory Applications|date=July 2001|pages=104–107}}</ref> इसका परिवर्तन आकार n × n × n को माना जाता है। | ||
[[File:Stages of the 3-D DCT-II VR DIF algorithm.jpg|thumb| | [[File:Stages of the 3-D DCT-II VR DIF algorithm.jpg|thumb|वीआर डीआईएफ एल्गोरिथ्म का उपयोग करके 3-डी डीसीटी-II की गणना के चार मौलिक चरणों | 336x336px]] | ||
:<math> | :<math> | ||
\begin{array}{lcl}\tilde{x}(n_1,n_2,n_3) =x(2n_1,2n_2,2n_3)\\ | \begin{array}{lcl}\tilde{x}(n_1,n_2,n_3) =x(2n_1,2n_2,2n_3)\\ | ||
Line 395: | Line 395: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
:जहाँ | :जहाँ पर <math>0\leq n_1,n_2,n_3 \leq \frac{N}{2} -1</math> | ||
आसन्न का आंकड़ा उन चार चरणों को दर्शाता है जो वीआर डीआईएफ एल्गोरिथ्म का उपयोग करके 3-डी डीसीटी-II की गणना में सम्मिलित | आसन्न का आंकड़ा उन चार चरणों को दर्शाता है जो वीआर डीआईएफ एल्गोरिथ्म का उपयोग करके 3-डी डीसीटी-II की गणना में सम्मिलित हैं। इसका पहला चरण उपरोक्त समीकरणों द्वारा सचित्र इंडेक्स मैपिंग का उपयोग करके 3-डी पुनर्मूल्यांकन है। इसके लिए दूसरा चरण बटर फ्लाई गणना है। इस प्रकार प्रत्येक बटर फ्लाई आठ अंकों की गणना साथ करता है जैसा कि नीचे दिए गए आंकड़े में दिखाया गया है, जहां <math>c(\varphi_i)=\cos(\varphi_i)</math> के समान हैं। | ||
मूल 3-डी डीसीटी-II अब के रूप में लिखा जा सकता | मूल 3-डी डीसीटी-II अब के रूप में लिखा जा सकता है। | ||
:<math>X(k_1,k_2,k_3)=\sum_{n_1=1}^{N-1}\sum_{n_2=1}^{N-1}\sum_{n_3=1}^{N-1}\tilde{x}(n_1,n_2,n_3) \cos(\varphi k_1)\cos(\varphi k_2)\cos(\varphi k_3) | :<math>X(k_1,k_2,k_3)=\sum_{n_1=1}^{N-1}\sum_{n_2=1}^{N-1}\sum_{n_3=1}^{N-1}\tilde{x}(n_1,n_2,n_3) \cos(\varphi k_1)\cos(\varphi k_2)\cos(\varphi k_3) | ||
</math> | </math> | ||
जहाँ | जहाँ पर <math>\varphi_i= \frac{\pi}{2N}(4N_i+1),\text{ and } i= 1,2,3.</math> | ||
यदि सम और विषम भागों <math>k_1,k_2</math> तथा <math>k_3</math> और माना जाता है, 3-डी डीसीटी-II की गणना के लिए सामान्य सूत्र के रूप में व्यक्त किया जा सकता है। [[File:Single butterfly of the 3-D DCT-II VR DIF algorithm.jpg|thumb|वीआर डीआईएफ एल्गोरिथ्म का एकल तितली चरण। 310x310px]] | |||
:<math>X(k_1,k_2,k_3)=\sum_{n_1=1}^{\tfrac N 2 -1}\sum_{n_2=1}^{\tfrac N 2 -1}\sum_{n_1=1}^{\tfrac N 2 -1}\tilde{x}_{ijl}(n_1,n_2,n_3) \cos(\varphi (2k_1+i)\cos(\varphi (2k_2+j) | :<math>X(k_1,k_2,k_3)=\sum_{n_1=1}^{\tfrac N 2 -1}\sum_{n_2=1}^{\tfrac N 2 -1}\sum_{n_1=1}^{\tfrac N 2 -1}\tilde{x}_{ijl}(n_1,n_2,n_3) \cos(\varphi (2k_1+i)\cos(\varphi (2k_2+j) | ||
\cos(\varphi (2k_3+l))</math> | \cos(\varphi (2k_3+l))</math> | ||
जहाँ | जहाँ पर | ||
: <math>\tilde{x}_{ijl}(n_1,n_2,n_3)=\tilde{x}(n_1,n_2,n_3)+(-1)^l\tilde{x}\left(n_1,n_2,n_3+\frac{n}{2}\right) </math> | : <math>\tilde{x}_{ijl}(n_1,n_2,n_3)=\tilde{x}(n_1,n_2,n_3)+(-1)^l\tilde{x}\left(n_1,n_2,n_3+\frac{n}{2}\right) </math> | ||
Line 414: | Line 414: | ||
: <math>+(-1)^{i+j+l}\tilde{x}\left(n_1+\frac{n}{2},n_2+\frac{n}{2},n_3+\frac{n}{2}\right) \text{ where } i,j,l= 0 \text{ or } 1.</math> | : <math>+(-1)^{i+j+l}\tilde{x}\left(n_1+\frac{n}{2},n_2+\frac{n}{2},n_3+\frac{n}{2}\right) \text{ where } i,j,l= 0 \text{ or } 1.</math> | ||
===== अंकगणितीय जटिलता ===== | ===== अंकगणितीय जटिलता ===== | ||
पूरे 3-डी डीसीटी गणना की जरूरत है <math>~ [\log_2 N] ~</math> चरणों, और प्रत्येक चरण में | पूरे 3-डी डीसीटी गणना की जरूरत है <math>~ [\log_2 N] ~</math> चरणों, और प्रत्येक चरण में <math>~ \tfrac{1}{8}\ N^3 ~</math> बटर फ्लाई सम्मिलित हैं। इस प्रकार पूरे 3-डी डीसीटी की आवश्यकता है, इसके लिए<math>~ \left[ \tfrac{1}{8}\ N^3 \log_2 N \right] ~</math> बटर फ्लाई की गणना की जानी चाहिए। इस प्रकार प्रत्येक बटर फ्लाई को सात वास्तविक गुणन (तुच्छ गुणा सहित) और 24 वास्तविक परिवर्धन (तुच्छ परिवर्धन सहित) की आवश्यकता होती है। इसलिए, इस चरण के लिए आवश्यक वास्तविक गुणन की कुल संख्या <math>~ \left[ \tfrac{7}{8}\ N^3\ \log_2 N \right] ~,</math> है और वास्तविक परिवर्धन की कुल संख्या अर्ताथ पोस्ट-एडिशन (पुनरावर्ती परिवर्धन) सहित, जिसकी गणना सीधे बटर फ्लाई चरण के बाद या बिट-रिवर्स स्टेज <math>~ \underbrace{\left[\frac{3}{2}N^3 \log_2N\right]}_\text{Real}+\underbrace{\left[\frac{3}{2}N^3 \log_2N-3N^3+3N^2\right]}_\text{Recursive} = \left[\frac{9}{2}N^3 \log_2N-3N^3+3N^2\right] ~.</math> के द्वारा दी जाती है।<ref name=":0" /> | ||
एमडी-डीसीटी-II की गणना करने के लिए पारंपरिक विधि पंक्ति-स्तंभ-फ्रेम ( | |||
एमडी-डीसीटी-II की गणना करने के लिए पारंपरिक विधि पंक्ति-स्तंभ-फ्रेम (आरसीएफ) दृष्टिकोण का उपयोग कर रही है जो कम्प्यूटेशनल रूप से जटिल और सबसे उन्नत हाल के हार्डवेयर प्लेटफार्मों पर कम उत्पादक है।आरसीएफ एल्गोरिथ्म की तुलना में वीआर डीआईएफ एल्गोरिथ्म की गणना करने के लिए आवश्यक गुणा की संख्या काफी कम होती है। इस प्रकार आरसीएफ दृष्टिकोण में सम्मिलित गुणन और परिवर्धन की संख्या दी गई है <math>~\left[\frac{3}{2}N^3 \log_2 N \right]~</math> तथा <math>~ \left[\frac{9}{2}N^3 \log_2 N - 3N^3 + 3N^2 \right] ~,</math> क्रमशः सूची 1 से, यह देखा जा सकता है कि कुल संख्या | |||
{| class="wikitable sortable" | {| class="wikitable sortable" | ||
|+ | |+सूची 1 | ||
3डी-डीसीटी-II की गणना के लिए आरएसीएफएफ एल्गोरिदम की तुलना | |||
! | !परिवर्तित आकार | ||
! | !3डी वीआर मल्टी | ||
! | !आरसीएफ मल्टीज़ | ||
! | !3डी वीआर एड्स | ||
! | !आरसीएफ एड्स | ||
|- | |- | ||
|8 × 8 × 8 | |8 × 8 × 8 | ||
Line 449: | Line 450: | ||
|24.047 | |24.047 | ||
|} | |} | ||
3-डी डीसीटी वीआर एल्गोरिथ्म से जुड़े गुणन आरसीएफ दृष्टिकोण से 40%से अधिक से जुड़े | 3-डी डीसीटी वीआर एल्गोरिथ्म से जुड़े गुणन आरसीएफ दृष्टिकोण से 40%से अधिक से जुड़े हैं। इसके अतिरिक्त, आरसीएफ दृष्टिकोण में नए वीआर एल्गोरिथ्म की तुलना में आव्यूह ट्रांसपोज़ और अधिक इंडेक्सिंग और डेटा स्वैपिंग सम्मिलित हैं।यह 3-डी डीसीटी वीआर एल्गोरिथ्म को 3-डी अनुप्रयोगों के लिए अधिक कुशल और उत्तम अनुकूल बनाता है जिसमें 3-डी डीसीटी- II जैसे वीडियो कंप्रेस्ड और अन्य 3-डी इमेज प्रोसेसिंग एप्लिकेशन सम्मिलित हैं। | ||
एक तेज एल्गोरिथ्म चुनने में मुख्य विचार कम्प्यूटेशनल और संरचनात्मक जटिलताओं से बचना है।जैसा कि कंप्यूटर और डीएसपी की तकनीक अग्रिमों में, अंकगणितीय संचालन (गुणा और परिवर्धन) का निष्पादन समय बहुत तेज होता जा रहा है, और नियमित रूप से कम्प्यूटेशनल संरचना सबसे महत्वपूर्ण कारक बन जाती है।<ref>{{cite journal |doi=10.1109/78.827550 |title=On the computation of two-dimensional DCT |year=2000 |last1=Guoan Bi |last2=Gang Li |last3=Kai-Kuang Ma |last4=Tan |first4=T.C. |journal=IEEE Transactions on Signal Processing |volume=48 |issue=4 |pages=1171–1183 |bibcode=2000ITSP...48.1171B}}</ref> इसलिए, चूंकि उपरोक्त प्रस्तावित 3-डी वीआर एल्गोरिथ्म गुणन की संख्या पर सैद्धांतिक निचले बाउंड को प्राप्त नहीं करता है,<ref>{{cite journal |doi=10.1109/18.144722 |title=On the multiplicative complexity of discrete cosine transforms |date=July 1992 |last1=Feig |first1=E. |last2=Winograd |first2=S. |journal=IEEE Transactions on Information Theory |volume=38 |issue=4 |pages=1387–1391}}</ref> अन्य 3-डी डीसीटी एल्गोरिदम की तुलना में इसकी सरल कम्प्यूटेशनल संरचना | एक तेज एल्गोरिथ्म चुनने में मुख्य विचार कम्प्यूटेशनल और संरचनात्मक जटिलताओं से बचना है।जैसा कि कंप्यूटर और डीएसपी की तकनीक अग्रिमों में, अंकगणितीय संचालन (गुणा और परिवर्धन) का निष्पादन समय बहुत तेज होता जा रहा है, और नियमित रूप से कम्प्यूटेशनल संरचना सबसे महत्वपूर्ण कारक बन जाती है।<ref>{{cite journal |doi=10.1109/78.827550 |title=On the computation of two-dimensional DCT |year=2000 |last1=Guoan Bi |last2=Gang Li |last3=Kai-Kuang Ma |last4=Tan |first4=T.C. |journal=IEEE Transactions on Signal Processing |volume=48 |issue=4 |pages=1171–1183 |bibcode=2000ITSP...48.1171B}}</ref> इसलिए, चूंकि उपरोक्त प्रस्तावित 3-डी वीआर एल्गोरिथ्म गुणन की संख्या पर सैद्धांतिक निचले बाउंड को प्राप्त नहीं करता है,<ref>{{cite journal |doi=10.1109/18.144722 |title=On the multiplicative complexity of discrete cosine transforms |date=July 1992 |last1=Feig |first1=E. |last2=Winograd |first2=S. |journal=IEEE Transactions on Information Theory |volume=38 |issue=4 |pages=1387–1391}}</ref> अन्य 3-डी डीसीटी एल्गोरिदम की तुलना में इसकी सरल कम्प्यूटेशनल संरचना है। यह एकल बटर फ्लाई का उपयोग करके लागू किया जा सकता है, और 3-डी में कूली-टुकी एफएफटी एल्गोरिथ्म के गुणों के पास होता है। इसलिए, 3-डी वीआर 3-डी डीसीटी-II की गणना में अंकगणितीय संचालन को कम करने के लिए अच्छा विकल्प प्रस्तुत करता है, जबकि सरल संरचना को ध्यान में रखते हुए जो बटर फ्लाई-शैली कोइली-टुकी एफएफटी एल्गोरिदम की विशेषता है। | ||
[[File:DCT-8x8.png|thumb|250px|जेपीईजी#असतत कोसाइन परिवर्तन से द्वि-आयामी डीसीटी आवृत्तियों]] | [[File:DCT-8x8.png|thumb|250px|जेपीईजी#असतत कोसाइन परिवर्तन से द्वि-आयामी डीसीटी आवृत्तियों]] | ||
दाईं ओर की इमेज के लिए क्षैतिज और ऊर्ध्वाधर आवृत्तियों का संयोजन दिखाती है {{nobr| 8 × 8 }} <math>(~ N_1 = N_2 = 8 ~)</math> दो-आयामी | दाईं ओर की इमेज के लिए क्षैतिज और ऊर्ध्वाधर आवृत्तियों का संयोजन दिखाती है {{nobr| 8 × 8 }} <math>(~ N_1 = N_2 = 8 ~)</math> दो-आयामी डीसीटी का उपयोग किया जाता हैं।प्रत्येक कदम बाएं से दाएं और ऊपर से नीचे तक आवृत्ति में 1/2 चक्र की वृद्धि होती है। | ||
उदाहरण के लिए, शीर्ष-बाएं वर्ग से दाएं को स्थानांतरित करने से क्षैतिज आवृत्ति में आधा चक्र वृद्धि होती | |||
उदाहरण के लिए, शीर्ष-बाएं वर्ग से दाएं को स्थानांतरित करने से क्षैतिज आवृत्ति में आधा चक्र वृद्धि होती है। दाईं ओर और कदम दो आधा-चक्र देता है। इस चरण के नीचे दो आधा-चक्र क्षैतिज रूप से और आधा चक्र को लंबवत रूप से देता है। स्रोत डेटा {{nobr|( 8×8 )}} इन 64 आवृत्ति वर्गों के [[ रैखिक संयोजन |रैखिक संयोजन]] में परिवर्तित कर दिया जाता जाता है। | |||
=== एमडी-डीसीटी-IV === | === एमडी-डीसीटी-IV === | ||
एम-डी डीसीटी-IV केवल 1-D डीसीटी-IV का विस्तार है, इस प्रकार {{mvar|M}} आयामी डोमेन का उपयोग होता हैं। यह एक आव्यूह या इमेज के 2-डी डीसीटी-आईवी द्वारा दिया गया है | |||
:<math> X_{k,\ell} = | :<math> X_{k,\ell} = | ||
\sum_{n=0}^{N-1} \; \sum_{m=0}^{M-1} \ x_{n,m} \cos\left(\ \frac{\,( 2 m + 1 )( 2 k + 1 )\ \pi \,}{4N} \ \right) \cos\left(\ \frac{\, ( 2n + 1 )( 2 \ell + 1 )\ \pi \,}{4M} \ \right) ~,</math> | \sum_{n=0}^{N-1} \; \sum_{m=0}^{M-1} \ x_{n,m} \cos\left(\ \frac{\,( 2 m + 1 )( 2 k + 1 )\ \pi \,}{4N} \ \right) \cos\left(\ \frac{\, ( 2n + 1 )( 2 \ell + 1 )\ \pi \,}{4M} \ \right) ~,</math> | ||
: के लिये <math>~~ k = 0,\ 1,\ 2\ \ldots\ N-1 ~~</math> तथा <math>~~ \ell= 0,\ 1,\ 2,\ \ldots\ M-1 ~.</math> | : के लिये <math>~~ k = 0,\ 1,\ 2\ \ldots\ N-1 ~~</math> तथा <math>~~ \ell= 0,\ 1,\ 2,\ \ldots\ M-1 ~.</math> | ||
हम नियमित रूप से पंक्ति-स्तंभ विधि का उपयोग करके एमडी डीसीटी-आईवी की गणना कर सकते हैं या हम बहुपद परिवर्तन विधि का उपयोग कर सकते हैं<ref>{{cite book |last=Nussbaumer |first=H.J. |title=Fast Fourier transform and convolution algorithms |publisher=Springer-Verlag |location=New York |date=1981 |edition=1st }}</ref> तेज और कुशल गणना के | हम नियमित रूप से पंक्ति-स्तंभ विधि का उपयोग करके एमडी डीसीटी-आईवी की गणना कर सकते हैं या हम बहुपद परिवर्तन विधि का उपयोग कर सकते हैं<ref>{{cite book |last=Nussbaumer |first=H.J. |title=Fast Fourier transform and convolution algorithms |publisher=Springer-Verlag |location=New York |date=1981 |edition=1st }}</ref> तेज और कुशल गणना के लिए उपयोग किया जाता हैं। इस एल्गोरिथ्म का मुख्य विचार बहुआयामी डीसीटी को सीधे 1-डी डीसीटी की श्रृंखला में परिवर्तित करने के लिए बहुपद रूपांतरण का उपयोग करना है। एमडी डीसीटी-IV में विभिन्न क्षेत्रों में कई अनुप्रयोग भी हैं। | ||
== गणना == | == गणना == | ||
चूंकि इन सूत्रों के प्रत्यक्ष अनुप्रयोग की आवश्यकता होगी <math>~ \mathcal{O}(N^2) ~</math> संचालन, केवल | चूंकि इन सूत्रों के प्रत्यक्ष अनुप्रयोग की आवश्यकता होगी <math>~ \mathcal{O}(N^2) ~</math> संचालन, केवल <math>~ \mathcal{O}(N \log N ) ~</math> की गणना करना संभव है, फास्ट फूरियर परिवर्तन (एफएफटी) के समान गणना को कारक करके जटिलता।एक के साथ संयुक्त एफएफटी के माध्यम से डीसीटी की गणना भी कर सकते हैं <math>~\mathcal{O}(N)~</math> पूर्व और पोस्ट-प्रोसेसिंग स्टेप्स।सामान्य रूप में, <math>~\mathcal{O}(N \log N )~</math> डीसीटी की गणना करने के तरीके फास्ट कोसाइन परिवर्तन (एफसीटी) एल्गोरिदम के रूप में जाना जाता है। | ||
सबसे कुशल एल्गोरिदम, सिद्धांत रूप में, सामान्यतः वे होते हैं जो सीधे डीसीटी के लिए विशिष्ट होते हैं, जैसा कि साधारण एफएफटी प्लस का उपयोग करने के विपरीत है <math>~ \mathcal{O}(N) ~</math> अतिरिक्त संचालन (एक अपवाद के लिए नीचे देखें) | सबसे कुशल एल्गोरिदम, सिद्धांत रूप में, सामान्यतः वे होते हैं जो सीधे डीसीटी के लिए विशिष्ट होते हैं, जैसा कि साधारण एफएफटी प्लस का उपयोग करने के विपरीत है <math>~ \mathcal{O}(N) ~</math> अतिरिक्त संचालन (एक अपवाद के लिए नीचे देखें)। चूंकि, यहां तक कि विशेष डीसीटी एल्गोरिदम (उन सभी सहित जो सबसे कम ज्ञात अंकगणितीय गणना प्राप्त करते हैं, कम से कम दो की शक्ति के लिए। पावर-ऑफ-टू आकार) सामान्यतः एफएफटी एल्गोरिदम से निकटता से संबंधित होते हैं-चूंकि डीसीटी अनिवार्य रूप से रियल-ईवन के डीएफटी होते हैं। डेटा, एफएफटी लेकर और इस समरूपता के कारण निरर्थक संचालन को समाप्त करके तेज़ डीसीटी एल्गोरिथ्म डिजाइन कर सकता है। यह भी स्वचालित रूप से किया जा सकता है, {{harv|फ्रीगो|जाॅनसन|2005}} कूली -टर्की एफएफटी एल्गोरिथ्म पर आधारित एल्गोरिदम सबसे साधारण हैं, किन्तु कोई भी अन्य एफएफटी एल्गोरिथ्म भी लागू होता है। उदाहरण के लिए, विनोग्राड एफएफटी एल्गोरिथ्म डीएफटी के लिए न्यूनतम-मल्टीप्लिकेशन एल्गोरिदम की ओर जाता है, यद्यपि सामान्यतः अधिक परिवर्धन की लागत पर, और समान एल्गोरिथ्म द्वारा {{harv|फीज|विनोग्रैड|जुलाई 1992}} डीसीटी के लिए प्रस्तावित किया गया था। क्योंकि जीएफटी, डीसीटी, और इसी प्रकार के रूपांतरों के लिए एल्गोरिदम सभी इतने निकट से संबंधित हैं, रूपांतरण के लिए एल्गोरिदम में कोई भी सुधार सैद्धांतिक रूप से अन्य रूपांतरण के लिए {{harv|डुहामेल|वेटरली|1990}} द्वारा तत्काल लाभ प्राप्त करेगा। | ||
जबकि डीसीटी एल्गोरिदम जो अनमॉडिफाइड एफएफटी को नियोजित करते हैं, अधिकांशतः सबसे अच्छे विशिष्ट डीसीटी एल्गोरिदम की तुलना में कुछ सैद्धांतिक ओवरहेड होते हैं, पूर्व में अलग लाभ भी होता है: अत्यधिक अनुकूलित एफएफटी कार्यक्रम व्यापक रूप से उपलब्ध हैं।इस प्रकार, व्यवहार में, सामान्य लंबाई के लिए उच्च प्रदर्शन प्राप्त करना अधिकांशतः | जबकि डीसीटी एल्गोरिदम जो अनमॉडिफाइड एफएफटी को नियोजित करते हैं, अधिकांशतः सबसे अच्छे विशिष्ट डीसीटी एल्गोरिदम की तुलना में कुछ सैद्धांतिक ओवरहेड होते हैं, पूर्व में अलग लाभ भी होता है: अत्यधिक अनुकूलित एफएफटी कार्यक्रम व्यापक रूप से उपलब्ध हैं।इस प्रकार, व्यवहार में, सामान्य लंबाई के लिए उच्च प्रदर्शन प्राप्त करना अधिकांशतः साधारण होता है, इस प्रकार {{mvar|N}} एफएफटी-आधारित एल्गोरिदम के साथ किया जाता हैं।{{efn| | ||
Algorithmic performance on modern hardware is typically not principally determined by simple arithmetic counts, and optimization requires substantial engineering effort to make best use, within its intrinsic limits, of available built-in hardware optimization. | Algorithmic performance on modern hardware is typically not principally determined by simple arithmetic counts, and optimization requires substantial engineering effort to make best use, within its intrinsic limits, of available built-in hardware optimization. | ||
}} | }} | ||
दूसरी ओर, विशिष्ट डीसीटी एल्गोरिदम, छोटे, निश्चित आकारों के रूप में परिवर्तन के लिए व्यापक उपयोग देखें जैसे {{nobr| 8 × 8 }} डीसीटी-II जेपीईजी कंप्रेस्ड में उपयोग किया जाता है, या छोटे डीसीटी (या Mडीसीटी) सामान्यतः ऑडियो कंप्रेस्ड में उपयोग किए जाते हैं।(कम कोड आकार भी एम्बेडेड-डिवाइस अनुप्रयोगों के लिए विशेष डीसीटी का उपयोग करने का कारण हो सकता है।) | दूसरी ओर, विशिष्ट डीसीटी एल्गोरिदम, छोटे, निश्चित आकारों के रूप में परिवर्तन के लिए व्यापक उपयोग देखें जैसे {{nobr| 8 × 8 }} डीसीटी-II जेपीईजी कंप्रेस्ड में उपयोग किया जाता है, या छोटे डीसीटी (या Mडीसीटी) सामान्यतः ऑडियो कंप्रेस्ड में उपयोग किए जाते हैं।(कम कोड आकार भी एम्बेडेड-डिवाइस अनुप्रयोगों के लिए विशेष डीसीटी का उपयोग करने का कारण हो सकता है।) | ||
वास्तव में, यहां तक कि साधारण एफएफटी का उपयोग करने वाले डीसीटी एल्गोरिदम कभी-कभी वास्तविक-सममितीय डेटा के बड़े एफएफटी से निरर्थक संचालन को छंटने के बराबर होते हैं, और वे अंकगणित गणना के दृष्टिकोण से भी इष्टतम हो सकते | वास्तव में, यहां तक कि साधारण एफएफटी का उपयोग करने वाले डीसीटी एल्गोरिदम कभी-कभी वास्तविक-सममितीय डेटा के बड़े एफएफटी से निरर्थक संचालन को छंटने के बराबर होते हैं, और वे अंकगणित गणना के दृष्टिकोण से भी इष्टतम हो सकते हैं। उदाहरण के लिए, टाइप- II डीसीटी आकार के डीएफटी के बराबर है <math>~ 4N ~</math> रियल-ईवन समरूपता के साथ, जिनके समरूप तत्व शून्य हैं।एफएफटी के माध्यम से इसकी गणना करने के लिए सबसे आम तरीकों में से (जैसे कि [[ FFTPACK |एफएफटीपैक]] और [[ FFTW |एफएफटीडब्ल्यू]] में उपयोग की जाने वाली विधि) का वर्णन किया गया था {{harvtxt|नरसिमहा|पीटरसन|1978}} तथा {{harvtxt|मखौल|1980}}, और इस विधि को हेंडसाइट में रेडिक्स -4 डिसीमेशन-इन-टाइम कोइली-टुकी एल्गोरिथ्म के चरण के रूप में देखा जा सकता है, जो डीसीटी-II के अनुरूप तार्किक रियल-ईवन डीएफटी पर लागू होता है।{{efn| | ||
The radix-4 step reduces the size <math>~ 4N ~</math> DFT to four size <math>~ N ~</math> DFTs of real data, two of which are zero, and two of which are equal to one another by the even symmetry. Hence giving a single size <math>~ N ~</math> FFT of real data plus <math>~ \mathcal{O}(N) ~</math> [[butterfly (FFT algorithm)|butterflies]], once the trivial and / or duplicate parts are eliminated and / or merged. | The radix-4 step reduces the size <math>~ 4N ~</math> DFT to four size <math>~ N ~</math> DFTs of real data, two of which are zero, and two of which are equal to one another by the even symmetry. Hence giving a single size <math>~ N ~</math> FFT of real data plus <math>~ \mathcal{O}(N) ~</math> [[butterfly (FFT algorithm)|butterflies]], once the trivial and / or duplicate parts are eliminated and / or merged. | ||
}} | }} | ||
क्योंकि सम-इंडेक्स किए गए तत्व शून्य हैं, यह | |||
क्योंकि सम-इंडेक्स किए गए तत्व शून्य हैं, यह रैडिक्स-4 स्टेप बिल्कुल स्प्लिट-रेडिक्स स्टेप के समान है। इस प्रकार यदि बाद का आकार <math>~ N ~</math> रियल-डेटा एफएफटी रियल-डेटा स्प्लिट-रेडिक्स एफएफटी एल्गोरिथ्म द्वारा भी किया जाता है। स्प्लिट-रेडिक्स एल्गोरिथ्म (के रूप में {{harvtxt|सोरेनसेन|जोन्स|हेइडमैन|बुर्रस|1987}}), तब परिणामी एल्गोरिथ्म वास्तव में मेल खाता है जो पावर-ऑफ-टू डीसीटी-II के लिए सबसे कम प्रकाशित अंकगणित गिनती थी (<math>~ 2 N \log_2 N - N + 2 ~</math> वास्तविक-शिथिल संचालन{{efn| | |||
The precise count of real arithmetic operations, and in particular the count of real multiplications, depends somewhat on the scaling of the transform definition. The <math>~ 2 N \log_2 N - N + 2 ~</math> count is for the DCT-II definition shown here; two multiplications can be saved if the transform is scaled by an overall <math>\sqrt2</math> factor. Additional multiplications can be saved if one permits the outputs of the transform to be rescaled individually, as was shown by {{harvtxt|Arai|Agui|Nakajima|1988}} for the size-8 case used in JPEG. | The precise count of real arithmetic operations, and in particular the count of real multiplications, depends somewhat on the scaling of the transform definition. The <math>~ 2 N \log_2 N - N + 2 ~</math> count is for the DCT-II definition shown here; two multiplications can be saved if the transform is scaled by an overall <math>\sqrt2</math> factor. Additional multiplications can be saved if one permits the outputs of the transform to be rescaled individually, as was shown by {{harvtxt|Arai|Agui|Nakajima|1988}} for the size-8 case used in JPEG. | ||
}}) | }}) हैं। | ||
ऑपरेशन की गिनती में हाल ही में कमी <math>~ \tfrac{17}{9} N \log_2 N + \mathcal{O}(N)</math> इसके | ऑपरेशन की गिनती में हाल ही में कमी <math>~ \tfrac{17}{9} N \log_2 N + \mathcal{O}(N)</math> इसके अतिरिक्त वास्तविक-डेटा एफएफटी का उपयोग करता है।<ref>{{cite journal |doi=10.1016/j.sigpro.2008.01.004 |title=Type-II/III DCT/DST algorithms with reduced number of arithmetic operations |journal=Signal Processing |volume=88 |issue=6 |pages=1553–1564 |year=2008 |last1=Shao |first1=Xuancheng |last2=Johnson |first2=Steven G. |arxiv=cs/0703150 |s2cid=986733}}</ref> इसलिए, अंकगणितीय दृष्टिकोण से एफएफटी के माध्यम से डीसीटी की गणना करने के बारे में आंतरिक रूप से बुरा कुछ भी नहीं है - यह कभी -कभी केवल सवाल है कि क्या संबंधित एफएफटी एल्गोरिथ्म इष्टतम है।(एक व्यावहारिक मामले के रूप में, अलग एफएफटी दिनचर्या को लागू करने में फ़ंक्शन-कॉल ओवरहेड छोटे के लिए महत्वपूर्ण हो सकता है, इस प्रकार<math>~ N ~,</math>के लिए यह एल्गोरिथम प्रश्न के अतिरिक्त कार्यान्वयन है, क्योंकि इसे अनियंत्रित या इनलाइनिंग द्वारा हल किया जा सकता है।) | ||
== Iडीसीटी का उदाहरण == | == Iडीसीटी का उदाहरण == | ||
Line 506: | Line 510: | ||
प्रत्येक आधार फ़ंक्शन को इसके गुणांक से गुणा किया जाता है और फिर इस उत्पाद को अंतिम इमेज में जोड़ा जाता है। | प्रत्येक आधार फ़ंक्शन को इसके गुणांक से गुणा किया जाता है और फिर इस उत्पाद को अंतिम इमेज में जोड़ा जाता है। | ||
[[File:idct-animation.gif|frame|center|बाईं ओर अंतिम इमेज | [[File:idct-animation.gif|frame|center|बाईं ओर अंतिम इमेज है। बीच में भारित फ़ंक्शन (एक गुणांक द्वारा गुणा किया गया) है, जिसे अंतिम इमेज में जोड़ा जाता है। दाईं ओर वर्तमान फ़ंक्शन और इसी गुणांक है। कारक 10 × द्वारा इमेजेस को स्केल किया जाता है (बिलिनियर इंटरपोलेशन का उपयोग करके)।]] | ||
== यह भी देखें == | == यह भी देखें == | ||
* असतत तरंग | * असतत तरंग परिवर्तन | ||
* असतत | * असतत कोसाइन रूपांतरण या जेपीईजी{{hyphen}}अलगकोसाइनपरिवर्तन{{hyphen}}डीसीटी परिवर्तन के उदाहरण को समझने के लिए संभावित रूप से आसान है | ||
* फूरियर-संबंधित रूपांतरों की | * फूरियर-संबंधित रूपांतरों की सूची। | ||
* संशोधित असतत | * संशोधित असतत कोसाइन रूपांतरण | ||
==टिप्पणियाँ== | ==टिप्पणियाँ== | ||
Line 550: | Line 554: | ||
* Syed Ali Khayam: [https://web.archive.org/web/20150711105353/http://wisnet.seecs.nust.edu.pk/publications/tech_reports/DCT_TR802.pdf The Discrete Cosine Transform (डीसीटी): Theory and Application] | * Syed Ali Khayam: [https://web.archive.org/web/20150711105353/http://wisnet.seecs.nust.edu.pk/publications/tech_reports/DCT_TR802.pdf The Discrete Cosine Transform (डीसीटी): Theory and Application] | ||
* [http://www.reznik.org/software.html#IDCT Implementation of एमपीईजी integer approximation of 8x8 Iडीसीटी (ISO/IEC 23002-2)] | * [http://www.reznik.org/software.html#IDCT Implementation of एमपीईजी integer approximation of 8x8 Iडीसीटी (ISO/IEC 23002-2)] | ||
* Matteo Frigo and [[Steven G. Johnson]]: '' | * Matteo Frigo and [[Steven G. Johnson]]: ''एफएफटीW'', [http://www.fftw.org/ http://www.एफएफटीw.org/]. A free ([[GNU General Public License|GPL]]) C library that can compute fast डीसीटी (types I-IV) in one or more dimensions, of arbitrary size. | ||
* Takuya Ooura: General Purpose | * Takuya Ooura: General Purpose एफएफटी Package, [http://www.kurims.kyoto-u.ac.jp/~ooura/fft.html http://www.kurims.kyoto-u.ac.jp/~ooura/एफएफटी.html]. Free C & FORTRAN libraries for computing fast डीसीटी (types II–III) in one, two or three dimensions, power of 2 sizes. | ||
* Tim Kientzle: Fast algorithms for computing the 8-point डीसीटी and Iडीसीटी, http://drdobbs.com/parallel/184410889. | * Tim Kientzle: Fast algorithms for computing the 8-point डीसीटी and Iडीसीटी, http://drdobbs.com/parallel/184410889. | ||
* [http://ltfat.sourceforge.net/ LTFAT] is a free Matlab/Octave toolbox with interfaces to the | * [http://ltfat.sourceforge.net/ LTFAT] is a free Matlab/Octave toolbox with interfaces to the एफएफटीW implementation of the डीसीटी and डीएसटीएस of type I-IV. | ||
{{DEFAULTSORT:Discrete Cosine Transform}}[[Category: डिजिटल सिग्नल प्रोसेसिंग]] | {{DEFAULTSORT:Discrete Cosine Transform}}[[Category: डिजिटल सिग्नल प्रोसेसिंग]] | ||
Line 569: | Line 573: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created with V14 On 09/09/2022]] | [[Category:Created with V14 On 09/09/2022]] | ||
[[Category:Vigyan Ready]] |
Latest revision as of 07:21, 13 October 2023
असतत कोसाइन परिवर्तन (डीसीटी) अलग-अलग आवृत्ति पर दोलन करने वाले कोसाइन फ़ंक्शंस के योग के संदर्भ में डेटा बिंदुओं का परिमित अनुक्रम व्यक्त करता है। 1972 में नासिर अहमद (इंजीनियर) द्वारा प्रस्तावित डीसीटी, सिग्नल प्रोसेसिंग और डेटा कंप्रेस्ड में व्यापक रूप से उपयोग की जाने वाली परिवर्तन तकनीक है। इसका उपयोग अधिकांश डिजीटल मीडिया में किया जाता है, जिसमें डिजिटल इसेज (जैसे जेपीईजी और एचईआईएफ , जहां छोटे उच्च-आवृत्ति वाले घटकों को छोड़ दिया जा सकता है), अंकीय वीडियो (जैसे एमपीईजी और एच.26एक्स), डिजिटल ऑडियो (जैसे डॉल्बी डिजिटल , एमपी 3 और उन्नत ऑडियो कोडिंग ), अंकीय टेलीविजन (जैसे कि एसडीटीवी, एचडीटीवी और वीडियो ऑन डिमांड), डिजिटल रेडियो (जैसे एएसी+ और डीएबी+), और स्पीच कोडिंग (जैसे एएसी-एलडी , सायरन (कोडेक) और ओपस (ऑडियो प्रारूप) या डीसीटी विज्ञान और अभियांत्रिकी में कई अन्य अनुप्रयोगों के लिए भी महत्वपूर्ण हैं, जैसे कि अंकीय संकेत प्रक्रिया , दूरसंचार उपकरण, नेटवर्क बैंडविड्थ उपयोग को कम करना, और आंशिक अंतर समीकरणों के संख्यात्मक समाधान के लिए वर्णक्रमीय विधि हैं।
साइन फ़ंक्शंस के अतिरिक्त कोसाइन का उपयोग कंप्रेस्ड के लिए महत्वपूर्ण है, क्योंकि यह निकलता है (जैसा कि नीचे वर्णित है) कि कम कोसाइन फ़ंक्शंस को विशिष्ट सिग्नल (विद्युत अभियांत्रिकी) को अनुमानित करने की आवश्यकता होती है, जबकि अंतर समीकरणों के लिए कोसाइन्स सीमा की विशेष पसंद व्यक्त करते हैं। विशेष रूप से, डीसीटी फूरियर-संबंधित रूपांतरण की सूची है। इस प्रकार फूरियर-संबंधित परिवर्तन असतत फूरियर रूपांतरण (डीएफटी) के समान है, किन्तु केवल वास्तविक संख्याओं का उपयोग कर रहा है। डीसीटी सामान्यतः समय-समय पर और सममित रूप से विस्तारित अनुक्रम के फूरियर श्रृंखला गुणांक से संबंधित होते हैं, जबकि जीएफटी केवल समय -समय पर विस्तारित अनुक्रमों के फूरियर श्रृंखला गुणांक से संबंधित हैं। डीसीटी लगभग दो बार की लंबाई के डीएफटी के समान हैं, यहां तक कि विषम और विषम कार्यों के साथ वास्तविक डेटा पर कार्य करना समरूपता रहती हैं। चूंकि वास्तविक और यहां तक कि फ़ंक्शन का फूरियर रूपांतरण वास्तविक हैं। जबकि कुछ वेरिएंट में इनपुट और/या आउटपुट डेटा हैं। इस प्रकार आधे नमूनों द्वारा इसे स्थानांतरित किया जाता हैं। इस प्रकार आठ मानकों के आधार पर डीसीटी वेरिएंट हैं, जिनमें से चार साधारण हैं।
असतत कोसाइन परिवर्तन का सबसे साधारण संस्करण टाइप- II डीसीटी है, जिसे अधिकांशतः केवल डीसीटी कहा जाता है। यह मूल डीसीटी था जैसा कि पहले अहमद द्वारा प्रस्तावित किया गया था। इसका व्युत्क्रम, टाइप- III डीसीटी, समान रूप से अधिकांशतः व्युत्क्रम डीसीटी या आईडीसीटी कहा जाता है। दो संबंधित रूपांतरण असतत साइन परिवर्तन (डीएसटी) हैं, जो वास्तविक और विषम कार्यों के डीएफटी के बराबर है, और संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी), जो 'ओवरलैपिंग' 'के डीसीटी पर आधारित है। इस प्रकार बहुआयामी डीसीटी (एमडी डीसीटी) को डीसीटी की अवधारणा को एमडी संकेतों तक बढ़ाने के लिए विकसित किया जाता है। एमडी डीसीटी की गणना करने के लिए कई एल्गोरिदम हैं। डीसीटी को लागू करने की कम्प्यूटेशनल जटिलता को कम करने के लिए विभिन्न प्रकार के तेज एल्गोरिदम विकसित किए गए हैं। इनमें से पूर्णांक डीसीटी है,[1] इस प्रकार (इंटडीसीटी), मानक डीसीटी का पूर्णांक सन्निकटन,[2]: ix, xiii, 1, 141–304 कई आईएसओ/आईईसी और आईटीयू-टी अंतर्राष्ट्रीय मानकों में उपयोग किया जाता है।[1][2]
डीसीटी कंप्रेस्ड, जिसे ब्लॉक कंप्रेस्ड के रूप में भी जाना जाता है, इसके आधार पर असतत डीसीटी ब्लॉकों के सेट में डेटा को संपीड़ित करता है।[3] डीसीटी ब्लॉक में कई आकार हो सकते हैं, जिसमें मानक डीसीटी के लिए 8x8 पिक्सेल सम्मिलित हैं, और 4x4 और 32x32 पिक्सेल के बीच विभिन्न पूर्णांक डीसीटी आकार के समान हैं।[1][4] इस प्रकार डीसीटी में मजबूत ऊर्जा संघनन संपत्ति है,[5][6] उच्च डेटा कंप्रेस्ड अनुपात में उच्च गुणवत्ता प्राप्त करने में सक्षम हैं।[7][8] चूंकि, ब्लॉकी कंप्रेस्ड कलाकृतियां तब दिखाई दे सकती हैं जब भारी डीसीटी कंप्रेस्ड लागू किया जाता है।
इतिहास
असतत कोसाइन परिवर्तन (डीसीटी) को पहली बार एन अहमद द्वारा कल्पना की गई थी, जबकि कैनसस स्टेट यूनिवर्सिटी में कार्य करते हुए, और उन्होंने 1972 में राष्ट्रीय विज्ञान फाउंडेशन को अवधारणा का प्रस्ताव दिया था। उन्होंने मूल रूप से इमेज कंप्रेस्ड के लिए डीसीटी का प्रस्ताव किया था।[9][1]अहमद ने 1973 में अर्लिंग्टन में टेक्सास विश्वविद्यालय में अपने पीएचडी छात्र टी राज नटराजन और मित्र के आर राव के साथ व्यावहारिक डीसीटी एल्गोरिथ्म विकसित किया था, और उन्होंने पाया कि यह इमेज कंप्रेस्ड के लिए सबसे कुशल एल्गोरिथ्म था।[9] उन्होंने जनवरी 1974 के पेपर में अपने परिणाम प्रस्तुत किए थे, जिसका शीर्षक असतत कोसाइन परिवर्तन था।[5][6][10] यह वर्णित है कि अब टाइप- II डीसीटी (डीसीटी-II) कहा जाता है,[2]: 51 इसके साथ ही टाइप- III व्युत्क्रम डीसीटी (Iडीसीटी) इसके उदाहरण हैं।[5] यह बेंचमार्क प्रकाशन था,[11][12] और इसके प्रकाशन के बाद से हजारों कार्यों में मौलिक विकास के रूप में उद्धृत किया गया है।[13] डीसीटी के विकास के लिए मौलिक शोध कार्य और घटनाओं को अहमद द्वारा बाद के प्रकाशन में संक्षेप में प्रस्तुत किया गया था, मैं असतत कोसाइन परिवर्तन के साथ कैसे आया था।[9]
1974 में इसके प्रारंभ के बाद से, डीसीटी पर महत्वपूर्ण शोध हुआ है।[10] 1977 में, वेन-हसुंग चेन ने सी हैरिसन स्मिथ और स्टेनली सी फ्रालिक के साथ पेपर प्रकाशित किया था, जिसमें फास्ट डीसीटी एल्गोरिथ्म प्रस्तुत किया गया था।[14][10] आगे के घटनाक्रम में एम.जे. नरसिम्हा और ए.एम. द्वारा 1978 का पेपर सम्मिलित है। पीटरसन, और 1984 का पेपर बी.जी.ली[10] इन शोध पत्रों, मूल 1974 अहमद पेपर और 1977 चेन पेपर के साथ, संयुक्त फोटोग्राफिक विशेषज्ञों के समूह द्वारा 1992 में जेपीईजी के हानि इमेज कंप्रेस्ड एल्गोरिथ्म के आधार के रूप में उद्धृत किया गया था।[10][15]
1975 में, जॉन ए रोज़े और गनर एस रॉबिन्सन ने अंतर-फ्रेम मोशन मुआवजे के लिए डीसीटी को अनुकूलित किया था। इस प्रकार मोशन-कॉम्पेन्सेटेड वीडियो कोडिंग के लिए उन्होंने डीसीटी और फास्ट फूरियर परिवर्तन (एफएफटी) के साथ प्रयोग किया था, इस प्रकार दोनों के लिए इंटर-फ्रेम हाइब्रिड कोडर को विकसित किया था, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे अधिक कुशल है, जो प्रति पिक्सेल प्रति पिक्सेल के लिए इमेज डेटा को संपीड़ित करने में सक्षम हैइंट्रा-फ्रेम कोडर की तुलना में इमेज गुणवत्ता के साथ वीडियोटेलेफोन दृश्य के लिए प्रति पिक्सेल 2- काटा की आवश्यकता होती है।[16][17] 1979 में, अनिल के जैन (विद्युत इंजीनियर, जन्म 1946) या अनिल के जैन और जसवंत आर जैन ने मोशन-कॉम्पेन्सेटेड डीसीटी वीडियो कंप्रेस्ड को और विकसित किया था,[18][19] जिसे ब्लॉक मोशन क्षतिपूर्ति भी कहा जाता है।[19] इसने चेन को व्यावहारिक वीडियो कंप्रेस्ड एल्गोरिथ्म विकसित करने के लिए प्रेरित किया था, जिसे 1981 में मोशन-काउंसिलेटेड डीसीटी या एडेप्टिव सीन कोडिंग कहा जाता था।[19] मोशन-क्षतिपूर्ति डीसीटी बाद में 1980 के दशक के उत्तरार्ध से वीडियो कंप्रेस्ड के लिए मानक कोडिंग तकनीक बन गया था।[20][21] पूर्णांक डीसीटी का उपयोग उन्नत वीडियो कोडिंग (एवीसी) में किया जाता है,[22][1] इसे 2003 में प्रस्तुत किया गया था, और उच्च दक्षता वीडियो कोडिंग (एचईवीसी),[4][1] 2013 में प्रस्तुत किया गया था। इस प्रकार किसी पूर्णांक डीसीटी का उपयोग उच्च दक्षता इमेज प्रारूप (एचईआईएफ) में भी किया जाता है, जो अभी भी इमेजेस को कोडिंग के लिए एचईवीसी वीडियो कोडिंग प्रारूप के सबसेट का उपयोग करता है।[4]
डीसीटी संस्करण, संशोधित असतत कोसाइन परिवर्तन (एमडीसीटी), जॉन पी प्रिंसेन, ए.डब्ल्यू द्वारा विकसित किया गया था। इस प्रकार 1987 में सरे विश्वविद्यालय में जॉनसन और एलन बी ब्रैडली,[23] 1986 में प्रिंसन और ब्रैडली द्वारा पहले के कार्य के बाद किया गया था।[24] एमडीसीटी का उपयोग अधिकांश आधुनिक ऑडियो कंप्रेस्ड (डेटा) प्रारूपों में किया जाता है, जैसे कि डॉल्बी डिजिटल (एसी -3),[25][26]एमपी 3 (जो हाइब्रिड डीसीटी-फास्ट फूरियर परिवर्तन एल्गोरिथ्म का उपयोग करता है),[27] उन्नत ऑडियो कोडिंग (एएसी),[28] और वोरबिस (ओजीजी) इत्यादि।[29]
असतत साइन परिवर्तन (डीएसटी) डीसीटी से प्राप्त किया गया था, डिरिचलेट स्थिति के साथ x = 0 पर न्यूमैन सीमा स्थिति को परिवर्तित किया गया हैं।[2]: 35-36 डीएसटी का वर्णन 1974 के डीसीटी पेपर में अहमद, नटराजन और राव द्वारा किया गया था।[5] टाइप-आई डीएसटी (डीएसटी-आई) को बाद में अनिल के जैन (विद्युत इंजीनियर, जन्म 1946) द्वारा वर्णित किया गया था। 1976 में अनिल के जैन, और टाइप- II डीएसटी (डीएसटी- II) को तब एच.बी.केकरा और जे.के.1978 में सोलंका द्वारा किया गया था।[30]
नासिर अहमद ने 1995 में न्यू मैक्सिको विश्वविद्यालय में गिरिधर मंडम और नीरज मैगोट्रा के साथ दोषरहित डीसीटी एल्गोरिथ्म भी विकसित किया। यह डीसीटी तकनीक को इमेजेस के दोषरहित कंप्रेस्ड के लिए उपयोग करने की अनुमति देता है। यह मूल डीसीटी एल्गोरिथ्म का संशोधन है, और इसमें व्युत्क्रम डीसीटी और डेल्टा मॉड्यूलेशन के तत्व सम्मिलित हैं। यह एन्ट्रॉपी कोडन की तुलना में अधिक प्रभावी दोषरहित कंप्रेस्ड एल्गोरिथ्म है।[31] दोषरहित डीसीटी को एलडीसीटी के रूप में भी जाना जाता है।[32]
अनुप्रयोग
डीसीटी सिग्नल प्रोसेसिंग में सबसे व्यापक रूप से उपयोग की जाने वाली परिवर्तन तकनीक है,[33] और अब तक डेटा कंप्रेस्ड में सबसे व्यापक रूप से उपयोग किया जाने वाला रैखिक रूपांतरण हैं।[34] इस प्रकार असम्पीडित डिजिटल मीडिया के साथ -साथ दोषरहित कंप्रेस्ड में अव्यावहारिक रूप से उच्च मेमोरी और बैंडविड्थ (कम्प्यूटिंग) आवश्यकताएं थीं, जो इस प्रकार अत्यधिक कुशल डीसीटी हानि कंप्रेस्ड तकनीक द्वारा अधिक कम हो गई थी,[7][8] इस प्रकार इसे 8: 1 से 14: 1 तक डेटा कंप्रेस्ड अनुपात प्राप्त करने में सक्षम,-स्टूडियो-गुणवत्ता के लिए,[7] स्वीकार्य-गुणवत्ता वाली सामग्री के लिए 100: 1 तक उपयोग किया जाता हैं।[8] डिजिटल मीडिया प्रौद्योगिकियों, जैसे डिजिटल इमेजेस, डिजिटल फोटो , में डीसीटी कंप्रेस्ड मानकों का उपयोग किया जाता है[35][36] डिजिटल वीडियो,[20][37] स्ट्रीमिंग मीडिया,[38] डिजिटल टेलीविजन, स्ट्रीमिंग टेलीविजन, वीडियो-ऑन-डिमांड (वीओडी),[8]अंकीय सिनेमा ,[25] उच्च-परिभाषा वीडियो (एचडी वीडियो), और उच्च-परिभाषा टेलीविजन (एचडीटीवी) इसके उदाहरण हैं।[7][39]
डीसीटी, और विशेष रूप से डीसीटी-II, अधिकांशतः सिग्नल और इमेज प्रोसेसिंग में उपयोग किया जाता है, विशेष रूप से हानिपूर्ण कंप्रेस्ड के लिए, क्योंकि इसमें मजबूत ऊर्जा संघनन संपत्ति होती है:[5][6] विशिष्ट अनुप्रयोगों में, अधिकांश सिग्नल जानकारी डीसीटी के कुछ कम-आवृत्ति घटकों में केंद्रित होती है। इसी दृढ़ता से सहसंबद्ध मार्कोव प्रक्रियाओं के लिए, डीसीटी करहुनेन-लोवे परिवर्तन (जो कि डिकोरलेशन सेंस में इष्टतम है) की संघनन दक्षता से संपर्क कर सकता है। जैसा कि नीचे बताया गया है, यह इस प्रकार कोसाइन कार्यों में निहित सीमा स्थितियों से उत्पन्न हुआ है।
डीसीटी को स्पेक्ट्रल विधियों द्वारा आंशिक अंतर समीकरणों को हल करने में व्यापक रूप से नियोजित किया जाता है, जहां डीसीटी के विभिन्न वेरिएंट सरणी के दो छोरों पर थोड़ा अलग/विषम सीमा स्थितियों के अनुरूप होते हैं।
डीसीटी चेबीशेव बहुपद से भी निकटता से संबंधित हैं, और फास्ट डीसीटी एल्गोरिदम (नीचे) का उपयोग चेबीशेव बहुपद की श्रृंखला द्वारा इस प्रकार के कार्यों के चेबीशेव सन्निकटन में किया जाता है, उदाहरण के लिए क्लेंशॉ-कर्टिस क्वाडरेचर में इसका उपयोग किया जाता हैं।
डीसीटी मल्टीमीडिया दूरसंचार उपकरणों के लिए कोडिंग मानक है। यह व्यापक रूप से बिट दर में कमी के लिए उपयोग किया जाता है, और नेटवर्क बैंडविड्थ उपयोग को कम करने के लिए किया जाता हैं।[1] डीसीटी कंप्रेस्ड डिजिटल संकेतों के लिए आवश्यक मेमोरी और बैंडविड्थ की मात्रा को अधिक कम कर देती है।[8]
सामान्य अनुप्रयोग
डीसीटी का व्यापक रूप से कई अनुप्रयोगों में उपयोग किया जाता है, जिसमें निम्नलिखित सम्मिलित हैं।
- ऑडियो सिग्नल प्रोसेसिंग - ऑडियो कोडिंग, ऑडियो डेटा संपीड़न (हानिपूर्ण और दोषरहित),[40] चारों ओर ध्वनि,[25] ध्वनिक प्रतिध्वनि और प्रतिक्रिया रद्दीकरण, ध्वनि मान्यता, समय-डोमेन अलियासिंग रद्दीकरण (टीडीएसी)[41]
- बायोमेट्रिक्स - फिंगरप्रिंट ओरिएंटेशन, चेहरे की पहचान प्रणाली, बायोमेट्रिक वॉटरमार्किंग, फिंगरप्रिंट-आधारित बायोमेट्रिक वॉटरमार्किंग, हथेली का प्रिंट पहचान/पहचान[41]
- कंप्यूटर और इंटरनेट - वर्ल्ड वाइड वेब, सोशल मीडिया,[35][36] इंटरनेट वीडियो[46]
- नेटवर्क बैंडविड्थ उपयोग में कमी[1]
- उपभोक्ता इलेक्ट्रॉनिक्स[41] — मल्टीमीडिया सिस्टम,[1] मल्टीमीडिया दूरसंचार उपकरण,[1] उपभोक्ता उपकरण[46]
- क्रिप्टोग्राफी - एन्क्रिप्शन, स्टेग्नोग्राफ़ी, कॉपीराइट सुरक्षा[41]
- डेटा संपीड़न - ट्रांसफॉर्म कोडिंग, हानिपूर्ण संपीड़न, दोषरहित संपीड़न[40]
- एन्कोडिंग ऑपरेशन - क्वांटिज़ेशन, अवधारणात्मक भार, एन्ट्रॉपी एन्कोडिंग, वेरिएबल एन्कोडिंग[1]
- डिजीटल मीडिया[38] — डिजिटल वितरण[47]
- जालसाज़ी का पता लगाना[41]
- भूभौतिकीय क्षणिक विद्युतचुंबकीय (क्षणिक ईएम)[41]
- इमेजएस - कलाकार पहचान,[41] फोकस और धुंधलापन मापें,[41] सुविधा निकालना[41]
- रंग फ़ॉर्मेटिंग - फ़ॉर्मेटिंग ल्यूमिनेंस और रंग अंतर, रंग प्रारूप (जैसे कि वाईयूवी444 और वाईयूवी411), डिकोडिंग ऑपरेशन जैसे व्युत्क्रम ऑपरेशन प्रदर्शन रंग प्रारूपों के बीच (वाईआईक्यू, वाईयूवी, आरजीबी)[1]
- डिजिटल इमेजिंग - डिजिटल इमेज, डिजिटल कैमरे, डिजिटल फोटोग्राफी,[35][36] उच्च-गतिशील-रेंज इमेजिंग (एचडीआर इमेजिंग)[48]
- इमेज संपीड़न[41][49] — इमेज फ़ाइल स्वरूप,[50] मल्टीव्यू इमेज संपीड़न, प्रगतिशील छवि ट्रांसमिशन[41]
- इमेज प्रोसेसिंग — डिजिटल इमेज प्रोसेसिंग,[1] इमेज विश्लेषण, सामग्री-आधारित इमेज पुनर्प्राप्ति, कोने का पता लगाना, दिशात्मक ब्लॉक-वार इमेज प्रतिनिधित्व, किनारे का पता लगाना, [[इमेज वृद्धि] ], इमेज संलयन, इमेज विभाजन, प्रक्षेप, इमेज ध्वनि स्तर का अनुमान, मिररिंग, रोटेशन, बस-ध्यान देने योग्य विरूपण (जेएनडी ) प्रोफ़ाइल, स्पैटियोटेम्पोरल मास्किंग प्रभाव, फ़ोवेटेड इमेजिंग[41]
- इमेज गुणवत्ता मूल्यांकन - डीसीटी-आधारित गुणवत्ता गिरावट मीट्रिक (डीसीटी क्यूएम)[41]
- छवि पुनर्निर्माण - दिशात्मक बनावट ऑटो निरीक्षण, इमेज बहाली, इनपेंटिंग, दृश्य पुनर्प्राप्ति[41]
- चिकित्सा प्रौद्योगिकी
- इलेक्ट्रोकार्डियोग्राफी (ईसीजी) - वेक्टरकार्डियोग्राफी (वीसीजी)[41]
- [चिकित्सा इमेजिंग]] - चिकित्सा इमेज संपीड़न, इमेज संलयन, वॉटरमार्किंग, ब्रेन ट्यूमर संपीड़न वर्गीकरण[41]
- पैटर्न मान्यता[41]
- रुचि का क्षेत्र (आरओआई) निष्कर्षण[41]
- सिग्नल प्रोसेसिंग - डिजिटल सिग्नल प्रोसेसिंग, डिजिटल सिग्नल प्रोसेसर (डीएसपी), डीएसपी सॉफ्टवेयर, मल्टीप्लेक्सिंग, सिग्नलिंग, नियंत्रण सिग्नल, [ [एनालॉग-टू-डिजिटल रूपांतरण]] (एडीसी),[1] संपीड़ित नमूनाकरण, डीसीटी पिरामिड त्रुटि छिपाना, डाउनसैंपलिंग, अपसैंपलिंग, सिग्नल-टू-व्यास अनुपात (एसएनआर) अनुमान, ट्रांसमक्स, वीनर फ़िल्टर[41]
- कॉम्प्लेक्स सेप्स्ट्रम सुविधा विश्लेषण[41]
- डीसीटी फ़िल्टरिंग[41]
- जाँच[41]
- वाहन संबंधी ब्लैक बॉक्स कैमरा[41]
- वीडियो
- डिजिटल सिनेमा[49] - डिजिटल सिनेमैटोग्राफी, डिजिटल मूवी कैमराएस, वीडियो संपादन, फिल्म संपादन,[51][52] डॉल्बी डिजिटल ऑडियो[1][25]
- डिजिटल टेलीविजन (डीटीवी)[7] — डिजिटल टेलीविजन प्रसारण,[49] मानक-परिभाषा टेलीविजन (एसडीटीवी), हाई-डेफिनिशन टीवी (एचडीटीवी),[7][39] एचडीटीवी एनकोडर/डिकोडर चिप्स, अल्ट्रा एचडीटीवी (यूएचडीटीवी)[1]
- डिजिटल वीडियो[20][37] — डिजिटल बहुमुखी डिस्क (डीवीडी),[49] हाई-डेफिनिशन (एचडी) वीडियो[7][39]
- वीडियो कोडिंग — वीडियो संपीड़न,[1] वीडियो कोडिंग मानक,[41] गति अनुमान, गति मुआवजा, अंतर-फ़्रेम भविष्यवाणी, गति वेक्टरएस,[1] 3डी वीडियो कोडिंग, स्थानीय विरूपण पहचान संभावना (एलडीडीपी) मॉडल, चलती वस्तु पहचान, मल्टीव्यू वीडियो कोडिंग (एमवीसी)[41]
- वीडियो प्रोसेसिंग - गति विश्लेषण, 3डी-डीसीटी गति विश्लेषण, वीडियो सामग्री विश्लेषण, डेटा निष्कर्षण,[41] वीडियो ब्राउज़िंग,[53] प्रोफेशनल वीडियो उत्पादन[54]
- वॉटरमार्कआईएनजी - डिजिटल वॉटरमार्किंग, इमेज वॉटरमार्किंग, वीडियो वॉटरमार्किंग, 3डी वीडियो वॉटरमार्किंग, रिवर्सिबल डेटा छिपाना, वॉटरमार्किंग का पता लगाना[41]
- [[बेतार तकनीक
- मोबाइल उपकरणों[46] — मोबाइल फोन, स्मार्टफोन,[45] वीडियोफ़ोन[1]
- रेडियो आवृत्ति (आरएफ) प्रौद्योगिकी - आरएफ इंजीनियरिंग, एपर्चर सरणी,[41] बीमफॉर्मिंग, डिजिटल अंकगणितीय सर्किटएस, दिशात्मक सेंसिंग, अंतरिक्ष इमेजिंग[55]
- वायरलेस सेंसर नेटवर्क (डब्लूएसएन) - वायरलेस ध्वनिक सेंसर नेटवर्क[41]
डीसीटी दृश्य मीडिया मानक
डीसीटी-II, जिसे केवल डीसीटी के रूप में भी जाना जाता है, सबसे महत्वपूर्ण इमेज कंप्रेस्ड विधि है। इसका उपयोग इमेज कंप्रेस्ड मानकों जैसे कि जेपीईजी, और वीडियो कंप्रेस्ड मानकों जैसे एच.26एक्स, एसजेपीईजी , एमपीईजी, डीवी , थेओरा और डाल्टा में किया जाता है। जहाँ, दो-आयामी डीसीटी-II ब्लॉक की गणना की जाती है, और परिणाम परिमाणीकरण (सिग्नल प्रोसेसिंग) और एन्ट्रॉपी एन्कोडिंग हैं। इस स्थिति में, सामान्यतः 8 है और डीसीटी-II फॉर्मूला ब्लॉक के प्रत्येक पंक्ति और कॉलम पर लागू होता है। इसके परिणाम में 8 × 8 ट्रांसफ़ॉर्मिक गुणांक सरणी है जिसमें तत्व (टॉप-लेफ्ट) डीसी (शून्य-आवृत्ति) घटक है और बढ़ते ऊर्ध्वाधर और क्षैतिज सूचकांक मूल्यों के साथ प्रविष्टियां उच्च ऊर्ध्वाधर और क्षैतिज स्थानिक आवृत्तियों का प्रतिनिधित्व करती हैं।
उन्नत वीडियो कोडिंग (एवीसी) पूर्णांक डीसीटी (इंटडीसीटी), डीसीटी का पूर्णांक सन्निकटन का उपयोग करता है।[22][1][2][1] यह 4x4 और 8x8 पूर्णांक डीसीटी ब्लॉक का उपयोग करता है। उच्च दक्षता वीडियो कोडिंग (एचईवीसी) और उच्च दक्षता इमेज प्रारूप (एचईआईएफ) 4x4 और 32x32 पिक्सेल के बीच विभिन्न पूर्णांक डीसीटी ब्लॉक आकार का उपयोग करते हैं।[4][1] एवीसी अब तक वीडियो सामग्री के रिकॉर्डिंग, कंप्रेस्ड और वितरण के लिए सबसे अधिक उपयोग किया जाने वाला प्रारूप है, जिसका उपयोग 91% वीडियो डेवलपर्स द्वारा किया जाता है, इसके बाद एचईवीसी का उपयोग 43% डेवलपर्स द्वारा किया जाता है।[47]
इमेज प्रारूप
इमेज संपीड़न मानक | वर्ष | सामान्य अनुप्रयोग |
---|---|---|
जेपीईजी[1] | 1992 | सबसे व्यापक रूप से उपयोग किया जाने वाला इमेज संपीड़न मानक[56][57] और डिजिटल इमेज प्रारूप,[50] |
जेपीईजी एक्सआर | 2009 | एक्सएमएल पेपर विशिष्टता खोलें |
वेबपी | 2010 | एक ग्राफिक प्रारूप जो डिजिटल इमेज के हानिपूर्ण संपीड़न का समर्थन करता है। जो गूगल द्वारा विकसित किया गया था। |
उच्च दक्षता इमेज प्रारूप (एचईईटी) | 2013 | एचवीसी संपीड़न पर आधारित इमेज फ़ाइल स्वरूप हैं। यह जापानईजी पर संपीड़न में सुधार करता है,[58] और एनिमेटेड GIF प्रारूप की तुलना में कहीं अधिक कुशल संपीड़न के साथ एनीमेशन का समर्थन करता है।[59] |
बीपीजी | 2014 | एचवीसी संपीड़न पर आधारित |
जेपीईजी एक्सएल[60] | 2020 | एक रॉयल्टी-मुक्त रास्टर-ग्राफिक्स फ़ाइल स्वरूप जो हानिपूर्ण और दोषरहित संपीड़न दोनों का समर्थन करता है। |
वीडियो प्रारूप
वीडियो कोडिंग मानक | वर्ष | सामान्य अनुप्रयोग |
---|---|---|
एच.261[61][62] | 1988 | वीडियो कोडिंग मानकों के परिवार में पहला। मुख्य रूप से पुराने वीडियो कॉन्फ्रेंसिंग और वीडियो टेलीफोन उत्पादों में उपयोग किया जाता है। |
मोशन जापानीजी (एमजेपीजी)[63] | 1992 | क्विकटाइम, वीडियो संपादन, नॉन-लीनियर संपादन, डिजिटल कैमरे |
एमपीईजी-1 वीडियो[64] | 1993 | सीडी या इंटरनेट वीडियो पर डिजिटल वीडियो वितरण |
एमपीईजी-2 वीडियो (एच.262)[64] | 1995 | प्रसारण अनुप्रयोगों, डिजिटल टेलीविजन, एचडीटीवी, केबल, उपग्रह, हाई-स्पीड इंटरनेट, डीवीडी वीडियो वितरण में डिजिटल इमेज का भंडारण और प्रबंधन |
डीवी | 1995 | कैमकोर्डर, डिजिटल कैसेट |
एच.263 (एमपीईजी-4 पार्ट 2)[61] | 1996 | सार्वजनिक स्विच्ड टेलीफोन नेटवर्क (पीएसटीएन), एच.320, इंटीग्रेटेड सर्विसेज डिजिटल नेटवर्क (आईएसडीएन) पर वीडियो टेलीफोनी[65][66] |
उन्नत वीडियो कोडिंग (एवीसी / एच.264 / एमपीईजी-4)[1][22] | 2003 | सबसे आम एचडी वीडियो रिकॉर्डिंग/संपीड़न/वितरण प्रारूप, इंटरनेट वीडियो, यूट्यूब, ब्लू-रे डिस्क, एचडीटीवी प्रसारण, वेब ब्राउज़र, स्ट्रीमिंग टेलीविजन, मोबाइल डिवाइस, उपभोक्ता डिवाइस, नेटफ्लिक्स,[46] वीडियो टेलीफोनी, फेसटाइम[45] |
थेओरा | 2004 | इंटरनेट वीडियो, वेब ब्राउज़र |
वीसी-1 | 2006 | विंडोज़ मीडिया, ब्लू-रे डिस्क |
एप्पल प्रोरेस | 2007 | व्यावसायिक वीडियो उत्पादन.[54] |
वेबएम वीडियो | 2010 | गूगल द्वारा विकसित एक मल्टीमीडिया ओपन सोर्स प्रारूप जिसका उपयोग एचटीएमएल5 के साथ किया जाना है। |
उच्च दक्षता वीडियो कोडिंग (एचवीसी / एच.265)[1][4] | 2013 | H.264/एमपीईजी-4 एवीसी मानक का उभरता हुआ उत्तराधिकारी, जिसमें संपीड़न क्षमता में काफी सुधार हुआ है। |
डाला | 2013 | Xiph.org द्वारा अनुसंधान वीडियो प्रारूप। |
एवी1[67] | 2018 | वीपी10 (वीपी9 का आंतरिक उत्तराधिकारी), डाला और थोर पर आधारित एक ओपेन सोर्स प्रारूप; यूट्यूब जैसे सामग्री प्रदाताओं द्वारा उपयोग किया जाता है[68][69] और नेटफ्लिक्स।[70][71] |
Mडीसीटी ऑडियो मानक
सामान्य ऑडियो
ऑडियो संपीड़न मानक | वर्ष | सामान्य अनुप्रयोग |
---|---|---|
डॉल्बी डिजिटल (एसी-3)[25][26] | 1991 | सिनेमा, डिजिटल सिनेमा, डीवीडी, ब्लू-रे, स्ट्रीमिंग मीडिया, वीडियो गेम |
अनुकूली रूपांतरण ध्वनिक कोडिंग (एटीआरएसी)।)[25] | 1992 | मिनी डिस्क |
एमपीईजी लेयर III (एमपी3)[27][1] | 1993 | डिजिटल ऑडियो वितरण, एमपी3 प्लेयर, पोर्टेबल मीडिया प्लेयर, स्ट्रीमिंग मीडिया |
अवधारणात्मक ऑडियो कोडर (पीएसी)[25] | 1996 | डिजिटल ऑडियो रेडियो सेवा (डार्स) |
उन्नत ऑडियो कोडिंग (एएसी/एमपी4 ऑडियो)[28][25] | 1997 | डिजिटल ऑडियो वितरण, पोर्टेबल मीडिया प्लेयर, स्ट्रीमिंग मीडिया, गेम कंसोल, मोबाइल डिवाइस, आईओएस, आईट्यून्स, एंड्रॉइड, ब्लैकबेरी |
उच्च दक्षता उन्नत ऑडियो कोडिंग (एएसी+)।)[72][42]: 478] | 1997 | डिजिटल रेडियो, डिजिटल ऑडियो प्रसारण (डीएबी+),[42] डिजिटल रेडियो मोंडियल (डीआरएम) |
कुक कोडेक | 1998 | रियलऑडियो |
विंडोज़ मीडिया ऑडियो (डब्ल्यूएमए)[25] | 1999 | विंडोज़ मीडिया |
वॉर्बिस[29][25] | 2000 | डिजिटल ऑडियो वितरण, रेडियो स्टेशन, स्ट्रीमिंग मीडिया, वीडियो गेम, Spotify, विकिपीडिया |
हाई-डेफिनिशन कोडिंग (एचडीसी))[43] | 2002 | डिजिटल रेडियो, एचडी रेडियो |
गतिशील संकल्प अनुकूलन (डीआरए)।)[25] | 2008 | चीन राष्ट्रीय ऑडियो मानक, चीन मल्टीमीडिया मोबाइल ब्रॉडकास्टिंग, डीवीबी-एच |
आपस[73] | 2012 | वोआईपी,[74] मोबाइल टेलीफोनी, व्हाट्सएप,[75][76][77] प्ले स्टेशन4[78] |
डॉल्बी ए.सी-4[79] | 2017 | एटीएससी 3.0, अल्ट्रा-हाई-डेफिनिशन टेलीविजन (यूएचडी टीवी) |
एमपीईजी-एच 3डी ऑडियो[80] |
स्पीच कोडिंग
स्पीच कोडिंग मानक | वर्ष | सामान्य अनुप्रयोग |
---|---|---|
एएसी-एलडी (एलडी-एमडीसीटी)[81] | 1999 | मोबाइल टेलीफोनी, वॉयस-ओवर-आईपी (वीओआईपी), आईओएस, फेसटाइम[45] |
साइरन[44] | 1999 | वीओआईपी, वाइडबैंड ऑडियो, जी.722.1 |
जी.722.1[82] | 1999 | वीओआईपी, वाइडबैंड ऑडियो, जी.722 |
जी.729.1[83] | 2006 | जी.729, वीओआईपी, वाइडबैंड ऑडियो,[83] मोबाइल टेलीफोनी |
ईवीआरसी-डब्ल्यूबी[42]: 31, 478] | 2007 | वाइडबैंड ऑडियो |
जी.718[84] | 2008 | वीओआईपी, वाइडबैंड ऑडियो, मोबाइल टेलीफोनी |
जी.719[42] | 2008 | टेलीकांफ्रेंसिंग, वीडियोकांफ्रेंसिंग, वॉयस मेल |
सेल्ट[85] | 2011 | वीओआईपी,[86][87] मोबाइल टेलीफोनी |
उन्नत ध्वनि सेवाएँ (ईवीएस)[88] | 2014 | मोबाइल टेलीफोनी, वीओआईपी, वाइडबैंड ऑडियो |
एमडी डीसीटी
बहुआयामी डीसीटी (एमडी डीसीटी) में कई अनुप्रयोग हैं, मुख्य रूप से 3-डी डीसीटी जैसे 3-डी डीसीटी-II, जिसमें कई नए एप्लिकेशन हैं जैसे हाइपरस्पेक्ट्रल इमेजिंग कोडिंग सिस्टम,[89] परिवर्तनीय अस्थायी लंबाई 3-डी डीसीटी कोडिंग,[90] वीडियो कोडिंग (डाक बाजार) एल्गोरिदम,[91] अनुकूली वीडियो कोडिंग [92] और 3-डी कंप्रेस्ड।[93] हार्डवेयर, सॉफ्टवेयर और कई फास्ट एल्गोरिदम के परिचय में वृद्धि के कारण, एम-डी डीसीटी का उपयोग करने की आवश्यकता तेजी से बढ़ रही है। डीसीटी-IV ने वास्तविक-मूल्य वाले पॉलीफेज़ फ़िल्टरिंग बैंकों के तेजी से कार्यान्वयन में अपने अनुप्रयोगों के लिए लोकप्रियता प्राप्त की है,[94] जो लैप्ड ऑर्थोगोनल परिवर्तन[95][96] और कोसाइन-मॉड्यूलेटेड वेवलेट बेस हैं।[97]
डिजिटल सिग्नल प्रोसेसिंग
डिजिटल सिग्नल प्रोसेसिंग में डीसीटी बहुत महत्वपूर्ण भूमिका निभाता है। डीसीटी का उपयोग करके, संकेतों को संपीड़ित किया जा सकता है। डीसीटी का उपयोग ईसीजी संकेतों के कंप्रेस्ड के लिए विद्युतहृद्लेख में किया जा सकता है। इसके आधार पर डीसीटी2 डीसीटी की तुलना में उत्तम कंप्रेस्ड अनुपात प्रदान करता है।
डीसीटी को व्यापक रूप से अंकीय सिग्नल प्रोसेसर (डीएसपी), साथ ही डिजिटल सिग्नल प्रोसेसिंग सॉफ्टवेयर में लागू किया जाता है।कई कंपनियों ने डीसीटी प्रौद्योगिकी के आधार पर डीएसपी विकसित किए हैं। डीसीटी व्यापक रूप से एन्कोडिंग , डिकोडिंग, वीडियो, ऑडियो, मल्टीप्लेक्सिंग, कंट्रोल सिग्नल, सिग्नलिंग और एनालॉग-टू-डिजिटल रूपांतरण जैसे अनुप्रयोगों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग सामान्यतः उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर एकीकृत सर्किट के लिए भी किया जाता है।[1]
कंप्रेस्ड कलाकृतियाँ
डिजिटल मीडिया में डीसीटी कंप्रेस्ड के साथ डीसीटी ब्लॉकों के कारण सामान्य विवादों के कारण ब्लॉकी कंप्रेस्ड कलाकृतियां हैं।[98] [3] जब भारी कंप्रेस्ड लागू किया जाता है तो डीसीटी एल्गोरिथ्म ब्लॉक-आधारित कलाकृतियों का कारण बन सकता है। इस प्रकार डिजिटल इमेज और वीडियो कोडिंग मानकों (जैसे कि जेपीईजी, H.26X और एमपीईजी प्रारूप) के बहुमत में डीसीटी का उपयोग किया जा रहा है, डीसीटी- आधारित ब्लॉकी कंप्रेस्ड कलाकृतियां डिजिटल मीडिया में व्यापक हैं। डीसीटी एल्गोरिथ्म में, इमेज (या इमेज अनुक्रम में फ्रेम) को वर्ग ब्लॉकों में विभाजित किया जाता है जो दूसरे से स्वतंत्र रूप से संसाधित होते हैं, फिर इन ब्लॉकों के डीसीटी को लिया जाता है, और परिणामस्वरूप डीसीटी गुणांक परिमाणीकरण (सिग्नल प्रोसेसिंग) होते हैं। यह प्रक्रिया मुख्य रूप से उच्च डेटा कंप्रेस्ड अनुपात में कलाकृतियों को अवरुद्ध करने का कारण बन सकती है।[98] यह मच्छर ध्वनि प्रभाव का कारण भी बन सकता है, सामान्यतः डिजिटल वीडियो (जैसे कि एमपीईजी प्रारूप) में पाया जाता है।[99]
डीसीटी ब्लॉक का उपयोग अधिकांशतः भूतल कला में किया जाता है।[3] कलाकार रोजा मेन्कमैन अपनी गड़बड़ कला में डीसीटी-आधारित कंप्रेस्ड कलाकृतियों का उपयोग करता है,[100] विशेष रूप से डीसीटी ब्लॉक अधिकांश डिजिटल मीडिया प्रारूपों में पाए गए जैसे कि जेपीईजी डिजिटल इमेज और एमपी 3 डिजिटल ऑडियो का उपयोग होता हैं।[3] इसका एक अन्य उदाहरण जर्मन फोटोग्राफर थॉमस रफ द्वारा जेपीईजी है, जो चित्र की शैली के आधार के रूप में जानबूझकर जेपीईजी कलाकृतियों का उपयोग करता है।[101][102]
अनौपचारिक अवलोकन
किसी भी फूरियर-संबंधित रूपांतरण की तरह, असतत कोसाइन परिवर्तन (डीसीटी) अलग-अलग आवृत्तियों और आयाम के साथ साइनसोइड्स के योग के संदर्भ में फ़ंक्शन या संकेत व्यक्त करता है।असतत फूरियर परिवर्तन (डीएफटी) की तरह, डीसीटी असतत डेटा बिंदुओं की परिमित संख्या में फ़ंक्शन पर संचालित होता है। किसी डीसीटी और डीएफटी के बीच स्पष्ट अंतर यह है कि पूर्व केवल कोसाइन कार्यों का उपयोग करता है, जबकि उत्तरार्द्ध दोनों कोसाइन और साइन ( जटिल घातांक के रूप में) दोनों का उपयोग करता है। चूंकि, यह दृश्य अंतर केवल गहरे अंतर का परिणाम है: डीसीटी का तात्पर्य डीएफटी या अन्य संबंधित परिवर्तनों से अलग -अलग सीमा स्थितियों से है।
फूरियर-संबंधित रूपांतरण जो किसी फ़ंक्शन के परिमित फ़ंक्शन का डोमेन पर कार्य करते हैं, जैसे कि डीएफटी या डीसीटी या फूरियर श्रृंखला, को डोमेन के बाहर उस फ़ंक्शन के विस्तार को स्पष्ट रूप से परिभाषित करने के रूप में सोचा जा सकता है। जो इस प्रकार हैं कि बार जब आप फ़ंक्शन लिखते हैं, इसके आधार पर साइनसोइड्स के योग के रूप में, आप उस राशि का मूल्यांकन को किसी भी पर कर सकते हैं, यहां तक के लिए जहां मूल निर्दिष्ट नहीं था। डीएफटी, फूरियर श्रृंखला की तरह, मूल फ़ंक्शन के आवधिक फ़ंक्शन विस्तार का अर्थ है।एक डीसीटी, जैसे साइन और कोसाइन परिवर्तित कर दिया जाता है, मूल फ़ंक्शन के सम और विषम कार्यों के विस्तार का अर्थ है।
चूंकि, क्योंकि डीसीटी परिमित, असतत अनुक्रमों पर कार्य करते हैं, दो मुद्दे उत्पन्न होते हैं जो निरंतर कोसाइन ट्रांसफ़ॉर्म के लिए लागू नहीं होते हैं। सबसे पहले, किसी को यह निर्दिष्ट करना होगा कि क्या फ़ंक्शन डोमेन के बाएं और दाएं दोनों सीमाओं पर भी या विषम है (अर्ताथ नीचे दी गई परिभाषाओं में मिन-एन और मैक्स-एन सीमाएं)। दूसरा, किसी को यह निर्दिष्ट करना होगा कि फ़ंक्शन किस बिंदु पर या विषम है। विशेष रूप से, चार समान रूप से स्पेस किए गए डेटा बिंदुओं के अनुक्रम एबीसीडी पर विचार करें, और कहते हैं कि हम बाईं सीमा भी निर्दिष्ट करते हैं। दो समझदार संभावनाएं हैं: या तो डेटा नमूना ए के बारे में भी हैं, जिस स्थिति में भी विस्तार डीसीबीएबीसीडी है, या डेटा A और पिछले बिंदु के बीच बिंदु आधे रास्ते के बारे में भी है, इस स्थिति में भी विस्तार डीसीबीएबीसीडी है, यहाँ पर ए को दोहराया जाता है।
ये विकल्प डीसीटी के सभी मानक विविधताओं को जन्म देते हैं और साइन परिवर्तन (डीएसटीएस) को भी असतत करते हैं।
प्रत्येक सीमा या तो भी या विषम हो सकती है (प्रति सीमा 2 विकल्प) और दो डेटा बिंदुओं (प्रति सीमा 2 विकल्प) के बीच डेटा बिंदु या बिंदु आधे रास्ते के बारे में सममित हो सकती है, कुल 2 × 2 × 2 × 2 = 16 के लिए। संभावनाएं। इन संभावनाओं में से आधे, वे जहां बाईं सीमा भी है, डीसीटी के 8 प्रकार के अनुरूप है; अन्य आधे 8 प्रकार के डीएसटी हैं।
ये विभिन्न सीमा स्थितियां परिवर्तन के अनुप्रयोगों को दृढ़ता से प्रभावित करती हैं, और विभिन्न डीसीटी प्रकारों के लिए विशिष्ट रूप से उपयोगी गुणों को ले जाती हैं। सबसे सीधे, जब वर्णक्रमीय तरीकों से आंशिक अंतर समीकरणों को हल करने के लिए फूरियर-संबंधित रूपांतरण का उपयोग करते हैं, तो सीमा की स्थिति को सीधे समस्या के भाग के रूप में निर्दिष्ट किया जाता है। संशोधित असतत कोसाइन परिवर्तन (टाइप-आईवी डीसीटी के आधार पर) के लिए, सीमा की स्थिति एमडीसीटी की महत्वपूर्ण संपत्ति में समय-डोमेन अलियासिंग रद्दीकरण की महत्वपूर्ण संपत्ति में सम्मिलित है। अधिक सूक्ष्म फैशन में, सीमा की स्थिति ऊर्जा कॉम्पैक्टिफिकेशन गुणों के लिए उत्तरदायी होते हैं, जो डीसीटी को इमेज और ऑडियो कंप्रेस्ड के लिए उपयोगी बनाते हैं, क्योंकि सीमाएं किसी भी फूरियर जैसी श्रृंखला के अभिसरण की दर को प्रभावित करती हैं।
विशेष रूप से, यह सर्वविदित है कि फ़ंक्शन में असंतोष का कोई भी वर्गीकरण फूरियर श्रृंखला के अभिसरण की दर को कम करता है, जिससे कि किसी दिए गए सटीकता के साथ फ़ंक्शन का प्रतिनिधित्व करने के लिए अधिक साइनसोइड की आवश्यकता हो। ही सिद्धांत सिग्नल कंप्रेस्ड के लिए डीएफटी और अन्य रूपांतरण की उपयोगिता को नियंत्रित करता है, यह एक फ़ंक्शन है, इसके डीएफटी या डीसीटी में कम शर्तों को इसका सटीक रूप से प्रतिनिधित्व करने की आवश्यकता होती है, और जितना अधिक इसे संकुचित किया जा सकता है। (यहां, हम डीएफटी या डीसीटी को फ़ंक्शन की फूरियर सीरीज़ या कोसाइन श्रृंखला के लिए क्रमशः अनुमान के रूप में सोचते हैं, जिससे कि इसकी चिकनाई के बारे में बात की जा सके।) चूंकि, डीएफटी की अंतर्निहित आवधिकता का अर्थ है कि डिसकंटिनिटी सामान्यतः सीमाओं पर होती हैं। सिग्नल के किसी भी यादृच्छिक खंड को बाएं और दाएं दोनों सीमाओं पर समान मूल्य होने की संभावना नहीं है। (डीएसटी के लिए समान समस्या उत्पन्न होती है, जिसमें विषम वाम सीमा की स्थिति किसी भी फ़ंक्शन के लिए असंतोष का अर्थ है जो उस सीमा पर शून्य नहीं होता है।) इसके विपरीत, डीसीटी जहां दोनों सीमाएं सदैव निरंतर विस्तार करती हैं। सीमाएं (चूंकि ढलान सामान्यतः असंतोष है)। यही कारण है कि डीसीटी, और विशेष रूप से I, II, V, और VI के प्रकारों के डीसीटी (जिन प्रकारों में दो भी सीमाएँ हैं) सामान्यतः जीएफटी और डीएसटीएस की तुलना में सिग्नल कंप्रेस्ड के लिए उत्तम प्रदर्शन करती हैं। व्यवहार में, टाइप- II डीसीटी सामान्यतः ऐसे अनुप्रयोगों के लिए पसंद किया जाता है, कम्प्यूटेशनल सुविधा के कारण हैं।
औपचारिक परिभाषा
औपचारिक रूप से, असतत कोसाइन परिवर्तन रैखिक , व्युत्क्रम फंक्शन (गणित) है (जहाँ पर वास्तविक संख्याओं के सेट को दर्शाता है), या बराबर रूप से उल्टा N × N स्क्वायर आव्यूह हैं। जो थोड़ी संशोधित परिभाषाओं के साथ डीसीटी के कई वेरिएंट हैं। इसके आधार पर N }} वास्तविक संख्या में परिवर्तित हो गए हैं, इसके आधार पर N वास्तविक संख्या सूत्रों में से के अनुसार:
डीसीटी-i
कुछ लेखक आगे गुणा करते हैं तथा द्वारा और इसी तरह से गुणा करें तथा द्वारा जो डीसीटी-I आव्यूह ऑर्थोगोनल आव्यूह बनाता है, यदि कोई आगे समग्र पैमाने के कारक से गुणा करता है किन्तु रियल-ईवन असतत फूरियर परिवर्तन के साथ प्रत्यक्ष पत्राचार को तोड़ता है।
डीसीटी-I बिल्कुल समान है (2 के समग्र पैमाने के कारक तक), असतत फूरियर रूपांतरण के लिए समरूपता के साथ वास्तविक संख्या भी हैं। उदाहरण के लिए, डीसीटी-i वास्तविक संख्या आठ वास्तविक संख्याओं के डीएफटी के बराबर है (यहां तक कि समरूपता), दो से विभाजित।(इसके विपरीत, डीसीटी प्रकार II-IV में समतुल्य डीएफटी में आधा नमूना शिफ्ट सम्मिलित है।)
ध्यान दें, चूंकि, कि डीसीटी-I के लिए परिभाषित नहीं है, इस प्रकार 2 से कम, जबकि अन्य सभी डीसीटी प्रकार किसी भी धनात्मक के लिए परिभाषित किए गए हैं।
इस प्रकार, डीसीटी-I सीमा स्थितियों से मेल खाती है: यहां तक कि चारों ओर है, इस प्रकार और यहां तक कि चारों ओर , इसी प्रकार के लिए मेल खाती हैं।
डीसीटी-II
- इसका
डीसीटी-II संभवतः सबसे अधिक उपयोग किया जाने वाला रूप है, और अधिकांशतः इसे केवल डीसीटी के रूप में संदर्भित किया जाता है।[5][6]
यह रूपांतरण बिल्कुल समतुल्य है (2 के समग्र पैमाने के कारक तक) असतत फूरियर परिवर्तन के लिए समरूपता के वास्तविक इनपुट जहां समरूपता वाले तत्व शून्य हैं। यही है, यह असतत फूरियर परिवर्तन का आधा है, इस प्रकार आदानों जहाँ पर के लिये तथा के लिये डीसीटी-II परिवर्तन भी 2 का उपयोग करके संभव हैN सिग्नल के बाद आधी पारी से गुणा किया जाता है।यह जॉन मखौल द्वारा प्रदर्शित किया गया है।
कुछ लेखक आगे गुणा करते हैं के द्वारा और परिणामी आव्यूह को समग्र पैमाने के कारक द्वारा गुणा करते हैं। इसके लिए डीसीटी-III में संबंधित परिवर्तन के लिए नीचे देखें। यह डीसीटी-II आव्यूह ऑर्थोगोनल आव्यूह बनाता है, किन्तु आधे-शिफ्ट किए गए इनपुट के वास्तविक-ईवन असतत फूरियर रूपांतरण के साथ प्रत्यक्ष पत्राचार को तोड़ता है। यह मैटलैब द्वारा उपयोग किया जाने वाला सामान्यीकरण है, उदाहरण के लिए, देखें।[103] कई अनुप्रयोगों में, जैसे कि जेपीईजी, स्केलिंग है, क्योंकि पैमाने के कारकों को बाद के कम्प्यूटेशनल चरण (जैसे कि जेपीईजी में परिमाणीकरण (सिग्नल प्रोसेसिंग) चरण के साथ जोड़ा जा सकता है[104]), और स्केलिंग को चुना जा सकता है जो डीसीटी को कम गुणन के साथ गणना करने की अनुमति देता है।[105][106]
डीसीटी-II का तात्पर्य सीमा की स्थिति है: यहां तक कि चारों ओर है और यहां तक कि चारों ओर यहां तक कि चारों ओर है और चारों ओर के समान हैं।
डीसीटी-3
क्योंकि यह डीसीटी-II (एक स्केल फैक्टर तक, नीचे देखें) का व्युत्क्रम है, इस फॉर्म को कभी-कभी व्युत्क्रम डीसीटी (Iडीसीटी) के रूप में संदर्भित किया जाता है।[6]
कुछ लेखक विभाजित करते हैं, इसके लिए के द्वारा 2 के अतिरिक्त (इसके समग्र के परिणामस्वरूप शब्द) और परिणामी आव्यूह को समग्र पैमाने के कारक से गुणा करें। (डीसीटी-II में संबंधित परिवर्तन के लिए ऊपर देखें), जिससे कि डीसीटी-II और डीसीटी-III दूसरे के ट्रांसपोज़ हो गया हैं। यह डीसीटी-III आव्यूह ऑर्थोगोनल आव्यूह बनाता है, किन्तु आधे-शिफ्ट किए गए आउटपुट के रियल-भी असतत फूरियर ट्रांसफ़ॉर्म के साथ प्रत्यक्ष पत्राचार को तोड़ता है।
डीसीटी-III का अर्थ है सीमा की स्थिति: यहां तक कि चारों ओर है और चारों ओर अजीब यहां तक कि चारों ओर है और यहां तक कि चारों ओर हैं।
डीसीटी-IV
डीसीटी-IV आव्यूह ऑर्थोगोनल आव्यूह बन जाता है (और इस प्रकार, स्पष्ट रूप से सममित होने के नाते, अपना स्वयं का व्युत्क्रम) यदि कोई आगे समग्र पैमाने के कारक से गुणा करता है।
डीसीटी-IV का प्रकार, जहां विभिन्न परिवर्तनों के डेटा को ओवरलैप किया जाता है, को संशोधित असतत कोसाइन परिवर्तन (Mडीसीटी) कहा जाता है।[107]
डीसीटी-IV का तात्पर्य सीमा की स्थिति है: यहां तक कि चारों ओर है और चारों ओर इसके लिए का उपयोग करते हैं।
डीसीटी V-VIII
I -IV प्रकारों के डीसीटी समरूपता के बिंदु के बारे में लगातार दोनों सीमाओं का उपचार करते हैं: वे दोनों सीमाओं के लिए दोनों सीमाओं के लिए या दोनों सीमाओं के लिए दो डेटा बिंदुओं के बीच डेटा बिंदु के आसपास भी/विषम हैं। इसके विपरीत, प्रकार V-VIII के डीसीटी की सीमाएं हैं जो सीमा के लिए डेटा बिंदु के आसपास और अन्य सीमा के लिए दो डेटा बिंदुओं के बीच आधे रास्ते के आसपास भी/विषम हैं।
दूसरे शब्दों में, डीसीटी प्रकार I-IV रियल-यहां तक कि असतत फूरियर के समान हैं, यहां तक कि कमांड (चाहे और भी विषम है), चूंकि संबंधित डीएफटी लंबाई का है (डीसीटी-i के लिए) या (डीसीटी-II और III के लिए) या (डीसीटी-IV के लिए) चार अतिरिक्त प्रकार के असतत कोसाइन रूपांतरण[108] अनिवार्य रूप से तार्किक रूप से विषम क्रम के वास्तविक-यहां तक कि जीएफटी के अनुरूप, जिनके कारक हैं कोसाइन तर्कों के भाजक में उपयोग होता हैं।
चूंकि, ये वेरिएंट व्यवहार में संभवतः ही कभी उपयोग किए जाते हैं। जिसके कारण संभवतः यह विषम-लंबाई वाले डीएफटी के लिए फास्ट फूरियर परिवर्तन एल्गोरिदम सामान्यतः फास्ट फूरियर परिवर्तन एल्गोरिदम की तुलना में भी अधिक जटिल होते हैं, जो कि भी लंबाई वाले डीएफटी के लिए एल्गोरिदम होते हैं (जैसे कि सबसे सरल रेडिक्स -2 एल्गोरिदम केवल लंबाई के लिए भी होते हैं), और यह बढ़ी हुई गहनता कैरी करता हैनीचे वर्णित के रूप में डीसीटी पर।
(तुच्छ रियल-ईवन सरणी, एकल संख्या की लंबाई-एक डीएफटी (विषम लंबाई) a, लंबाई के डीसीटी-v से मेल खाती है )
व्युत्क्रम रूपांतरण
उपरोक्त सामान्यीकरण सम्मेलनों का उपयोग करते हुए, डीसीटी-I का व्युत्क्रम डीसीटी-I को 2/1 से गुणा किया जाता है।डीसीटी-IV का व्युत्क्रम डीसीटी-IV 2/n से गुणा किया गया है।डीसीटी-II का व्युत्क्रम डीसीटी-III को 2/n और इसके विपरीत से गुणा किया जाता है।[6]
असतत फूरियर ट्रांसफ़ॉर्म के लिए, इन परिवर्तन परिभाषाओं के सामने सामान्यीकरण कारक केवल सम्मेलन है और उपचारों के बीच भिन्न होता है।उदाहरण के लिए, कुछ लेखक द्वारा परिवर्तन को गुणा करते हैं, जिससे कि व्युत्क्रम किसी भी अतिरिक्त गुणक कारक की आवश्यकता न हो।के उचित कारकों के साथ संयुक्त √2 (ऊपर देखें), इसका उपयोग परिवर्तन आव्यूह ऑर्थोगोनल आव्यूह बनाने के लिए किया जा सकता है।
बहुआयामी डीसीटी
विभिन्न डीसीटी प्रकारों के बहुआयामी वेरिएंट एक-आयामी परिभाषाओं से सीधे तौर पर पालन करते हैं: वे प्रत्येक आयाम के साथ डीसीटी के अलग उत्पाद (समकक्ष, रचना) हैं।
एम-डी डीसीटी-II
उदाहरण के लिए, इमेज या आव्यूह का दो-आयामी डीसीटी-II बस एक-आयामी डीसीटी-II है, ऊपर से, पंक्तियों के साथ और फिर कॉलम (या इसके विपरीत) के साथ प्रदर्शन किया जाता है।अर्थात्, 2 डी डीसीटी- II को सूत्र द्वारा दिया गया है (सामान्यीकरण और अन्य पैमाने के कारकों को छोड़ देना, जैसा कि ऊपर):
- एक बहु-आयामी डीसीटी का व्युत्क्रम संबंधित एक-आयामी डीसीटी (ऊपर देखें) के व्युत्क्रमों का अलग उत्पाद है, उदाहरण के लिए एक आयामी इनवर्स पंक्ति-स्तंभ एल्गोरिथ्म में समय में आयाम के साथ लागू होते हैं।
3-डी डीसीटी-II केवल तीन आयामी स्थान में 2-डी डीसीटी-II का विस्तार है और गणितीय रूप से सूत्र द्वारा गणना की जा सकती है
3-डी डीसीटी-II का व्युत्क्रम 3-डी डीसीटी-III है और इसे दिए गए सूत्र से गणना की जा सकती है
तकनीकी रूप से, प्रत्येक आयाम के साथ एक-आयामी डीसीटी के अनुक्रमों द्वारा दो-, तीन- (या -मल्टी) आयामी डीसीटी की गणना पंक्ति-स्तंभ एल्गोरिथ्म के रूप में जाना जाता है। फास्ट फूरियर परिवर्तन के लिए बहुआयामी एफएफटी के साथ, चूंकि, अलग क्रम में गणना करते समय ही चीज़ की गणना करने के लिए अन्य तरीके उपस्थित हैं (अर्ताथ विभिन्न आयामों के लिए एल्गोरिदम को इंटरलेविंग/संयोजन/संयोजन)।3-डी डीसीटी के आधार पर अनुप्रयोगों में तेजी से वृद्धि के कारण, 3-डी डीसीटी-II की गणना के लिए कई फास्ट एल्गोरिदम विकसित किए जाते हैं।वेक्टर-रेडिक्स एल्गोरिदम को कम्प्यूटेशनल जटिलता को कम करने और कम्प्यूटेशनल गति बढ़ाने के लिए एम-डी डीसीटी की गणना के लिए लागू किया जाता है।3-डी डीसीटी-II कुशलता से गणना करने के लिए, फास्ट एल्गोरिथ्म, वेक्टर-रेडिक्स डिकिमेशन इन फ्रीक्वेंसी (वीआर डीआईएफ) एल्गोरिथ्म विकसित किया गया था।
3-डी डीसीटी-II वीआर डीआईएफ
वीआर डीआईएफ एल्गोरिथ्म को लागू करने के लिए इनपुट डेटा को तैयार किया जाना है, और यह निम्नानुसार पुनर्व्यवस्थित किया जाना है।[109][110] इसका परिवर्तन आकार n × n × n को माना जाता है।
- जहाँ पर
आसन्न का आंकड़ा उन चार चरणों को दर्शाता है जो वीआर डीआईएफ एल्गोरिथ्म का उपयोग करके 3-डी डीसीटी-II की गणना में सम्मिलित हैं। इसका पहला चरण उपरोक्त समीकरणों द्वारा सचित्र इंडेक्स मैपिंग का उपयोग करके 3-डी पुनर्मूल्यांकन है। इसके लिए दूसरा चरण बटर फ्लाई गणना है। इस प्रकार प्रत्येक बटर फ्लाई आठ अंकों की गणना साथ करता है जैसा कि नीचे दिए गए आंकड़े में दिखाया गया है, जहां के समान हैं।
मूल 3-डी डीसीटी-II अब के रूप में लिखा जा सकता है।
जहाँ पर
यदि सम और विषम भागों तथा और माना जाता है, 3-डी डीसीटी-II की गणना के लिए सामान्य सूत्र के रूप में व्यक्त किया जा सकता है।
जहाँ पर
अंकगणितीय जटिलता
पूरे 3-डी डीसीटी गणना की जरूरत है चरणों, और प्रत्येक चरण में बटर फ्लाई सम्मिलित हैं। इस प्रकार पूरे 3-डी डीसीटी की आवश्यकता है, इसके लिए बटर फ्लाई की गणना की जानी चाहिए। इस प्रकार प्रत्येक बटर फ्लाई को सात वास्तविक गुणन (तुच्छ गुणा सहित) और 24 वास्तविक परिवर्धन (तुच्छ परिवर्धन सहित) की आवश्यकता होती है। इसलिए, इस चरण के लिए आवश्यक वास्तविक गुणन की कुल संख्या है और वास्तविक परिवर्धन की कुल संख्या अर्ताथ पोस्ट-एडिशन (पुनरावर्ती परिवर्धन) सहित, जिसकी गणना सीधे बटर फ्लाई चरण के बाद या बिट-रिवर्स स्टेज के द्वारा दी जाती है।[110]
एमडी-डीसीटी-II की गणना करने के लिए पारंपरिक विधि पंक्ति-स्तंभ-फ्रेम (आरसीएफ) दृष्टिकोण का उपयोग कर रही है जो कम्प्यूटेशनल रूप से जटिल और सबसे उन्नत हाल के हार्डवेयर प्लेटफार्मों पर कम उत्पादक है।आरसीएफ एल्गोरिथ्म की तुलना में वीआर डीआईएफ एल्गोरिथ्म की गणना करने के लिए आवश्यक गुणा की संख्या काफी कम होती है। इस प्रकार आरसीएफ दृष्टिकोण में सम्मिलित गुणन और परिवर्धन की संख्या दी गई है तथा क्रमशः सूची 1 से, यह देखा जा सकता है कि कुल संख्या
परिवर्तित आकार | 3डी वीआर मल्टी | आरसीएफ मल्टीज़ | 3डी वीआर एड्स | आरसीएफ एड्स |
---|---|---|---|---|
8 × 8 × 8 | 2.625 | 4.5 | 10.875 | 10.875 |
16 × 16 × 16 | 3.5 | 6 | 15.188 | 15.188 |
32 × 32 × 32 | 4.375 | 7.5 | 19.594 | 19.594 |
64 × 64 × 64 | 5.25 | 9 | 24.047 | 24.047 |
3-डी डीसीटी वीआर एल्गोरिथ्म से जुड़े गुणन आरसीएफ दृष्टिकोण से 40%से अधिक से जुड़े हैं। इसके अतिरिक्त, आरसीएफ दृष्टिकोण में नए वीआर एल्गोरिथ्म की तुलना में आव्यूह ट्रांसपोज़ और अधिक इंडेक्सिंग और डेटा स्वैपिंग सम्मिलित हैं।यह 3-डी डीसीटी वीआर एल्गोरिथ्म को 3-डी अनुप्रयोगों के लिए अधिक कुशल और उत्तम अनुकूल बनाता है जिसमें 3-डी डीसीटी- II जैसे वीडियो कंप्रेस्ड और अन्य 3-डी इमेज प्रोसेसिंग एप्लिकेशन सम्मिलित हैं।
एक तेज एल्गोरिथ्म चुनने में मुख्य विचार कम्प्यूटेशनल और संरचनात्मक जटिलताओं से बचना है।जैसा कि कंप्यूटर और डीएसपी की तकनीक अग्रिमों में, अंकगणितीय संचालन (गुणा और परिवर्धन) का निष्पादन समय बहुत तेज होता जा रहा है, और नियमित रूप से कम्प्यूटेशनल संरचना सबसे महत्वपूर्ण कारक बन जाती है।[111] इसलिए, चूंकि उपरोक्त प्रस्तावित 3-डी वीआर एल्गोरिथ्म गुणन की संख्या पर सैद्धांतिक निचले बाउंड को प्राप्त नहीं करता है,[112] अन्य 3-डी डीसीटी एल्गोरिदम की तुलना में इसकी सरल कम्प्यूटेशनल संरचना है। यह एकल बटर फ्लाई का उपयोग करके लागू किया जा सकता है, और 3-डी में कूली-टुकी एफएफटी एल्गोरिथ्म के गुणों के पास होता है। इसलिए, 3-डी वीआर 3-डी डीसीटी-II की गणना में अंकगणितीय संचालन को कम करने के लिए अच्छा विकल्प प्रस्तुत करता है, जबकि सरल संरचना को ध्यान में रखते हुए जो बटर फ्लाई-शैली कोइली-टुकी एफएफटी एल्गोरिदम की विशेषता है।
दाईं ओर की इमेज के लिए क्षैतिज और ऊर्ध्वाधर आवृत्तियों का संयोजन दिखाती है 8 × 8 दो-आयामी डीसीटी का उपयोग किया जाता हैं।प्रत्येक कदम बाएं से दाएं और ऊपर से नीचे तक आवृत्ति में 1/2 चक्र की वृद्धि होती है।
उदाहरण के लिए, शीर्ष-बाएं वर्ग से दाएं को स्थानांतरित करने से क्षैतिज आवृत्ति में आधा चक्र वृद्धि होती है। दाईं ओर और कदम दो आधा-चक्र देता है। इस चरण के नीचे दो आधा-चक्र क्षैतिज रूप से और आधा चक्र को लंबवत रूप से देता है। स्रोत डेटा ( 8×8 ) इन 64 आवृत्ति वर्गों के रैखिक संयोजन में परिवर्तित कर दिया जाता जाता है।
एमडी-डीसीटी-IV
एम-डी डीसीटी-IV केवल 1-D डीसीटी-IV का विस्तार है, इस प्रकार M आयामी डोमेन का उपयोग होता हैं। यह एक आव्यूह या इमेज के 2-डी डीसीटी-आईवी द्वारा दिया गया है
- के लिये तथा
हम नियमित रूप से पंक्ति-स्तंभ विधि का उपयोग करके एमडी डीसीटी-आईवी की गणना कर सकते हैं या हम बहुपद परिवर्तन विधि का उपयोग कर सकते हैं[113] तेज और कुशल गणना के लिए उपयोग किया जाता हैं। इस एल्गोरिथ्म का मुख्य विचार बहुआयामी डीसीटी को सीधे 1-डी डीसीटी की श्रृंखला में परिवर्तित करने के लिए बहुपद रूपांतरण का उपयोग करना है। एमडी डीसीटी-IV में विभिन्न क्षेत्रों में कई अनुप्रयोग भी हैं।
गणना
चूंकि इन सूत्रों के प्रत्यक्ष अनुप्रयोग की आवश्यकता होगी संचालन, केवल की गणना करना संभव है, फास्ट फूरियर परिवर्तन (एफएफटी) के समान गणना को कारक करके जटिलता।एक के साथ संयुक्त एफएफटी के माध्यम से डीसीटी की गणना भी कर सकते हैं पूर्व और पोस्ट-प्रोसेसिंग स्टेप्स।सामान्य रूप में, डीसीटी की गणना करने के तरीके फास्ट कोसाइन परिवर्तन (एफसीटी) एल्गोरिदम के रूप में जाना जाता है।
सबसे कुशल एल्गोरिदम, सिद्धांत रूप में, सामान्यतः वे होते हैं जो सीधे डीसीटी के लिए विशिष्ट होते हैं, जैसा कि साधारण एफएफटी प्लस का उपयोग करने के विपरीत है अतिरिक्त संचालन (एक अपवाद के लिए नीचे देखें)। चूंकि, यहां तक कि विशेष डीसीटी एल्गोरिदम (उन सभी सहित जो सबसे कम ज्ञात अंकगणितीय गणना प्राप्त करते हैं, कम से कम दो की शक्ति के लिए। पावर-ऑफ-टू आकार) सामान्यतः एफएफटी एल्गोरिदम से निकटता से संबंधित होते हैं-चूंकि डीसीटी अनिवार्य रूप से रियल-ईवन के डीएफटी होते हैं। डेटा, एफएफटी लेकर और इस समरूपता के कारण निरर्थक संचालन को समाप्त करके तेज़ डीसीटी एल्गोरिथ्म डिजाइन कर सकता है। यह भी स्वचालित रूप से किया जा सकता है, (फ्रीगो & जाॅनसन 2005) कूली -टर्की एफएफटी एल्गोरिथ्म पर आधारित एल्गोरिदम सबसे साधारण हैं, किन्तु कोई भी अन्य एफएफटी एल्गोरिथ्म भी लागू होता है। उदाहरण के लिए, विनोग्राड एफएफटी एल्गोरिथ्म डीएफटी के लिए न्यूनतम-मल्टीप्लिकेशन एल्गोरिदम की ओर जाता है, यद्यपि सामान्यतः अधिक परिवर्धन की लागत पर, और समान एल्गोरिथ्म द्वारा (फीज, विनोग्रैड & जुलाई 1992) डीसीटी के लिए प्रस्तावित किया गया था। क्योंकि जीएफटी, डीसीटी, और इसी प्रकार के रूपांतरों के लिए एल्गोरिदम सभी इतने निकट से संबंधित हैं, रूपांतरण के लिए एल्गोरिदम में कोई भी सुधार सैद्धांतिक रूप से अन्य रूपांतरण के लिए (डुहामेल & वेटरली 1990) द्वारा तत्काल लाभ प्राप्त करेगा।
जबकि डीसीटी एल्गोरिदम जो अनमॉडिफाइड एफएफटी को नियोजित करते हैं, अधिकांशतः सबसे अच्छे विशिष्ट डीसीटी एल्गोरिदम की तुलना में कुछ सैद्धांतिक ओवरहेड होते हैं, पूर्व में अलग लाभ भी होता है: अत्यधिक अनुकूलित एफएफटी कार्यक्रम व्यापक रूप से उपलब्ध हैं।इस प्रकार, व्यवहार में, सामान्य लंबाई के लिए उच्च प्रदर्शन प्राप्त करना अधिकांशतः साधारण होता है, इस प्रकार N एफएफटी-आधारित एल्गोरिदम के साथ किया जाता हैं।[lower-alpha 1]
दूसरी ओर, विशिष्ट डीसीटी एल्गोरिदम, छोटे, निश्चित आकारों के रूप में परिवर्तन के लिए व्यापक उपयोग देखें जैसे 8 × 8 डीसीटी-II जेपीईजी कंप्रेस्ड में उपयोग किया जाता है, या छोटे डीसीटी (या Mडीसीटी) सामान्यतः ऑडियो कंप्रेस्ड में उपयोग किए जाते हैं।(कम कोड आकार भी एम्बेडेड-डिवाइस अनुप्रयोगों के लिए विशेष डीसीटी का उपयोग करने का कारण हो सकता है।)
वास्तव में, यहां तक कि साधारण एफएफटी का उपयोग करने वाले डीसीटी एल्गोरिदम कभी-कभी वास्तविक-सममितीय डेटा के बड़े एफएफटी से निरर्थक संचालन को छंटने के बराबर होते हैं, और वे अंकगणित गणना के दृष्टिकोण से भी इष्टतम हो सकते हैं। उदाहरण के लिए, टाइप- II डीसीटी आकार के डीएफटी के बराबर है रियल-ईवन समरूपता के साथ, जिनके समरूप तत्व शून्य हैं।एफएफटी के माध्यम से इसकी गणना करने के लिए सबसे आम तरीकों में से (जैसे कि एफएफटीपैक और एफएफटीडब्ल्यू में उपयोग की जाने वाली विधि) का वर्णन किया गया था नरसिमहा & पीटरसन (1978) तथा मखौल (1980) , और इस विधि को हेंडसाइट में रेडिक्स -4 डिसीमेशन-इन-टाइम कोइली-टुकी एल्गोरिथ्म के चरण के रूप में देखा जा सकता है, जो डीसीटी-II के अनुरूप तार्किक रियल-ईवन डीएफटी पर लागू होता है।[lower-alpha 2]
क्योंकि सम-इंडेक्स किए गए तत्व शून्य हैं, यह रैडिक्स-4 स्टेप बिल्कुल स्प्लिट-रेडिक्स स्टेप के समान है। इस प्रकार यदि बाद का आकार रियल-डेटा एफएफटी रियल-डेटा स्प्लिट-रेडिक्स एफएफटी एल्गोरिथ्म द्वारा भी किया जाता है। स्प्लिट-रेडिक्स एल्गोरिथ्म (के रूप में सोरेनसेन et al. (1987) ), तब परिणामी एल्गोरिथ्म वास्तव में मेल खाता है जो पावर-ऑफ-टू डीसीटी-II के लिए सबसे कम प्रकाशित अंकगणित गिनती थी ( वास्तविक-शिथिल संचालन[lower-alpha 3]) हैं।
ऑपरेशन की गिनती में हाल ही में कमी इसके अतिरिक्त वास्तविक-डेटा एफएफटी का उपयोग करता है।[114] इसलिए, अंकगणितीय दृष्टिकोण से एफएफटी के माध्यम से डीसीटी की गणना करने के बारे में आंतरिक रूप से बुरा कुछ भी नहीं है - यह कभी -कभी केवल सवाल है कि क्या संबंधित एफएफटी एल्गोरिथ्म इष्टतम है।(एक व्यावहारिक मामले के रूप में, अलग एफएफटी दिनचर्या को लागू करने में फ़ंक्शन-कॉल ओवरहेड छोटे के लिए महत्वपूर्ण हो सकता है, इस प्रकारके लिए यह एल्गोरिथम प्रश्न के अतिरिक्त कार्यान्वयन है, क्योंकि इसे अनियंत्रित या इनलाइनिंग द्वारा हल किया जा सकता है।)
Iडीसीटी का उदाहरण
कैपिटल लेटर ए की इस 8x8 ग्रेस्केल इमेज पर विचार करें।
प्रत्येक आधार फ़ंक्शन को इसके गुणांक से गुणा किया जाता है और फिर इस उत्पाद को अंतिम इमेज में जोड़ा जाता है।
यह भी देखें
- असतत तरंग परिवर्तन
- असतत कोसाइन रूपांतरण या जेपीईजी-अलगकोसाइनपरिवर्तन-डीसीटी परिवर्तन के उदाहरण को समझने के लिए संभावित रूप से आसान है
- फूरियर-संबंधित रूपांतरों की सूची।
- संशोधित असतत कोसाइन रूपांतरण
टिप्पणियाँ
- ↑ Algorithmic performance on modern hardware is typically not principally determined by simple arithmetic counts, and optimization requires substantial engineering effort to make best use, within its intrinsic limits, of available built-in hardware optimization.
- ↑ The radix-4 step reduces the size DFT to four size DFTs of real data, two of which are zero, and two of which are equal to one another by the even symmetry. Hence giving a single size FFT of real data plus butterflies, once the trivial and / or duplicate parts are eliminated and / or merged.
- ↑ The precise count of real arithmetic operations, and in particular the count of real multiplications, depends somewhat on the scaling of the transform definition. The count is for the DCT-II definition shown here; two multiplications can be saved if the transform is scaled by an overall factor. Additional multiplications can be saved if one permits the outputs of the transform to be rescaled individually, as was shown by Arai, Agui & Nakajima (1988) for the size-8 case used in JPEG.
संदर्भ
- ↑ 1.00 1.01 1.02 1.03 1.04 1.05 1.06 1.07 1.08 1.09 1.10 1.11 1.12 1.13 1.14 1.15 1.16 1.17 1.18 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. Tampere International Center for Signal Processing. 60. ISBN 978-9521528187. ISSN 1456-2774. Archived (PDF) from the original on 30 December 2021. Retrieved 30 December 2021 – via ETHW.
- ↑ 2.0 2.1 2.2 2.3 2.4 Britanak, Vladimir; Yip, Patrick C.; Rao, K. R. (6 November 2006). Discrete Cosine and Sine Transforms: General Properties, Fast Algorithms and Integer Approximations (in English). Academic Press. ISBN 978-0123736246. LCCN 2006931102. OCLC 220853454. OL 18495589M. S2CID 118873224.
{{cite book}}
: CS1 maint: date and year (link) - ↑ 3.0 3.1 3.2 3.3 Alikhani, Darya (April 1, 2015). "Beyond resolution: Rosa Menkman's glitch art". POSTmatter. Retrieved 19 October 2019.
- ↑ 4.0 4.1 4.2 4.3 4.4 Thomson, Gavin; Shah, Athar (2017). "Introducing HEIF and HEVC" (PDF). Apple Inc. Retrieved 5 August 2019.
- ↑ 5.0 5.1 5.2 5.3 5.4 5.5 Ahmed, Nasir; Natarajan, T. Raj; Rao, K.R. (1 January 1974). "Discrete Cosine Transform". IEEE Transactions on Computers (in English). IEEE Computer Society. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784. eISSN 1557-9956. ISSN 0018-9340. LCCN 75642478. OCLC 1799331. S2CID 206619973.
{{cite journal}}
: CS1 maint: date and year (link) - ↑ 6.0 6.1 6.2 6.3 6.4 6.5 Rao, K. Ramamohan; Yip, Patrick C. (11 September 1990). Discrete Cosine Transform: Algorithms, Advantages, Applications. Signal, Image and Speech Processing (in English). Academic Press. doi:10.1016/c2009-0-22279-3. ISBN 978-0125802031. LCCN 89029800. OCLC 1008648293. OL 2207570M. S2CID 12270940.
{{cite book}}
: CS1 maint: date and year (link) - ↑ 7.0 7.1 7.2 7.3 7.4 7.5 7.6 Barbero, M.; Hofmann, H.; Wells, N. D. (14 November 1991). "DCT source coding and current implementations for HDTV". EBU Technical Review. European Broadcasting Union (251): 22–33. Retrieved 4 November 2019.
- ↑ 8.0 8.1 8.2 8.3 8.4 8.5 Lea, William (1994). "Video on demand: Research Paper 94/68". House of Commons Library. Retrieved 20 September 2019.
- ↑ 9.0 9.1 9.2 Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
- ↑ 10.0 10.1 10.2 10.3 10.4 "T.81 – Digital compression and coding of continuous-tone still images – Requirements and guidelines" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
- ↑ Selected Papers on Visual Communication: Technology and Applications, (SPIE Press Book), Editors T. Russell Hsing and Andrew G. Tescher, April 1990, pp. 145-149 [1].
- ↑ Selected Papers and Tutorial in Digital Image Processing and Analysis, Volume 1, Digital Image Processing and Analysis, (IEEE Computer Society Press), Editors R. Chellappa and A. A. Sawchuk, June 1985, p. 47.
- ↑ DCT citations via Google Scholar [2].
- ↑ Chen, Wen-Hsiung; Smith, C. H.; Fralick, S. C. (September 1977). "A Fast Computational Algorithm for the Discrete Cosine Transform". IEEE Transactions on Communications. 25 (9): 1004–1009. doi:10.1109/TCOM.1977.1093941.
- ↑ Smith, C.; Fralick, S. (1977). "A Fast Computational Algorithm for the Discrete Cosine Transform". IEEE Transactions on Communications. 25 (9): 1004–1009. doi:10.1109/TCOM.1977.1093941. ISSN 0090-6778.
- ↑ Huang, T. S. (1981). Image Sequence Analysis. Springer Science & Business Media. p. 29. ISBN 9783642870378.
- ↑ Roese, John A.; Robinson, Guner S. (30 October 1975). "Combined Spatial And Temporal Coding Of Digital Image Sequences". Efficient Transmission of Pictorial Information. International Society for Optics and Photonics. 0066: 172–181. Bibcode:1975SPIE...66..172R. doi:10.1117/12.965361. S2CID 62725808.
- ↑ Cianci, Philip J. (2014). High Definition Television: The Creation, Development and Implementation of HDTV Technology. McFarland. p. 63. ISBN 9780786487974.
- ↑ 19.0 19.1 19.2 "History of Video Compression". ITU-T. Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6). July 2002. pp. 11, 24–9, 33, 40–1, 53–6. Retrieved 3 November 2019.
- ↑ 20.0 20.1 20.2 Ghanbari, Mohammed (2003). Standard Codecs: Image Compression to Advanced Video Coding. Institution of Engineering and Technology. pp. 1–2. ISBN 9780852967102.
- ↑ Li, Jian Ping (2006). Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006. World Scientific. p. 847. ISBN 9789812709998.
- ↑ 22.0 22.1 22.2 Wang, Hanli; Kwong, S.; Kok, C. (2006). "Efficient prediction algorithm of integer DCT coefficients for H.264/AVC optimization". IEEE Transactions on Circuits and Systems for Video Technology. 16 (4): 547–552. doi:10.1109/TCSVT.2006.871390. S2CID 2060937.
- ↑ Princen, John P.; Johnson, A.W.; Bradley, Alan B. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. 12: 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
- ↑ Princen, J.; Bradley, A. (1986). "Analysis/Synthesis filter bank design based on time domain aliasing cancellation". IEEE Transactions on Acoustics, Speech, and Signal Processing. 34 (5): 1153–1161. doi:10.1109/TASSP.1986.1164954.
- ↑ 25.00 25.01 25.02 25.03 25.04 25.05 25.06 25.07 25.08 25.09 25.10 Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
- ↑ 26.0 26.1 Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
- ↑ 27.0 27.1 Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
- ↑ 28.0 28.1 Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
- ↑ 29.0 29.1 Xiph.Org Foundation (2009-06-02). "Vorbis I specification - 1.1.2 Classification". Xiph.Org Foundation. Retrieved 2009-09-22.
- ↑ Dhamija, Swati; Jain, Priyanka (September 2011). "Comparative Analysis for Discrete Sine Transform as a suitable method for noise estimation". IJCSI International Journal of Computer Science. 8 (5, No. 3): 162–164 (162). Retrieved 4 November 2019.
- ↑ Mandyam, Giridhar D.; Ahmed, Nasir; Magotra, Neeraj (17 April 1995). "DCT-based scheme for lossless image compression". Digital Video Compression: Algorithms and Technologies 1995. International Society for Optics and Photonics. 2419: 474–478. Bibcode:1995SPIE.2419..474M. doi:10.1117/12.206386. S2CID 13894279.
- ↑ Komatsu, K.; Sezaki, Kaoru (1998). "Reversible discrete cosine transform". Proceedings of the 1998 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '98 (Cat. No.98CH36181). 3: 1769–1772 vol.3. doi:10.1109/ICASSP.1998.681802. ISBN 0-7803-4428-6. S2CID 17045923.
- ↑ Muchahary, D.; Mondal, A. J.; Parmar, R. S.; Borah, A. D.; Majumder, A. (2015). "A Simplified Design Approach for Efficient Computation of DCT". 2015 Fifth International Conference on Communication Systems and Network Technologies: 483–487. doi:10.1109/CSNT.2015.134. ISBN 978-1-4799-1797-6. S2CID 16411333.
- ↑ Chen, Wai Kai (2004). The Electrical Engineering Handbook. Elsevier. p. 906. ISBN 9780080477480.
- ↑ 35.0 35.1 35.2 "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.
- ↑ 36.0 36.1 36.2 Pessina, Laure-Anne (12 December 2014). "JPEG changed our world". EPFL News. École Polytechnique Fédérale de Lausanne. Retrieved 13 September 2019.
- ↑ 37.0 37.1 Lee, Ruby Bei-Loh; Beck, John P.; Lamb, Joel; Severson, Kenneth E. (April 1995). "Real-time software MPEG video decoder on multimedia-enhanced PA 7100LC processors" (PDF). Hewlett-Packard Journal. 46 (2). ISSN 0018-1153.
- ↑ 38.0 38.1 38.2 Lee, Jack (2005). Scalable Continuous Media Streaming Systems: Architecture, Design, Analysis and Implementation. John Wiley & Sons. p. 25. ISBN 9780470857649.
- ↑ 39.0 39.1 39.2 Shishikui, Yoshiaki; Nakanishi, Hiroshi; Imaizumi, Hiroyuki (October 26–28, 1993). "An HDTV Coding Scheme using Adaptive-Dimension DCT". Signal Processing of HDTV: Proceedings of the International Workshop on HDTV '93, Ottawa, Canada. Elsevier: 611–618. doi:10.1016/B978-0-444-81844-7.50072-3. ISBN 9781483298511.
- ↑ 40.0 40.1 Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Discrete Cosine Transform, Second Edition. CRC Press. pp. 1–3, 129. ISBN 9781351396486.
- ↑ 41.00 41.01 41.02 41.03 41.04 41.05 41.06 41.07 41.08 41.09 41.10 41.11 41.12 41.13 41.14 41.15 41.16 41.17 41.18 41.19 41.20 41.21 41.22 41.23 41.24 41.25 41.26 41.27 41.28 41.29 41.30 Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Discrete Cosine Transform, Second Edition. CRC Press. pp. 1–3. ISBN 9781351396486.
- ↑ 42.0 42.1 42.2 42.3 42.4 Britanak, Vladimir; Rao, K. R. (2017). Cosine-/Sine-Modulated Filter Banks: General Properties, Fast Algorithms and Integer Approximations. Springer. p. 478. ISBN 9783319610801.
- ↑ 43.0 43.1 Jones, Graham A.; Layer, David H.; Osenkowsky, Thomas G. (2013). National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook. Taylor & Francis. pp. 558–9. ISBN 978-1-136-03410-7.
- ↑ 44.0 44.1 44.2 Hersent, Olivier; Petit, Jean-Pierre; Gurle, David (2005). Beyond VoIP Protocols: Understanding Voice Technology and Networking Techniques for IP Telephony. John Wiley & Sons. p. 55. ISBN 9780470023631.
- ↑ 45.0 45.1 45.2 45.3 45.4 Daniel Eran Dilger (June 8, 2010). "Inside iPhone 4: FaceTime video calling". AppleInsider. Retrieved June 9, 2010.
- ↑ 46.0 46.1 46.2 46.3 Netflix Technology Blog (19 April 2017). "More Efficient Mobile Encodes for Netflix Downloads". Medium.com. Netflix. Retrieved 20 October 2019.
- ↑ 47.0 47.1 "Video Developer Report 2019" (PDF). Bitmovin. 2019. Retrieved 5 November 2019.
- ↑ Ochoa-Dominguez, Humberto; Rao, K. R. (2019). Discrete Cosine Transform, Second Edition. CRC Press. p. 186. ISBN 9781351396486.
- ↑ 49.0 49.1 49.2 49.3 McKernan, Brian (2005). Digital cinema: the revolution in cinematography, postproduction, distribution. McGraw-Hill. p. 58. ISBN 978-0-07-142963-4.
DCT is used in most of the compression systems standardized by the Moving Picture Experts Group (MPEG), is the dominant technology for image compression. In particular, it is the core technology of MPEG-2, the system used for DVDs, digital television broadcasting, that has been used for many of the trials of digital cinema.
- ↑ 50.0 50.1 Baraniuk, Chris (15 October 2015). "Copy protections could come to JPegs". BBC News. BBC. Retrieved 13 September 2019.
- ↑ Ascher, Steven; Pincus, Edward (2012). The Filmmaker's Handbook: A Comprehensive Guide for the Digital Age: Fifth Edition. Penguin. pp. 246–7. ISBN 978-1-101-61380-1.
- ↑ Bertalmio, Marcelo (2014). Image Processing for Cinema. CRC Press. p. 95. ISBN 978-1-4398-9928-1.
- ↑ Zhang, HongJiang (1998). "Content-Based Video Browsing And Retrieval". In Furht, Borko (ed.). Handbook of Internet and Multimedia Systems and Applications. CRC Press. pp. 83–108 (89). ISBN 9780849318580.
- ↑ 54.0 54.1 "Apple ProRes 422 Codec Family". Library of Congress. 17 November 2014. Retrieved 13 October 2019.
- ↑ Potluri, U. S.; Madanayake, A.; Cintra, R. J.; Bayer, F. M.; Rajapaksha, N. (17 October 2012). "Multiplier-free DCT approximations for RF multi-beam digital aperture-array space imaging and directional sensing". Measurement Science and Technology. 23 (11): 114003. doi:10.1088/0957-0233/23/11/114003. ISSN 0957-0233.
- ↑ Hudson, Graham; Léger, Alain; Niss, Birger; Sebestyén, István; Vaaben, Jørgen (31 August 2018). "JPEG-1 standard 25 years: past, present, and future reasons for a success". Journal of Electronic Imaging. 27 (4): 1. doi:10.1117/1.JEI.27.4.040901.
- ↑ "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Retrieved 5 August 2019.
- ↑ Thomson, Gavin; Shah, Athar (2017). "Introducing HEIF and HEVC" (PDF). Apple Inc. Retrieved 5 August 2019.
- ↑ "HEIF Comparison - High Efficiency Image File Format". Nokia Technologies. Retrieved 5 August 2019.
- ↑ Alakuijala, Jyrki; Sneyers, Jon; Versari, Luca; Wassenberg, Jan (22 January 2021). "JPEG XL White Paper" (PDF). JPEG Org. Archived (PDF) from the original on 2 May 2021. Retrieved 14 Jan 2022.
Variable-sized DCT (square or rectangular from 2x2 to 256x256) serves as a fast approximation of the optimal decorrelating transform.
- ↑ 61.0 61.1 Wang, Yao (2006). "Video Coding Standards: Part I" (PDF). Archived from the original (PDF) on 2013-01-23.
- ↑ Wang, Yao (2006). "Video Coding Standards: Part II" (PDF). Archived from the original (PDF) on 2013-01-23.
- ↑ Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 255. ISBN 9781461560319.
- ↑ 64.0 64.1 Rao, K.R.; Hwang, J. J. (18 July 1996). Techniques and Standards for Image, Video, and Audio Coding (in English). Prentice Hall. JPEG: Chapter 8; H.261: Chapter 9; MPEG-1: Chapter 10; MPEG-2: Chapter 11. ISBN 978-0133099072. LCCN 96015550. OCLC 34617596. OL 978319M. S2CID 56983045.
{{cite book}}
: CS1 maint: date and year (link) - ↑ Davis, Andrew (13 June 1997). "The H.320 Recommendation Overview". EE Times. Retrieved 7 November 2019.
- ↑ IEEE WESCANEX 97: communications, power, and computing : conference proceedings. University of Manitoba, Winnipeg, Manitoba, Canada: Institute of Electrical and Electronics Engineers. May 22–23, 1997. p. 30. ISBN 9780780341470.
H.263 is similar to, but more complex than H.261. It is currently the most widely used international video compression standard for video telephony on ISDN (Integrated Services Digital Network) telephone lines.
- ↑ Peter de Rivaz; Jack Haughton (2018). "AV1 Bitstream & Decoding Process Specification" (PDF). Alliance for Open Media. Retrieved 2022-01-14.
- ↑ YouTube Developers (15 September 2018). "AV1 Beta Launch Playlist". Retrieved 14 January 2022.
The first videos to receive YouTube's AV1 transcodes.
- ↑ Brinkmann, Martin (13 September 2018). "How to enable AV1 support on YouTube". Retrieved 14 January 2022.
- ↑ Netflix Technology Blog (5 February 2020). "Netflix Now Streaming AV1 on Android". Retrieved 14 January 2022.
- ↑ Netflix Technology Blog (9 November 2021). "Bringing AV1 Streaming to Netflix Members' TVs". Retrieved 14 January 2022.
- ↑ Herre, J.; Dietz, M. (2008). "MPEG-4 high-efficiency AAC coding [Standards in a Nutshell]". IEEE Signal Processing Magazine. 25 (3): 137–142. Bibcode:2008ISPM...25..137H. doi:10.1109/MSP.2008.918684.
- ↑ Valin, Jean-Marc; Maxwell, Gregory; Terriberry, Timothy B.; Vos, Koen (October 2013). High-Quality, Low-Delay Music Coding in the Opus Codec. 135th AES Convention. Audio Engineering Society. arXiv:1602.04845.
- ↑ "Opus Codec". Opus (Home page). Xiph.org Foundation. Retrieved July 31, 2012.
- ↑ Leyden, John (27 October 2015). "WhatsApp laid bare: Info-sucking app's innards probed". The Register. Retrieved 19 October 2019.
- ↑ Hazra, Sudip; Mateti, Prabhaker (September 13–16, 2017). "Challenges in Android Forensics". In Thampi, Sabu M.; Pérez, Gregorio Martínez; Westphall, Carlos Becker; Hu, Jiankun; Fan, Chun I.; Mármol, Félix Gómez (eds.). Security in Computing and Communications: 5th International Symposium, SSCC 2017. Springer. pp. 286–299 (290). doi:10.1007/978-981-10-6898-0_24. ISBN 9789811068980.
- ↑ Srivastava, Saurabh Ranjan; Dube, Sachin; Shrivastaya, Gulshan; Sharma, Kavita (2019). "Smartphone Triggered Security Challenges: Issues, Case Studies and Prevention". In Le, Dac-Nhuong; Kumar, Raghvendra; Mishra, Brojo Kishore; Chatterjee, Jyotir Moy; Khari, Manju (eds.). Cyber Security in Parallel and Distributed Computing: Concepts, Techniques, Applications and Case Studies. pp. 187–206 (200). doi:10.1002/9781119488330.ch12. ISBN 9781119488057.
{{cite book}}
:|journal=
ignored (help) - ↑ "Open Source Software used in PlayStation 4". Sony Interactive Entertainment Inc. Retrieved 2017-12-11.
- ↑ "Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services" (PDF). Dolby Laboratories. June 2015. Retrieved 11 November 2019.
- ↑ Bleidt, R. L.; Sen, D.; Niedermeier, A.; Czelhan, B.; Füg, S.; et al. (2017). "Development of the MPEG-H TV Audio System for ATSC 3.0" (PDF). IEEE Transactions on Broadcasting. 63 (1): 202–236. doi:10.1109/TBC.2017.2661258. S2CID 30821673.
- ↑ Schnell, Markus; Schmidt, Markus; Jander, Manuel; Albert, Tobias; Geiger, Ralf; Ruoppila, Vesa; Ekstrand, Per; Bernhard, Grill (October 2008). MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication (PDF). 125th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 20 October 2019.
- ↑ Lutzky, Manfred; Schuller, Gerald; Gayer, Marc; Krämer, Ulrich; Wabnik, Stefan (May 2004). A guideline to audio codec delay (PDF). 116th AES Convention. Fraunhofer IIS. Audio Engineering Society. Retrieved 24 October 2019.
- ↑ 83.0 83.1 Nagireddi, Sivannarayana (2008). VoIP Voice and Fax Signal Processing. John Wiley & Sons. p. 69. ISBN 9780470377864.
- ↑ "ITU-T SG 16 Work Programme (2005-2008) - G.718 (ex G.VBR-EV)".
- ↑ Terriberry, Timothy B. Presentation of the CELT codec. Event occurs at 65 minutes., also "CELT codec presentation slides" (PDF).
- ↑ "Ekiga 3.1.0 available".
- ↑ "FreeSWITCH: New Release For The New Year".
- ↑ "Enhanced Voice Services (EVS) Codec" (PDF). Fraunhofer IIS. March 2017. Retrieved 19 October 2019.
- ↑ Abousleman, G. P.; Marcellin, M. W.; Hunt, B. R. (January 1995), "Compression of hyperspectral imagery using 3-D DCT and hybrid DPCM/DCT", IEEE Trans. Geosci. Remote Sens., 33 (1): 26–34, Bibcode:1995ITGRS..33...26A, doi:10.1109/36.368225
- ↑ Chan, Y.; Siu, W. (May 1997), "Variable temporal-length 3-D discrete cosine transform coding" (PDF), IEEE Trans. Image Processing., 6 (5): 758–763, Bibcode:1997ITIP....6..758C, CiteSeerX 10.1.1.516.2824, doi:10.1109/83.568933, PMID 18282969
- ↑ Song, J.; SXiong, Z.; Liu, X.; Liu, Y., "An algorithm for layered video coding and transmission", Proc. Fourth Int. Conf./Exh. High Performance Comput. Asia-Pacific Region, 2: 700–703
- ↑ Tai, S.-C; Gi, Y.; Lin, C.-W. (September 2000), "An adaptive 3-D discrete cosine transform coder for medical image compression", IEEE Trans. Inf. Technol. Biomed., 4 (3): 259–263, doi:10.1109/4233.870036, PMID 11026596, S2CID 18016215
- ↑ Yeo, B.; Liu, B. (May 1995), "Volume rendering of DCT-based compressed 3D scalar data", IEEE Trans. Comput. Graphics., 1: 29–43, doi:10.1109/2945.468390
- ↑ Chan, S.C.; Liu, W.; Ho, K.I. (2000). "Perfect reconstruction modulated filter banks with sum of powers-of-two coefficients". 2000 IEEE International Symposium on Circuits and Systems. Emerging Technologies for the 21st Century. Proceedings (IEEE Cat No.00CH36353). Vol. 2. pp. 73–76. doi:10.1109/ISCAS.2000.856261. hdl:10722/46174. ISBN 0-7803-5482-6. S2CID 1757438.
- ↑ Queiroz, R. L.; Nguyen, T. Q. (1996). "Lapped transforms for efficient transform/subband coding". IEEE Trans. Signal Process. 44 (5): 497–507.
- ↑ Malvar 1992.
- ↑ Chan, S. C.; Luo, L.; Ho, K. L. (1998). "M-Channel compactly supported biorthogonal cosine-modulated wavelet bases". IEEE Trans. Signal Process. 46 (2): 1142–1151. Bibcode:1998ITSP...46.1142C. doi:10.1109/78.668566. hdl:10722/42775.
- ↑ 98.0 98.1 Katsaggelos, Aggelos K.; Babacan, S. Derin; Chun-Jen, Tsai (2009). "Chapter 15 - Iterative Image Restoration". The Essential Guide to Image Processing. Academic Press. pp. 349–383. ISBN 9780123744579.
- ↑ "Mosquito noise". PC Magazine. Retrieved 19 October 2019.
- ↑ Menkman, Rosa (October 2011). The Glitch Moment(um) (PDF). Institute of Network Cultures. ISBN 978-90-816021-6-7. Retrieved 19 October 2019.
- ↑ Ruff, Thomas (May 31, 2009). "jpegs". Aperture. p. 132. ISBN 9781597110938.
- ↑ Colberg, Jörg (April 17, 2009). "Review: jpegs by Thomas Ruff".
- ↑ "Discrete cosine transform - MATLAB dct". www.mathworks.com. Retrieved 2019-07-11.
- ↑ Pennebaker, William B.; Mitchell, Joan L. (31 December 1992). JPEG: Still Image Data Compression Standard. ISBN 9780442012724.
- ↑ Arai, Y.; Agui, T.; Nakajima, M. (1988). "A fast DCT-SQ scheme for images". IEICE Transactions. 71 (11): 1095–1097.
- ↑ Shao, Xuancheng; Johnson, Steven G. (2008). "Type-II/III DCT/DST algorithms with reduced number of arithmetic operations". Signal Processing. 88 (6): 1553–1564. arXiv:cs/0703150. doi:10.1016/j.sigpro.2008.01.004. S2CID 986733.
- ↑ Malvar 1992
- ↑ Martucci 1994
- ↑ Chan, S.C.; Ho, K.L. (1990). "Direct methods for computing discrete sinusoidal transforms". IEE Proceedings F Radar and Signal Processing. 137 (6): 433. doi:10.1049/ip-f-2.1990.0063.
- ↑ 110.0 110.1 Alshibami, O.; Boussakta, S. (July 2001). "Three-dimensional algorithm for the 3-D DCT-III". Proc. Sixth Int. Symp. Commun., Theory Applications: 104–107.
- ↑ Guoan Bi; Gang Li; Kai-Kuang Ma; Tan, T.C. (2000). "On the computation of two-dimensional DCT". IEEE Transactions on Signal Processing. 48 (4): 1171–1183. Bibcode:2000ITSP...48.1171B. doi:10.1109/78.827550.
- ↑ Feig, E.; Winograd, S. (July 1992). "On the multiplicative complexity of discrete cosine transforms". IEEE Transactions on Information Theory. 38 (4): 1387–1391. doi:10.1109/18.144722.
- ↑ Nussbaumer, H.J. (1981). Fast Fourier transform and convolution algorithms (1st ed.). New York: Springer-Verlag.
- ↑ Shao, Xuancheng; Johnson, Steven G. (2008). "Type-II/III DCT/DST algorithms with reduced number of arithmetic operations". Signal Processing. 88 (6): 1553–1564. arXiv:cs/0703150. doi:10.1016/j.sigpro.2008.01.004. S2CID 986733.
अग्रिम पठन
- Narasimha, M.; Peterson, A. (June 1978). "On the Computation of the Discrete Cosine Transform". IEEE Transactions on Communications. 26 (6): 934–936. doi:10.1109/TCOM.1978.1094144.
- Makhoul, J. (February 1980). "A fast cosine transform in one and two dimensions". IEEE Transactions on Acoustics, Speech, and Signal Processing. 28 (1): 27–34. doi:10.1109/TASSP.1980.1163351.
- Sorensen, H.; Jones, D.; Heideman, M.; Burrus, C. (June 1987). "Real-valued fast Fourier transform algorithms". IEEE Transactions on Acoustics, Speech, and Signal Processing. 35 (6): 849–863. CiteSeerX 10.1.1.205.4523. doi:10.1109/TASSP.1987.1165220.
- Plonka, G.; Tasche, M. (January 2005). "Fast and numerically stable algorithms for discrete cosine transforms". Linear Algebra and Its Applications. 394 (1): 309–345. doi:10.1016/j.laa.2004.07.015.
- Duhamel, P.; Vetterli, M. (April 1990). "Fast fourier transforms: A tutorial review and a state of the art". Signal Processing (Submitted manuscript). 19 (4): 259–299. doi:10.1016/0165-1684(90)90158-U.
- Ahmed, N. (January 1991). "How I came up with the discrete cosine transform". Digital Signal Processing. 1 (1): 4–9. doi:10.1016/1051-2004(91)90086-Z.
- Feig, E.; Winograd, S. (September 1992). "Fast algorithms for the discrete cosine transform". IEEE Transactions on Signal Processing. 40 (9): 2174–2193. Bibcode:1992ITSP...40.2174F. doi:10.1109/78.157218.
- Malvar, Henrique (1992), Signal Processing with Lapped Transforms, Boston: Artech House, ISBN 978-0-89006-467-2
- Martucci, S. A. (May 1994). "Symmetric convolution and the discrete sine and cosine transforms". IEEE Transactions on Signal Processing. 42 (5): 1038–1051. Bibcode:1994ITSP...42.1038M. doi:10.1109/78.295213.
- Oppenheim, Alan; Schafer, Ronald; Buck, John (1999), Discrete-Time Signal Processing (2nd ed.), Upper Saddle River, N.J: Prentice Hall, ISBN 978-0-13-754920-7
- Frigo, M.; Johnson, S. G. (February 2005). "The Design and Implementation of FFTW3" (PDF). Proceedings of the IEEE. 93 (2): 216–231. CiteSeerX 10.1.1.66.3097. doi:10.1109/JPROC.2004.840301. S2CID 6644892.
- Boussakta, Said.; Alshibami, Hamoud O. (April 2004). "Fast Algorithm for the 3-D DCT-II" (PDF). IEEE Transactions on Signal Processing. 52 (4): 992–1000. Bibcode:2004ITSP...52..992B. doi:10.1109/TSP.2004.823472. S2CID 3385296.
- Cheng, L. Z.; Zeng, Y. H. (2003). "New fast algorithm for multidimensional type-IV DCT". IEEE Transactions on Signal Processing. 51 (1): 213–220. doi:10.1109/TSP.2002.806558.
- Wen-Hsiung Chen; Smith, C.; Fralick, S. (September 1977). "A Fast Computational Algorithm for the Discrete Cosine Transform". IEEE Transactions on Communications. 25 (9): 1004–1009. doi:10.1109/TCOM.1977.1093941.
- Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007), "Section 12.4.2. Cosine Transform", Numerical Recipes: The Art of Scientific Computing (3rd ed.), New York: Cambridge University Press, ISBN 978-0-521-88068-8
बाहरी संबंध
- Syed Ali Khayam: The Discrete Cosine Transform (डीसीटी): Theory and Application
- Implementation of एमपीईजी integer approximation of 8x8 Iडीसीटी (ISO/IEC 23002-2)
- Matteo Frigo and Steven G. Johnson: एफएफटीW, http://www.एफएफटीw.org/. A free (GPL) C library that can compute fast डीसीटी (types I-IV) in one or more dimensions, of arbitrary size.
- Takuya Ooura: General Purpose एफएफटी Package, http://www.kurims.kyoto-u.ac.jp/~ooura/एफएफटी.html. Free C & FORTRAN libraries for computing fast डीसीटी (types II–III) in one, two or three dimensions, power of 2 sizes.
- Tim Kientzle: Fast algorithms for computing the 8-point डीसीटी and Iडीसीटी, http://drdobbs.com/parallel/184410889.
- LTFAT is a free Matlab/Octave toolbox with interfaces to the एफएफटीW implementation of the डीसीटी and डीएसटीएस of type I-IV.