असतत कोसाइन परिवर्तन

एक असतत कोज्या ट्रांसफॉर्म (डीसीटी) अलग -अलग आवृत्ति पर दोलन करने वाले कोसाइन फ़ंक्शंस के योग के संदर्भ में डेटा बिंदुओं का परिमित अनुक्रम व्यक्त करता है। 1972 में नासिर अहमद (इंजीनियर) द्वारा प्रस्तावित डीसीटी, सिग्नल प्रोसेसिंग और डेटा संपीड़न में व्यापक रूप से उपयोग की जाने वाली परिवर्तन तकनीक है। इसका उपयोग अधिकांश डिजीटल मीडिया में किया जाता है, जिसमें डिजिटल छवियां (जैसे JPEG और HEIF, जहां छोटे उच्च-आवृत्ति वाले घटकों को छोड़ दिया जा सकता है), अंकीय वीडियो (जैसे MPEG और H.26X), डिजिटल ऑडियो (जैसे डॉल्बी डिजिटल , एमपी 3 और उन्नत ऑडियो कोडिंग ), अंकीय टेलीविजन (जैसे कि एसडीटीवी, एचडीटीवी और वीडियो ऑन डिमांड), डिजिटल रेडियो (जैसे AAC+ और डीएबी+), और स्पीच कोडिंग (जैसे एएसी-एलडी , सायरन (कोडेक) और ओपस (ऑडियो प्रारूप) )। डीसीटी विज्ञान और इंजीनियरिंग में कई अन्य अनुप्रयोगों के लिए भी महत्वपूर्ण हैं, जैसे कि अंकीय संकेत प्रक्रिया , दूरसंचार उपकरण, नेटवर्क बैंडविड्थ उपयोग को कम करना, और आंशिक अंतर समीकरणों के संख्यात्मक समाधान के लिए वर्णक्रमीय तरीके।

साइन फ़ंक्शंस के बजाय कोसाइन का उपयोग संपीड़न के लिए महत्वपूर्ण है, क्योंकि यह निकलता है (जैसा कि नीचे वर्णित है) कि कम कोसाइन फ़ंक्शंस को विशिष्ट सिग्नल (इलेक्ट्रिकल इंजीनियरिंग) को अनुमानित करने की आवश्यकता होती है, जबकि अंतर समीकरणों के लिए कोसाइन्स सीमा की विशेष पसंद व्यक्त करते हैं स्थितियाँ। विशेष रूप से, डीसीटी फूरियर-संबंधित रूपांतरण की सूची है। फूरियर-संबंधित ट्रांसफॉर्म असतत फूरियर रूपांतरण (डीएफटी) के समान है, लेकिन केवल वास्तविक संख्याओं का उपयोग कर रहा है। DCTs आम तौर पर समय -समय पर और सममित रूप से विस्तारित अनुक्रम के फूरियर श्रृंखला गुणांक से संबंधित होते हैं, जबकि DFTs केवल समय -समय पर विस्तारित अनुक्रमों के फूरियर श्रृंखला गुणांक से संबंधित हैं। डीसीटी लगभग दो बार की लंबाई के डीएफटी के बराबर हैं, यहां तक ​​कि विषम और विषम कार्यों के साथ वास्तविक डेटा पर काम करना समरूपता (चूंकि वास्तविक और यहां तक ​​कि फ़ंक्शन का फूरियर रूपांतरण वास्तविक और यहां तक ​​कि) है, जबकि कुछ वेरिएंट में इनपुट और/या आउटपुट डेटा हैं आधे नमूने द्वारा स्थानांतरित किया गया। आठ मानक डीसीटी वेरिएंट हैं, जिनमें से चार आम हैं।

असतत कोसाइन ट्रांसफॉर्म का सबसे आम संस्करण टाइप- II डीसीटी है, जिसे अक्सर केवल डीसीटी कहा जाता है। यह मूल डीसीटी था जैसा कि पहले अहमद द्वारा प्रस्तावित किया गया था। इसका उलटा, टाइप- III डीसीटी, समान रूप से अक्सर उलटा डीसीटी या आईडीसीटी कहा जाता है। दो संबंधित रूपांतरण असतत साइन परिवर्तन (डीएसटी) हैं, जो वास्तविक और विषम कार्यों के डीएफटी के बराबर है, और संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी), जो 'ओवरलैपिंग' 'के डीसीटी पर आधारित है। जानकारी। बहुआयामी DCT (MD DCT) को DCT की अवधारणा को MD संकेतों तक बढ़ाने के लिए विकसित किया जाता है। एमडी डीसीटी की गणना करने के लिए कई एल्गोरिदम हैं। डीसीटी को लागू करने की कम्प्यूटेशनल जटिलता को कम करने के लिए विभिन्न प्रकार के तेज एल्गोरिदम विकसित किए गए हैं। इनमें से पूर्णांक डीसीटी है (Intdct), मानक dct का पूर्णांक सन्निकटन, कई आईएसओ/आईईसी और आईटीयू-टी अंतर्राष्ट्रीय मानकों में उपयोग किया जाता है।

डीसीटी संपीड़न, जिसे ब्लॉक संपीड़न के रूप में भी जाना जाता है, असतत डीसीटी ब्लॉकों के सेट में डेटा को संपीड़ित करता है। DCT ब्लॉक में कई आकार हो सकते हैं, जिसमें मानक DCT के लिए 8x8 पिक्सेल शामिल हैं, और 4x4 और 32x32 पिक्सेल के बीच विभिन्न पूर्णांक DCT आकार। डीसीटी में मजबूत ऊर्जा संघनन संपत्ति है,  उच्च डेटा संपीड़न अनुपात में उच्च गुणवत्ता प्राप्त करने में सक्षम। हालांकि, ब्लॉकी संपीड़न कलाकृतियां तब दिखाई दे सकती हैं जब भारी डीसीटी संपीड़न लागू किया जाता है।

इतिहास
असतत कोसाइन ट्रांसफॉर्म (डीसीटी) को पहली बार एन। अहमद द्वारा कल्पना की गई थी, जबकि कैनसस स्टेट यूनिवर्सिटी में काम करते हुए, और उन्होंने 1972 में नेशनल साइंस फाउंडेशन को अवधारणा का प्रस्ताव दिया था। उन्होंने मूल रूप से छवि संपीड़न के लिए डीसीटी का इरादा किया था। अहमद ने 1973 में अर्लिंग्टन में टेक्सास विश्वविद्यालय में अपने पीएचडी छात्र टी। राज नटराजन और मित्र के। आर। राव के साथ व्यावहारिक डीसीटी एल्गोरिथ्म विकसित किया, और उन्होंने पाया कि यह छवि संपीड़न के लिए सबसे कुशल एल्गोरिथ्म था। उन्होंने जनवरी 1974 के पेपर में अपने परिणाम प्रस्तुत किए, जिसका शीर्षक असतत कोसाइन ट्रांसफॉर्म था।  यह वर्णित है कि अब टाइप- II DCT (DCT-II) कहा जाता है,  साथ ही टाइप- III उलटा DCT (IDCT)। यह बेंचमार्क प्रकाशन था,  और इसके प्रकाशन के बाद से हजारों कार्यों में मौलिक विकास के रूप में उद्धृत किया गया है। डीसीटी के विकास के लिए बुनियादी शोध कार्य और घटनाओं को अहमद द्वारा बाद के प्रकाशन में संक्षेप में प्रस्तुत किया गया था, मैं असतत कोसाइन ट्रांसफॉर्म के साथ कैसे आया।

1974 में इसकी शुरुआत के बाद से, डीसीटी पर महत्वपूर्ण शोध हुआ है। 1977 में, वेन-हसुंग चेन ने सी। हैरिसन स्मिथ और स्टेनली सी। फ्रालिक के साथ पेपर प्रकाशित किया, जिसमें फास्ट डीसीटी एल्गोरिथ्म प्रस्तुत किया गया था। आगे के घटनाक्रम में एम.जे. नरसिम्हा और ए.एम. द्वारा 1978 का पेपर शामिल है।पीटरसन, और 1984 का पेपर बी.जी.ली। इन शोध पत्रों, मूल 1974 अहमद पेपर और 1977 चेन पेपर के साथ, संयुक्त फोटोग्राफिक विशेषज्ञों के समूह द्वारा 1992 में जेपीईजी के हानि छवि संपीड़न एल्गोरिथ्म के आधार के रूप में उद्धृत किया गया था। 1975 में, जॉन ए। रोज़े और गनर एस। रॉबिन्सन ने अंतर-फ्रेम मोशन मुआवजे के लिए डीसीटी को अनुकूलित किया। मोशन-कॉम्पेन्सेटेड वीडियो कोडिंग।उन्होंने डीसीटी और फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के साथ प्रयोग किया, दोनों के लिए इंटर-फ्रेम हाइब्रिड कोडर को विकसित किया, और पाया कि डीसीटी इसकी कम जटिलता के कारण सबसे अधिक कुशल है, जो प्रति पिक्सेल प्रति पिक्सेल के लिए छवि डेटा को संपीड़ित करने में सक्षम हैइंट्रा-फ्रेम कोडर की तुलना में छवि गुणवत्ता के साथ वीडियोटेलेफोन दृश्य के लिए प्रति पिक्सेल 2- काटा की आवश्यकता होती है। 1979 में, अनिल के। जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) | अनिल के। जैन और जसवंत आर। जैन ने मोशन-कॉम्पेन्सेटेड डीसीटी वीडियो संपीड़न को और विकसित किया, जिसे ब्लॉक मोशन मुआवजा भी कहा जाता है। इसने चेन को व्यावहारिक वीडियो संपीड़न एल्गोरिथ्म विकसित करने के लिए प्रेरित किया, जिसे 1981 में मोशन-काउंसिलेटेड डीसीटी या एडेप्टिव सीन कोडिंग कहा जाता था। मोशन-मुआवजा डीसीटी बाद में 1980 के दशक के उत्तरार्ध से वीडियो संपीड़न के लिए मानक कोडिंग तकनीक बन गया। पूर्णांक DCT का उपयोग उन्नत वीडियो कोडिंग (AVC) में किया जाता है, 2003 में पेश किया गया, और उच्च दक्षता वीडियो कोडिंग (HEVC), 2013 में पेश किया गया। पूर्णांक DCT का उपयोग उच्च दक्षता छवि प्रारूप (HEIF) में भी किया जाता है, जो अभी भी छवियों को कोडिंग के लिए HEVC वीडियो कोडिंग प्रारूप के सबसेट का उपयोग करता है।

एक डीसीटी संस्करण, संशोधित असतत कोसाइन ट्रांसफॉर्म (एमडीसीटी), जॉन पी। प्रिंसेन, ए.डब्ल्यू द्वारा विकसित किया गया था।1987 में सरे विश्वविद्यालय में जॉनसन और एलन बी। ब्रैडली, 1986 में प्रिंसन और ब्रैडली द्वारा पहले के काम के बाद। एमडीसीटी का उपयोग अधिकांश आधुनिक ऑडियो संपीड़न (डेटा) प्रारूपों में किया जाता है, जैसे कि डॉल्बी डिजिटल (एसी -3), एमपी 3 (जो हाइब्रिड डीसीटी-फास्ट फूरियर ट्रांसफॉर्म एल्गोरिथ्म का उपयोग करता है), उन्नत ऑडियो कोडिंग (एएसी), और वोरबिस (ओजीजी)।

असतत साइन ट्रांसफॉर्म (डीएसटी) डीसीटी से प्राप्त किया गया था, डिरिचलेट स्थिति के साथ x = 0 पर न्यूमैन सीमा स्थिति को बदलकर। डीएसटी का वर्णन 1974 के डीसीटी पेपर में अहमद, नटराजन और राव द्वारा किया गया था। एक टाइप-आई डीएसटी (डीएसटी-आई) को बाद में अनिल के। जैन (इलेक्ट्रिकल इंजीनियर, जन्म 1946) द्वारा वर्णित किया गया था। 1976 में अनिल के। जैन, और टाइप- II डीएसटी (डीएसटी- II) को तब एच.बी.केकरा और जे.के.1978 में सोलंका। नासिर अहमद ने 1995 में न्यू मैक्सिको विश्वविद्यालय में गिरिधर मंडम और नीरज मैगोट्रा के साथ दोषरहित डीसीटी एल्गोरिथ्म भी विकसित किया। यह डीसीटी तकनीक को छवियों के दोषरहित संपीड़न के लिए उपयोग करने की अनुमति देता है।यह मूल डीसीटी एल्गोरिथ्म का संशोधन है, और इसमें व्युत्क्रम डीसीटी और डेल्टा मॉड्यूलेशन के तत्व शामिल हैं।यह एन्ट्रॉपी कोडन की तुलना में अधिक प्रभावी दोषरहित संपीड़न एल्गोरिथ्म है। दोषरहित DCT को LDCT के रूप में भी जाना जाता है।

अनुप्रयोग
DCT सिग्नल प्रोसेसिंग में सबसे व्यापक रूप से उपयोग की जाने वाली परिवर्तन तकनीक है, और अब तक डेटा संपीड़न में सबसे व्यापक रूप से इस्तेमाल किया जाने वाला रैखिक रूपांतरण। असम्पीडित डिजिटल मीडिया के साथ -साथ दोषरहित संपीड़न में अव्यावहारिक रूप से उच्च स्मृति और बैंडविड्थ (कम्प्यूटिंग) आवश्यकताएं थीं, जो अत्यधिक कुशल डीसीटी हानि संपीड़न तकनीक द्वारा काफी कम हो गई थी, 8: 1 से 14: 1 तक डेटा संपीड़न अनुपात प्राप्त करने में सक्षम,-स्टूडियो-गुणवत्ता के लिए, स्वीकार्य-गुणवत्ता वाली सामग्री के लिए 100: 1 तक। डिजिटल मीडिया प्रौद्योगिकियों, जैसे डिजिटल छवियों, डिजिटल फोटो, में dct संपीड़न मानकों का उपयोग किया जाता है डिजिटल वीडियो,  स्ट्रीमिंग मीडिया, डिजिटल टेलीविजन, स्ट्रीमिंग टेलीविजन, वीडियो-ऑन-डिमांड (VOD),  अंकीय सिनेमा ,  उच्च-परिभाषा वीडियो (एचडी वीडियो), और उच्च-परिभाषा टेलीविजन (एचडीटीवी)। DCT, और विशेष रूप से DCT-II, अक्सर सिग्नल और इमेज प्रोसेसिंग में उपयोग किया जाता है, विशेष रूप से हानिपूर्ण संपीड़न के लिए, क्योंकि इसमें मजबूत ऊर्जा संघनन संपत्ति होती है: विशिष्ट अनुप्रयोगों में, अधिकांश सिग्नल जानकारी डीसीटी के कुछ कम-आवृत्ति घटकों में केंद्रित होती है।दृढ़ता से सहसंबद्ध मार्कोव प्रक्रियाओं के लिए, डीसीटी करहुनेन-लोवे ट्रांसफॉर्म (जो कि डिकोरलेशन सेंस में इष्टतम है) की संघनन दक्षता से संपर्क कर सकता है।जैसा कि नीचे बताया गया है, यह कोसाइन कार्यों में निहित सीमा स्थितियों से उपजा है।

डीसीटी को स्पेक्ट्रल विधियों द्वारा आंशिक अंतर समीकरणों को हल करने में व्यापक रूप से नियोजित किया जाता है, जहां डीसीटी के विभिन्न वेरिएंट सरणी के दो छोरों पर थोड़ा अलग/विषम सीमा स्थितियों के अनुरूप होते हैं।

DCTs Chebyshev Polynomials से भी निकटता से संबंधित हैं, और FAST DCT एल्गोरिदम (नीचे) का उपयोग Chebyshev Polynomials की श्रृंखला द्वारा मनमाना कार्यों के Chebyshev सन्निकटन में किया जाता है, उदाहरण के लिए Clenshaw -Curtis Quadrature में।

डीसीटी मल्टीमीडिया दूरसंचार उपकरणों के लिए कोडिंग मानक है।यह व्यापक रूप से बिट दर में कमी के लिए उपयोग किया जाता है, और नेटवर्क बैंडविड्थ उपयोग को कम करने के लिए। डीसीटी संपीड़न डिजिटल संकेतों के लिए आवश्यक मेमोरी और बैंडविड्थ की मात्रा को काफी कम कर देता है।

सामान्य अनुप्रयोग
डीसीटी का व्यापक रूप से कई अनुप्रयोगों में उपयोग किया जाता है, जिसमें निम्नलिखित शामिल हैं।

• Audio signal processing — audio coding, audio data compression (lossy and lossless), surround sound, acoustic echo and feedback cancellation, phoneme recognition, time-domain aliasing cancellation (TDAC)

• *Digital audio

• *Digital radio — Digital Audio Broadcasting (DAB+), HD Radio

• *Speech processing — speech coding speech recognition, voice activity detection (VAD)

• *Digital telephony — voice-over-IP (VoIP), mobile telephony, video telephony, teleconferencing, videoconferencing

• Biometrics — fingerprint orientation, facial recognition systems, biometric watermarking, fingerprint-based biometric watermarking, palm print identification/recognition

• *Face detection — facial recognition

• Computers and the Internet — the World Wide Web, social media, Internet video

• *Network bandwidth usage reducation

• Consumer electronics — multimedia systems, multimedia telecommunication devices, consumer devices

• Cryptography — encryption, steganography, copyright protection

• Data compression — transform coding, lossy compression, lossless compression

• *Encoding operations — quantization, perceptual weighting, entropy encoding, variable encoding

• Digital media — digital distribution

• *Streaming media — streaming audio, streaming video, streaming television, video-on-demand (VOD)

• Forgery detection

• Geophysical transient electromagnetics (transient EM)

• Images — artist identification, focus and blurriness measure, feature extraction

• *Color formatting — formatting luminance and color differences, color formats (such as YUV444 and YUV411), decoding operations such as the inverse operation between display color formats (YIQ, YUV, RGB)

• *Digital imaging — digital images, digital cameras, digital photography, high-dynamic-range imaging (HDR imaging)

• *Image compression — image file formats, multiview image compression, progressive image transmission

• *Image processing — digital image processing, image analysis, content-based image retrieval, corner detection, directional block-wise image representation, edge detection, image enhancement, image fusion, image segmentation, interpolation, image noise level estimation, mirroring, rotation, just-noticeable distortion (JND) profile, spatiotemporal masking effects, foveated imaging

• *Image quality assessment — DCT-based quality degradation metric (DCT QM)

• *Image reconstruction — directional textures auto inspection, image restoration, inpainting, visual recovery

• Medical technology

• *Electrocardiography (ECG) — vectorcardiography (VCG)

• *Medical imaging — medical image compression, image fusion, watermarking, brain tumor compression classification

• Pattern recognition

• Region of interest (ROI) extraction

• Signal processing — digital signal processing, digital signal processors (DSP), DSP software, multiplexing, signaling, control signals, analog-to-digital conversion (ADC), compressive sampling, DCT pyramid error concealment, downsampling, upsampling, signal-to-noise ratio (SNR) estimation, transmux, Wiener filter

• *Complex cepstrum feature analysis

• *DCT filtering

• Surveillance

• Vehicular black box camera

• Video

• *Digital cinema — digital cinematography, digital movie cameras, video editing, film editing, Dolby Digital audio

• *Digital television (DTV) — digital television broadcasting, standard-definition television (SDTV), high-definition TV (HDTV), HDTV encoder/decoder chips, ultra HDTV (UHDTV)

• *Digital video — digital versatile disc (DVD), high-definition (HD) video

• *Video coding — video compression, video coding standards, motion estimation, motion compensation, inter-frame prediction, motion vectors, 3D video coding, local distortion detection probability (LDDP) model, moving object detection, Multiview Video Coding (MVC)

• *Video processing — motion analysis, 3D-DCT motion analysis, video content analysis, data extraction, video browsing, professional video production

• Watermarking — digital watermarking, image watermarking, video watermarking, 3D video watermarking, reversible data hiding, watermarking detection

• Wireless technology

• *Mobile devices — mobile phones, smartphones, videophones

• *Radio frequency (RF) technology — RF engineering, aperture arrays, beamforming, digital arithmetic circuits, directional sensing, space imaging

• Wireless sensor network (WSN) — wireless acoustic sensor networks

डीसीटी दृश्य मीडिया मानक
DCT-II, जिसे केवल DCT के रूप में भी जाना जाता है, सबसे महत्वपूर्ण छवि संपीड़न तकनीक है। इसका उपयोग छवि संपीड़न मानकों जैसे कि JPEG, और वीडियो संपीड़न मानकों जैसे H.26X, MJPEG, MPEG, DV , Theora और Daala में किया जाता है।वहाँ, दो-आयामी DCT-II $$N \times N$$ ब्लॉक की गणना की जाती है और परिणाम परिमाणीकरण (सिग्नल प्रोसेसिंग) और एन्ट्रॉपी एन्कोडिंग हैं।इस मामले में, $$N$$ आम तौर पर 8 है और DCT-II फॉर्मूला ब्लॉक के प्रत्येक पंक्ति और कॉलम पर लागू होता है।परिणाम 8 × 8 ट्रांसफ़ॉर्मिक गुणांक सरणी है जिसमें $$(0,0)$$ तत्व (टॉप-लेफ्ट) डीसी (शून्य-आवृत्ति) घटक है और बढ़ते ऊर्ध्वाधर और क्षैतिज सूचकांक मूल्यों के साथ प्रविष्टियां उच्च ऊर्ध्वाधर और क्षैतिज स्थानिक आवृत्तियों का प्रतिनिधित्व करती हैं।

उन्नत वीडियो कोडिंग (AVC) पूर्णांक DCT का उपयोग करता है (INTDCT), DCT का पूर्णांक सन्निकटन।  यह 4x4 और 8x8 पूर्णांक DCT ब्लॉक का उपयोग करता है।उच्च दक्षता वीडियो कोडिंग (HEVC) और उच्च दक्षता छवि प्रारूप (HEIF) 4x4 और 32x32 पिक्सेल के बीच विभिन्न पूर्णांक DCT ब्लॉक आकार का उपयोग करते हैं। , AVC अब तक वीडियो सामग्री के रिकॉर्डिंग, संपीड़न और वितरण के लिए सबसे अधिक इस्तेमाल किया जाने वाला प्रारूप है, जिसका उपयोग 91% वीडियो डेवलपर्स द्वारा किया जाता है, इसके बाद HEVC का उपयोग 43% डेवलपर्स द्वारा किया जाता है।

एमडी डीसीटी
बहुआयामी DCTs (MD DCTs) में कई अनुप्रयोग हैं, मुख्य रूप से 3-D DCT जैसे 3-D DCT-II, जिसमें कई नए एप्लिकेशन हैं जैसे हाइपरस्पेक्ट्रल इमेजिंग कोडिंग सिस्टम, परिवर्तनीय अस्थायी लंबाई 3-डी डीसीटी कोडिंग, वीडियो कोडिंग (डाक बाजार) एल्गोरिदम, अनुकूली वीडियो कोडिंग और 3-डी संपीड़न। हार्डवेयर, सॉफ्टवेयर और कई फास्ट एल्गोरिदम के परिचय में वृद्धि के कारण, एम-डी डीसीटी का उपयोग करने की आवश्यकता तेजी से बढ़ रही है।DCT-IV ने वास्तविक-मूल्य वाले पॉलीफेज़ फ़िल्टरिंग बैंकों के तेजी से कार्यान्वयन में अपने अनुप्रयोगों के लिए लोकप्रियता हासिल की है, लैप्ड ऑर्थोगोनल ट्रांसफॉर्म और कोसाइन-मॉड्यूलेटेड वेवलेट बेस।

डिजिटल सिग्नल प्रोसेसिंग
डिजिटल सिग्नल प्रोसेसिंग में डीसीटी बहुत महत्वपूर्ण भूमिका निभाता है।डीसीटी का उपयोग करके, संकेतों को संपीड़ित किया जा सकता है।डीसीटी का उपयोग ईसीजी संकेतों के संपीड़न के लिए विद्युतहृद्लेख में किया जा सकता है।DCT2 DCT की तुलना में बेहतर संपीड़न अनुपात प्रदान करता है।

DCT को व्यापक रूप से अंकीय सिग्नल प्रोसेसर (DSP), साथ ही डिजिटल सिग्नल प्रोसेसिंग सॉफ्टवेयर में लागू किया जाता है।कई कंपनियों ने DCT प्रौद्योगिकी के आधार पर DSPs विकसित किए हैं।डीसीटी व्यापक रूप से एन्कोडिंग, डिकोडिंग, वीडियो, ऑडियो, मल्टीप्लेक्सिंग, कंट्रोल सिग्नल, सिग्नलिंग और एनालॉग-टू-डिजिटल रूपांतरण जैसे अनुप्रयोगों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग आमतौर पर उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर एकीकृत सर्किट के लिए भी किया जाता है।

संपीड़न कलाकृतियाँ
डिजिटल मीडिया में डीसीटी संपीड़न के साथ सामान्य मुद्दा ब्लॉकी संपीड़न कलाकृतियां हैं, DCT ब्लॉकों के कारण। जब भारी संपीड़न लागू किया जाता है तो डीसीटी एल्गोरिथ्म ब्लॉक-आधारित कलाकृतियों का कारण बन सकता है।डिजिटल छवि और वीडियो कोडिंग मानकों (जैसे कि JPEG, H.26X और MPEG प्रारूप) के बहुमत में DCT का उपयोग किया जा रहा है, DCT- आधारित ब्लॉकी संपीड़न कलाकृतियां डिजिटल मीडिया में व्यापक हैं।एक डीसीटी एल्गोरिथ्म में, छवि (या छवि अनुक्रम में फ्रेम) को वर्ग ब्लॉकों में विभाजित किया जाता है जो दूसरे से स्वतंत्र रूप से संसाधित होते हैं, फिर इन ब्लॉकों के डीसीटी को लिया जाता है, और परिणामस्वरूप डीसीटी गुणांक परिमाणीकरण (सिग्नल प्रोसेसिंग) होते हैं।यह प्रक्रिया मुख्य रूप से उच्च डेटा संपीड़न अनुपात में कलाकृतियों को अवरुद्ध करने का कारण बन सकती है। यह मच्छर शोर प्रभाव का कारण भी बन सकता है, आमतौर पर डिजिटल वीडियो (जैसे कि एमपीईजी प्रारूप) में पाया जाता है। डीसीटी ब्लॉक का उपयोग अक्सर भूतल कला में किया जाता है। कलाकार रोजा मेन्कमैन अपनी गड़बड़ कला में डीसीटी-आधारित संपीड़न कलाकृतियों का उपयोग करता है, विशेष रूप से डीसीटी ब्लॉक अधिकांश डिजिटल मीडिया प्रारूपों में पाए गए जैसे कि जेपीईजी डिजिटल इमेज और एमपी 3 डिजिटल ऑडियो। एक अन्य उदाहरण जर्मन फोटोग्राफर थॉमस रफ द्वारा JPEGs है, जो चित्र की शैली के आधार के रूप में जानबूझकर JPEG कलाकृतियों का उपयोग करता है।

अनौपचारिक अवलोकन
किसी भी फूरियर-संबंधित रूपांतरण की तरह, असतत कोसाइन ट्रांसफॉर्म (डीसीटी) अलग-अलग आवृत्तियों और आयाम ों के साथ साइनसोइड्स के योग के संदर्भ में फ़ंक्शन या संकेत व्यक्त करता है।असतत फूरियर ट्रांसफॉर्म (DFT) की तरह, DCT असतत डेटा बिंदुओं की परिमित संख्या में फ़ंक्शन पर संचालित होता है।एक डीसीटी और डीएफटी के बीच स्पष्ट अंतर यह है कि पूर्व केवल कोसाइन कार्यों का उपयोग करता है, जबकि उत्तरार्द्ध दोनों कोसाइन और साइन ( जटिल घातांक के रूप में) दोनों का उपयोग करता है।हालांकि, यह दृश्य अंतर केवल गहरे अंतर का परिणाम है: डीसीटी का तात्पर्य डीएफटी या अन्य संबंधित परिवर्तनों से अलग -अलग सीमा स्थितियों से है।

फूरियर-संबंधित रूपांतरण जो किसी फ़ंक्शन के परिमित फ़ंक्शन का डोमेन पर काम करते हैं, जैसे कि DFT या DCT या फूरियर श्रृंखला, को डोमेन के बाहर उस फ़ंक्शन के विस्तार को स्पष्ट रूप से परिभाषित करने के रूप में सोचा जा सकता है।वह है, बार जब आप फ़ंक्शन लिखते हैं $$f(x)$$ साइनसोइड्स के योग के रूप में, आप उस राशि का मूल्यांकन किसी भी पर कर सकते हैं $$x$$, यहां तक ​​के लिए $$x$$ जहां मूल $$f(x)$$ निर्दिष्ट नहीं था।डीएफटी, फूरियर श्रृंखला की तरह, मूल फ़ंक्शन के आवधिक फ़ंक्शन विस्तार का अर्थ है।एक डीसीटी, जैसे साइन और कोसाइन बदल जाता है, मूल फ़ंक्शन के सम और विषम कार्यों के विस्तार का अर्थ है।

हालांकि, क्योंकि डीसीटी परिमित, असतत अनुक्रमों पर काम करते हैं, दो मुद्दे उत्पन्न होते हैं जो निरंतर कोसाइन ट्रांसफ़ॉर्म के लिए लागू नहीं होते हैं। सबसे पहले, किसी को यह निर्दिष्ट करना होगा कि क्या फ़ंक्शन डोमेन के बाएं और दाएं दोनों सीमाओं पर भी या विषम है (यानी नीचे दी गई परिभाषाओं में मिन-एन और मैक्स-एन सीमाएं)। दूसरा, किसी को यह निर्दिष्ट करना होगा कि फ़ंक्शन किस बिंदु पर या विषम है। विशेष रूप से, चार समान रूप से स्पेस किए गए डेटा बिंदुओं के अनुक्रम एबीसीडी पर विचार करें, और कहते हैं कि हम बाईं सीमा भी निर्दिष्ट करते हैं। दो समझदार संभावनाएं हैं: या तो डेटा नमूना ए के बारे में भी हैं, जिस स्थिति में भी विस्तार DCBABCD है, या डेटा A और पिछले बिंदु के बीच बिंदु आधे रास्ते के बारे में भी है, इस मामले में भी विस्तार DCBAABCD है ( A को दोहराया जाता है)।

ये विकल्प डीसीटी के सभी मानक विविधताओं को जन्म देते हैं और साइन ट्रांसफॉर्म (डीएसटीएस) को भी असतत करते हैं। प्रत्येक सीमा या तो भी या विषम हो सकती है (प्रति सीमा 2 विकल्प) और दो डेटा बिंदुओं (प्रति सीमा 2 विकल्प) के बीच डेटा बिंदु या बिंदु आधे रास्ते के बारे में सममित हो सकती है, कुल 2 × 2 × 2 × 2 = 16 के लिए। संभावनाएं। इन संभावनाओं में से आधे, वे जहां बाईं सीमा भी है, डीसीटी के 8 प्रकार के अनुरूप है; अन्य आधे 8 प्रकार के डीएसटी हैं।

ये विभिन्न सीमा स्थितियां परिवर्तन के अनुप्रयोगों को दृढ़ता से प्रभावित करती हैं और विभिन्न डीसीटी प्रकारों के लिए विशिष्ट रूप से उपयोगी गुणों को ले जाती हैं। सबसे सीधे, जब वर्णक्रमीय तरीकों से आंशिक अंतर समीकरणों को हल करने के लिए फूरियर-संबंधित रूपांतरण का उपयोग करते हैं, तो सीमा की स्थिति को सीधे समस्या के भाग के रूप में निर्दिष्ट किया जाता है। या, संशोधित असतत कोसाइन ट्रांसफॉर्म (टाइप-आईवी डीसीटी के आधार पर) के लिए, सीमा की स्थिति एमडीसीटी की महत्वपूर्ण संपत्ति में समय-डोमेन अलियासिंग रद्दीकरण की महत्वपूर्ण संपत्ति में शामिल है। अधिक सूक्ष्म फैशन में, सीमा की स्थिति ऊर्जा कॉम्पैक्टिफिकेशन गुणों के लिए जिम्मेदार होती है जो डीसीटी को छवि और ऑडियो संपीड़न के लिए उपयोगी बनाते हैं, क्योंकि सीमाएं किसी भी फूरियर जैसी श्रृंखला के अभिसरण की दर को प्रभावित करती हैं।

विशेष रूप से, यह सर्वविदित है कि फ़ंक्शन में असंतोष का कोई भी वर्गीकरण फूरियर श्रृंखला के अभिसरण की दर को कम करता है, ताकि किसी दिए गए सटीकता के साथ फ़ंक्शन का प्रतिनिधित्व करने के लिए अधिक साइनसोइड की आवश्यकता हो। ही सिद्धांत सिग्नल संपीड़न के लिए डीएफटी और अन्य रूपांतरण की उपयोगिता को नियंत्रित करता है; फ़ंक्शन चिकनी है, इसके DFT या DCT में कम शर्तों को इसका सटीक रूप से प्रतिनिधित्व करने की आवश्यकता होती है, और जितना अधिक इसे संकुचित किया जा सकता है। (यहां, हम डीएफटी या डीसीटी को फ़ंक्शन की फूरियर सीरीज़ या कोसाइन श्रृंखला के लिए क्रमशः अनुमान के रूप में सोचते हैं, ताकि इसकी चिकनाई के बारे में बात की जा सके।) हालांकि, डीएफटी की अंतर्निहित आवधिकता का मतलब है कि डिसकंटिनिटी आमतौर पर सीमाओं पर होती हैं। : सिग्नल के किसी भी यादृच्छिक खंड को बाएं और दाएं दोनों सीमाओं पर समान मूल्य होने की संभावना नहीं है। (डीएसटी के लिए समान समस्या उत्पन्न होती है, जिसमें विषम वाम सीमा की स्थिति किसी भी फ़ंक्शन के लिए असंतोष का अर्थ है जो उस सीमा पर शून्य नहीं होता है।) इसके विपरीत, डीसीटी जहां दोनों सीमाएं हमेशा निरंतर विस्तार करती हैं। सीमाएं (हालांकि ढलान आम तौर पर असंतोष है)। यही कारण है कि DCTs, और विशेष रूप से I, II, V, और VI के प्रकारों के DCTs (जिन प्रकारों में दो भी सीमाएँ हैं) आमतौर पर DFTs और DSTS की तुलना में सिग्नल संपीड़न के लिए बेहतर प्रदर्शन करती हैं। व्यवहार में, टाइप- II डीसीटी आमतौर पर ऐसे अनुप्रयोगों के लिए पसंद किया जाता है, कम्प्यूटेशनल सुविधा के कारणों में।

औपचारिक परिभाषा
औपचारिक रूप से, असतत कोसाइन परिवर्तन रैखिक, उल्टा कार्य (गणित) है $$ f : \R^{N} \to \R^{N} $$ (कहाँ पे $$ \R$$ वास्तविक संख्याओं के सेट को दर्शाता है), या बराबर रूप से उल्टा $N$ × $N$ स्क्वायर मैट्रिक्स।थोड़ी संशोधित परिभाषाओं के साथ डीसीटी के कई वेरिएंट हैं। $N$ }} वास्तविक संख्या $$~ x_0,\ \ldots\ x_{N - 1} ~$$ में तब्दील हो गए हैं $N$ वास्तविक संख्या $$ X_0,\, \ldots,\, X_{N - 1} $$ सूत्रों में से के अनुसार:

dct-i

 * $$X_k

= \frac{1}{2} (x_0 + (-1)^k x_{N-1}) + \sum_{n=1}^{N-2} x_n \cos \left[\, \frac{\pi}{\,N-1\,} \, n \, k \,\right] \qquad \text{ for } ~ k = 0,\ \ldots\ N-1 ~.$$ कुछ लेखक आगे गुणा करते हैं $$x_0 $$ तथा $$ x_{N-1} $$ द्वारा $$ \sqrt{2\,}\, ,$$ और इसी तरह से गुणा करें $$ X_0 $$ तथा $$ X_{N-1}$$ द्वारा $$ 1/\sqrt{2\,} \,,$$ जो DCT-I मैट्रिक्स ऑर्थोगोनल मैट्रिक्स बनाता है, यदि कोई आगे समग्र पैमाने के कारक से गुणा करता है $$ \sqrt{\tfrac{2}{N-1\,}\,} ,$$ लेकिन रियल-ईवन असतत फूरियर ट्रांसफॉर्म के साथ प्रत्यक्ष पत्राचार को तोड़ता है।

DCT-I बिल्कुल समान है (2 के समग्र पैमाने के कारक तक), असतत फूरियर रूपांतरण के लिए $$ 2(N-1) $$ समरूपता के साथ वास्तविक संख्या भी।उदाहरण के लिए, dct-i $$N = 5 $$ वास्तविक संख्या $$ a\ b\ c\ d\ e $$ आठ वास्तविक संख्याओं के डीएफटी के बराबर है $ a\ b\ c\ d\ e\ d\ c\ b $ (यहां तक कि समरूपता), दो से विभाजित।(इसके विपरीत, DCT प्रकार II-IV में समतुल्य DFT में आधा नमूना शिफ्ट शामिल है।)

ध्यान दें, हालांकि, कि DCT-I के लिए परिभाषित नहीं है $$ N $$ 2 से कम, जबकि अन्य सभी डीसीटी प्रकार किसी भी सकारात्मक के लिए परिभाषित किए गए हैं $$ N .$$ इस प्रकार, DCT-I सीमा स्थितियों से मेल खाती है: $$ x_n $$ यहां तक कि चारों ओर है $$ n = 0 $$ और यहां तक कि चारों ओर $$ n = N - 1 $$;इसी तरह के लिए $$ X_k .$$

DCT-II

 * इसका$$X_k =

\sum_{n=0}^{N-1} x_n \cos \left[\, \tfrac{\,\pi\,}{N} \left( n + \frac{1}{2} \right) k \, \right] \qquad \text{ for } ~ k = 0,\ \dots\ N-1 ~.$$ DCT-II शायद सबसे अधिक इस्तेमाल किया जाने वाला रूप है, और अक्सर इसे केवल DCT के रूप में संदर्भित किया जाता है।

यह रूपांतरण बिल्कुल समतुल्य है (2 के समग्र पैमाने के कारक तक) असतत फूरियर ट्रांसफॉर्म के लिए $$4N$$ समरूपता के वास्तविक इनपुट जहां समरूपता वाले तत्व शून्य हैं।यही है, यह असतत फूरियर परिवर्तन का आधा है $$4N$$ आदानों $$ y_n ,$$ कहाँ पे $$ y_{2n} = 0 ,$$ $$ y_{2n+1} = x_n $$ के लिये $$ 0 \leq n < N ,$$ $$ y_{2N} = 0 ,$$ तथा $$ y_{4N-n} = y_n $$ के लिये $$ 0 < n < 2N .$$ DCT-II परिवर्तन भी 2 का उपयोग करके संभव है$N$ सिग्नल के बाद आधी पारी से गुणा किया जाता है।यह जॉन मखौल द्वारा प्रदर्शित किया गया है।

कुछ लेखक आगे गुणा करते हैं $$ X_0 $$ के द्वारा $$ 1/\sqrt{2\,} \, .$$ और परिणामी मैट्रिक्स को समग्र पैमाने के कारक द्वारा गुणा करें $\sqrt{{2}/{N}}$ (DCT-III में संबंधित परिवर्तन के लिए नीचे देखें)।यह DCT-II मैट्रिक्स ऑर्थोगोनल मैट्रिक्स बनाता है, लेकिन आधे-शिफ्ट किए गए इनपुट के वास्तविक-ईवन असतत फूरियर रूपांतरण के साथ प्रत्यक्ष पत्राचार को तोड़ता है।यह MATLAB द्वारा उपयोग किया जाने वाला सामान्यीकरण है, उदाहरण के लिए, देखें। कई अनुप्रयोगों में, जैसे कि JPEG, स्केलिंग मनमानी है क्योंकि पैमाने के कारकों को बाद के कम्प्यूटेशनल चरण (जैसे कि JPEG में परिमाणीकरण (सिग्नल प्रोसेसिंग) चरण के साथ जोड़ा जा सकता है ), और स्केलिंग को चुना जा सकता है जो डीसीटी को कम गुणन के साथ गणना करने की अनुमति देता है। DCT-II का तात्पर्य सीमा की स्थिति है: $$ x_n $$ यहां तक कि चारों ओर है $$ n = -1/2 $$ और यहां तक कि चारों ओर $$ n = N - 1/2 \,;$$ $$ X_k $$ यहां तक कि चारों ओर है $$ k = 0 $$ और चारों ओर अजीब $$ k = N .$$

DCT-3

 * $$ X_k =

{1}/{2} x_0 + \sum_{n=1}^{N-1} x_n \cos \left[\, \tfrac{\,\pi\,}{N} \left( k + \frac{1}{2} \right) n \,\right] \qquad \text{ for } ~ k = 0,\ \dots\ N-1 ~.$$ क्योंकि यह DCT-II (एक स्केल फैक्टर तक, नीचे देखें) का व्युत्क्रम है, इस फॉर्म को कभी-कभी उलटा DCT (IDCT) के रूप में संदर्भित किया जाता है।

कुछ लेखक विभाजित करते हैं $$~ x_0 ~$$ के द्वारा $$ \sqrt{2\,} $$ 2 के बजाय (एक समग्र के परिणामस्वरूप $$ x_0/\sqrt{2\,} $$ शब्द) और परिणामी मैट्रिक्स को समग्र पैमाने के कारक से गुणा करें $ \sqrt{ {2}/{N} \,} $ (DCT-II में संबंधित परिवर्तन के लिए ऊपर देखें), ताकि DCT-II और DCT-III दूसरे के ट्रांसपोज़ हो।यह DCT-III मैट्रिक्स ऑर्थोगोनल मैट्रिक्स बनाता है, लेकिन आधे-शिफ्ट किए गए आउटपुट के रियल-भी असतत फूरियर ट्रांसफ़ॉर्म के साथ प्रत्यक्ष पत्राचार को तोड़ता है।

DCT-III का अर्थ है सीमा की स्थिति: $$ x_n $$ यहां तक कि चारों ओर है $$ n = 0 $$ और चारों ओर अजीब $$ n = N ;$$ $$ X_k $$ यहां तक कि चारों ओर है $$ k = -{1}/{2} $$ और यहां तक कि चारों ओर $$ k = N - {1}/{2}.$$

DCT-IV

 * $$ X_k =

\sum_{n=0}^{N-1} x_n \cos \left[\, \tfrac{\,\pi\,}{N} \, \left( n + \frac{1}{2} \right) \left( k + \frac{1}{2} \right) \,\right] \qquad \text{ for } ~ k = 0,\ \ldots\ N-1 ~.$$ DCT-IV मैट्रिक्स ऑर्थोगोनल मैट्रिक्स बन जाता है (और इस प्रकार, स्पष्ट रूप से सममित होने के नाते, अपना स्वयं का व्युत्क्रम) यदि कोई आगे समग्र पैमाने के कारक से गुणा करता है $ \sqrt{2/N\,} .$ DCT-IV का प्रकार, जहां विभिन्न परिवर्तनों के डेटा को ओवरलैप किया जाता है, को संशोधित असतत कोसाइन ट्रांसफॉर्म (MDCT) कहा जाता है। DCT-IV का तात्पर्य सीमा की स्थिति है: $$ x_n $$ यहां तक कि चारों ओर है $$ n = -{1}/{2} $$ और चारों ओर अजीब $$ n = N - {1}/{2} ;$$ इसी तरह के लिए $$ X_k .$$

DCT V-VIII
I -IV प्रकारों के DCTs समरूपता के बिंदु के बारे में लगातार दोनों सीमाओं का इलाज करते हैं: वे दोनों सीमाओं के लिए दोनों सीमाओं के लिए या दोनों सीमाओं के लिए दो डेटा बिंदुओं के बीच डेटा बिंदु के आसपास भी/विषम हैं।इसके विपरीत, प्रकार V-VIII के DCTs की सीमाएं हैं जो सीमा के लिए डेटा बिंदु के आसपास और अन्य सीमा के लिए दो डेटा बिंदुओं के बीच आधे रास्ते के आसपास भी/विषम हैं।

दूसरे शब्दों में, DCT प्रकार I-IV रियल-यहां तक कि असतत फूरियर के बराबर हैं, यहां तक कि आदेश (चाहे $$ N $$ और भी विषम है), चूंकि संबंधित डीएफटी लंबाई का है $$ 2(N-1) $$ (dct-i के लिए) या $$ 4 N $$ (DCT-II और III के लिए) या $$ 8 N $$ (DCT-IV के लिए)।चार अतिरिक्त प्रकार के असतत कोसाइन रूपांतरण अनिवार्य रूप से तार्किक रूप से विषम क्रम के वास्तविक-यहां तक कि dfts के अनुरूप, जिनके कारक हैं $$ N \pm {1}/{2} $$ कोसाइन तर्कों के भाजक में।

हालांकि, ये वेरिएंट व्यवहार में शायद ही कभी इस्तेमाल किए जाते हैं।एक कारण, शायद, यह है कि विषम-लंबाई वाले डीएफटी के लिए फास्ट फूरियर ट्रांसफॉर्म एल्गोरिदम आम तौर पर फास्ट फूरियर ट्रांसफॉर्म एल्गोरिदम की तुलना में भी अधिक जटिल होते हैं, जो कि भी लंबाई वाले डीएफटी के लिए एल्गोरिदम होते हैं (जैसे कि सबसे सरल रेडिक्स -2 एल्गोरिदम केवल लंबाई के लिए भी होते हैं), और यह बढ़ी हुई गहनता कैरी करता हैनीचे वर्णित के रूप में DCTs पर।

(तुच्छ रियल-ईवन सरणी, एकल संख्या की लंबाई-एक डीएफटी (विषम लंबाई) $a$& nbsp;, लंबाई के dct-v से मेल खाती है $$ N = 1 .$$)

उलटा रूपांतरण
उपरोक्त सामान्यीकरण सम्मेलनों का उपयोग करते हुए, DCT-I का व्युत्क्रम DCT-I को 2/(n & nbsp;-& nbsp; 1) से गुणा किया जाता है।DCT-IV का व्युत्क्रम DCT-IV 2/n से गुणा किया गया है।DCT-II का व्युत्क्रम DCT-III को 2/n और इसके विपरीत से गुणा किया जाता है।

असतत फूरियर ट्रांसफ़ॉर्म के लिए, इन ट्रांसफॉर्म परिभाषाओं के सामने सामान्यीकरण कारक केवल सम्मेलन है और उपचारों के बीच भिन्न होता है।उदाहरण के लिए, कुछ लेखक द्वारा परिवर्तन को गुणा करते हैं $\sqrt{2/N}$ ताकि उलटा किसी भी अतिरिक्त गुणक कारक की आवश्यकता न हो।के उचित कारकों के साथ संयुक्त √2 (ऊपर देखें), इसका उपयोग ट्रांसफॉर्म मैट्रिक्स ऑर्थोगोनल मैट्रिक्स बनाने के लिए किया जा सकता है।

बहुआयामी dcts
विभिन्न डीसीटी प्रकारों के बहुआयामी वेरिएंट एक-आयामी परिभाषाओं से सीधे तौर पर पालन करते हैं: वे प्रत्येक आयाम के साथ डीसीटी के अलग उत्पाद (समकक्ष, रचना) हैं।

M-D DCT-II
उदाहरण के लिए, छवि या मैट्रिक्स का दो-आयामी DCT-II बस एक-आयामी DCT-II है, ऊपर से, पंक्तियों के साथ और फिर कॉलम (या इसके विपरीत) के साथ प्रदर्शन किया जाता है।अर्थात्, 2 डी डीसीटी- II को सूत्र द्वारा दिया गया है (सामान्यीकरण और अन्य पैमाने के कारकों को छोड़ देना, जैसा कि ऊपर):



\begin{align} X_{k_1,k_2} &= \sum_{n_1=0}^{N_1-1} \left( \sum_{n_2=0}^{N_2-1} x_{n_1,n_2} \cos \left[\frac{\pi}{N_2} \left(n_2+\frac{1}{2}\right) k_2 \right]\right) \cos \left[\frac{\pi}{N_1} \left(n_1+\frac{1}{2}\right) k_1 \right]\\ &= \sum_{n_1=0}^{N_1-1} \sum_{n_2=0}^{N_2-1} x_{n_1,n_2} \cos \left[\frac{\pi}{N_1} \left(n_1+\frac{1}{2}\right) k_1 \right] \cos \left[\frac{\pi}{N_2} \left(n_2+\frac{1}{2}\right) k_2 \right]. \end{align} $$
 * एक बहु-आयामी डीसीटी का उलटा संबंधित एक-आयामी डीसीटी (ऊपर देखें) के व्युत्क्रमों का अलग उत्पाद है, उदा।एक आयामी इनवर्स पंक्ति-स्तंभ एल्गोरिथ्म में समय में आयाम के साथ लागू होते हैं।

3-D DCT-II केवल तीन आयामी स्थान में 2-D DCT-II का विस्तार है और गणितीय रूप से सूत्र द्वारा गणना की जा सकती है



X_{k_1,k_2,k_3} = \sum_{n_1=0}^{N_1-1} \sum_{n_2=0}^{N_2-1} \sum_{n_3=0}^{N_3-1} x_{n_1,n_2,n_3} \cos \left[\frac{\pi}{N_1} \left(n_1+\frac{1}{2}\right) k_1 \right] \cos \left[\frac{\pi}{N_2} \left(n_2+\frac{1}{2}\right) k_2 \right] \cos \left[\frac{\pi}{N_3} \left(n_3+\frac{1}{2}\right) k_3 \right],\quad \text{for } k_i = 0,1,2,\dots,N_i-1. $$ 3-D DCT-II का व्युत्क्रम 3-D DCT-III है और इसे दिए गए सूत्र से गणना की जा सकती है

x_{n_1,n_2,n_3} = \sum_{k_1=0}^{N_1-1} \sum_{k_2=0}^{N_2-1} \sum_{k_3=0}^{N_3-1} X_{k_1,k_2,k_3} \cos \left[\frac{\pi}{N_1} \left(n_1+\frac{1}{2}\right) k_1 \right] \cos \left[\frac{\pi}{N_2} \left(n_2+\frac{1}{2}\right) k_2 \right] \cos \left[\frac{\pi}{N_3} \left(n_3+\frac{1}{2}\right) k_3 \right],\quad \text{for } n_i=0,1,2,\dots,N_i-1. $$ तकनीकी रूप से, प्रत्येक आयाम के साथ एक-आयामी डीसीटी के अनुक्रमों द्वारा दो-, तीन- (या -multi) आयामी DCT की गणना पंक्ति-स्तंभ एल्गोरिथ्म के रूप में जाना जाता है।फास्ट फूरियर ट्रांसफॉर्म#बहुआयामी एफएफटी के साथ, हालांकि, अलग क्रम में गणना करते समय ही चीज़ की गणना करने के लिए अन्य तरीके मौजूद हैं (यानी विभिन्न आयामों के लिए एल्गोरिदम को इंटरलेविंग/संयोजन/संयोजन)।3-डी डीसीटी के आधार पर अनुप्रयोगों में तेजी से वृद्धि के कारण, 3-डी डीसीटी-II की गणना के लिए कई फास्ट एल्गोरिदम विकसित किए जाते हैं।वेक्टर-रेडिक्स एल्गोरिदम को कम्प्यूटेशनल जटिलता को कम करने और कम्प्यूटेशनल गति बढ़ाने के लिए एम-डी डीसीटी की गणना के लिए लागू किया जाता है।3-D DCT-II कुशलता से गणना करने के लिए, फास्ट एल्गोरिथ्म, वेक्टर-रेडिक्स डिकिमेशन इन फ्रीक्वेंसी (VR DIF) एल्गोरिथ्म विकसित किया गया था।

3-डी DCT-II VR DIF
वीआर डीआईएफ एल्गोरिथ्म को लागू करने के लिए इनपुट डेटा को तैयार किया जाना है और निम्नानुसार पुनर्व्यवस्थित किया जाना है। ट्रांसफॉर्म आकार n × n × n को माना जाता है & nbsp; 2।



\begin{array}{lcl}\tilde{x}(n_1,n_2,n_3) =x(2n_1,2n_2,2n_3)\\ \tilde{x}(n_1,n_2,N-n_3-1)=x(2n_1,2n_2,2n_3+1)\\ \tilde{x}(n_1,N-n_2-1,n_3)=x(2n_1,2n_2+1,2n_3)\\ \tilde{x}(n_1,N-n_2-1,N-n_3-1)=x(2n_1,2n_2+1,2n_3+1)\\ \tilde{x}(N-n_1-1,n_2,n_3)=x(2n_1+1,2n_2,2n_3)\\ \tilde{x}(N-n_1-1,n_2,N-n_3-1)=x(2n_1+1,2n_2,2n_3+1)\\ \tilde{x}(N-n_1-1,N-n_2-1,n_3)=x(2n_1+1,2n_2+1,2n_3)\\ \tilde{x}(N-n_1-1,N-n_2-1,N-n_3-1)=x(2n_1+1,2n_2+1,2n_3+1)\\ \end{array} $$
 * कहाँ पे $$0\leq n_1,n_2,n_3 \leq \frac{N}{2} -1$$

आसन्न का आंकड़ा उन चार चरणों को दर्शाता है जो वीआर डीआईएफ एल्गोरिथ्म का उपयोग करके 3-डी डीसीटी-II की गणना में शामिल हैं।पहला चरण उपरोक्त समीकरणों द्वारा सचित्र इंडेक्स मैपिंग का उपयोग करके 3-डी पुनर्मूल्यांकन है।दूसरा चरण तितली गणना है।प्रत्येक तितली आठ अंकों की गणना साथ करता है जैसा कि नीचे दिए गए आंकड़े में दिखाया गया है, जहां $$c(\varphi_i)=\cos(\varphi_i)$$।

मूल 3-डी DCT-II अब के रूप में लिखा जा सकता है


 * $$X(k_1,k_2,k_3)=\sum_{n_1=1}^{N-1}\sum_{n_2=1}^{N-1}\sum_{n_3=1}^{N-1}\tilde{x}(n_1,n_2,n_3) \cos(\varphi k_1)\cos(\varphi k_2)\cos(\varphi k_3)

$$ कहाँ पे $$\varphi_i= \frac{\pi}{2N}(4N_i+1),\text{ and } i= 1,2,3.$$ अगर सम और विषम भागों $$k_1,k_2$$ तथा $$k_3$$ and are considered, the general formula for the calculation of the 3-D DCT-II can be expressed as
 * $$X(k_1,k_2,k_3)=\sum_{n_1=1}^{\tfrac N 2 -1}\sum_{n_2=1}^{\tfrac N 2 -1}\sum_{n_1=1}^{\tfrac N 2 -1}\tilde{x}_{ijl}(n_1,n_2,n_3) \cos(\varphi (2k_1+i)\cos(\varphi (2k_2+j)

\cos(\varphi (2k_3+l))$$ कहाँ पे


 * $$\tilde{x}_{ijl}(n_1,n_2,n_3)=\tilde{x}(n_1,n_2,n_3)+(-1)^l\tilde{x}\left(n_1,n_2,n_3+\frac{n}{2}\right) $$
 * $$+(-1)^j\tilde{x}\left(n_1,n_2+\frac{n}{2},n_3\right)+(-1)^{j+l}\tilde{x}\left(n_1,n_2+\frac{n}{2},n_3+\frac{n}{2}\right) $$
 * $$+(-1)^i\tilde{x}\left(n_1+\frac{n}{2},n_2,n_3\right)+(-1)^{i+j}\tilde{x}\left(n_1+\frac{n}{2}+\frac{n}{2},n_2,n_3\right) $$
 * $$+(-1)^{i+l}\tilde{x}\left(n_1+\frac{n}{2},n_2,n_3+\frac{n}{3}\right)$$
 * $$+(-1)^{i+j+l}\tilde{x}\left(n_1+\frac{n}{2},n_2+\frac{n}{2},n_3+\frac{n}{2}\right) \text{ where } i,j,l= 0 \text{ or } 1.$$

अंकगणितीय जटिलता
पूरे 3-डी डीसीटी गणना की जरूरत है $$~ [\log_2 N] ~$$ चरणों, और प्रत्येक चरण में शामिल हैं $$~ \tfrac{1}{8}\ N^3 ~$$ तितलियों।पूरे 3-डी डीसीटी की आवश्यकता है $$~ \left[ \tfrac{1}{8}\ N^3 \log_2 N \right] ~$$ तितलियों की गणना की जानी चाहिए।प्रत्येक तितली को सात वास्तविक गुणन (तुच्छ गुणा सहित) और 24 & nbsp; वास्तविक परिवर्धन (तुच्छ परिवर्धन सहित) की आवश्यकता होती है।इसलिए, इस चरण के लिए आवश्यक वास्तविक गुणन की कुल संख्या है $$~ \left[ \tfrac{7}{8}\ N^3\ \log_2 N \right] ~,$$ और वास्तविक परिवर्धन की कुल संख्या यानी पोस्ट-एडिशन (पुनरावर्ती परिवर्धन) सहित, जिसकी गणना सीधे तितली चरण के बाद या बिट-रिवर्स स्टेज द्वारा दी जाती है $$~ \underbrace{\left[\frac{3}{2}N^3 \log_2N\right]}_\text{Real}+\underbrace{\left[\frac{3}{2}N^3 \log_2N-3N^3+3N^2\right]}_\text{Recursive} = \left[\frac{9}{2}N^3 \log_2N-3N^3+3N^2\right] ~.$$ MD-DCT-II की गणना करने के लिए पारंपरिक विधि पंक्ति-स्तंभ-फ्रेम (RCF) दृष्टिकोण का उपयोग कर रही है जो कम्प्यूटेशनल रूप से जटिल और सबसे उन्नत हाल के हार्डवेयर प्लेटफार्मों पर कम उत्पादक है।आरसीएफ एल्गोरिथ्म की तुलना में वीआर डीआईएफ एल्गोरिथ्म की गणना करने के लिए आवश्यक गुणा की संख्या काफी कम होती है।आरसीएफ दृष्टिकोण में शामिल गुणन और परिवर्धन की संख्या दी गई है $$~\left[\frac{3}{2}N^3 \log_2 N \right]~$$ तथा $$~ \left[\frac{9}{2}N^3 \log_2 N - 3N^3 + 3N^2 \right] ~,$$ क्रमश।तालिका 1 से, यह देखा जा सकता है कि कुल संख्या 3-डी डीसीटी वीआर एल्गोरिथ्म से जुड़े गुणन आरसीएफ दृष्टिकोण से 40%से अधिक से जुड़े हैं।इसके अलावा, आरसीएफ दृष्टिकोण में नए वीआर एल्गोरिथ्म की तुलना में मैट्रिक्स ट्रांसपोज़ और अधिक इंडेक्सिंग और डेटा स्वैपिंग शामिल हैं।यह 3-डी डीसीटी वीआर एल्गोरिथ्म को 3-डी अनुप्रयोगों के लिए अधिक कुशल और बेहतर अनुकूल बनाता है जिसमें 3-डी डीसीटी- II जैसे वीडियो संपीड़न और अन्य 3-डी इमेज प्रोसेसिंग एप्लिकेशन शामिल हैं।

एक तेज एल्गोरिथ्म चुनने में मुख्य विचार कम्प्यूटेशनल और संरचनात्मक जटिलताओं से बचना है।जैसा कि कंप्यूटर और डीएसपी की तकनीक अग्रिमों में, अंकगणितीय संचालन (गुणा और परिवर्धन) का निष्पादन समय बहुत तेज होता जा रहा है, और नियमित रूप से कम्प्यूटेशनल संरचना सबसे महत्वपूर्ण कारक बन जाती है। इसलिए, हालांकि उपरोक्त प्रस्तावित 3-डी वीआर एल्गोरिथ्म गुणन की संख्या पर सैद्धांतिक निचले बाउंड को प्राप्त नहीं करता है, अन्य 3-डी डीसीटी एल्गोरिदम की तुलना में इसकी सरल कम्प्यूटेशनल संरचना है।यह एकल तितली का उपयोग करके लागू किया जा सकता है और 3-डी में Cooley-Tukey FFT एल्गोरिथ्म के गुणों के पास होता है।इसलिए, 3-डी वीआर 3-डी डीसीटी-II की गणना में अंकगणितीय संचालन को कम करने के लिए अच्छा विकल्प प्रस्तुत करता है, जबकि सरल संरचना को ध्यान में रखते हुए जो तितली-शैली कोइली-टुकी एफएफटी एल्गोरिदम की विशेषता है।

दाईं ओर की छवि के लिए क्षैतिज और ऊर्ध्वाधर आवृत्तियों का संयोजन दिखाती है 8 × 8 $$(~ N_1 = N_2 = 8 ~)$$ दो-आयामी डीसीटी।प्रत्येक कदम बाएं से दाएं और ऊपर से नीचे तक आवृत्ति में 1/2 चक्र की वृद्धि होती है। उदाहरण के लिए, शीर्ष-बाएं वर्ग से दाएं को स्थानांतरित करने से क्षैतिज आवृत्ति में आधा चक्र वृद्धि होती है।दाईं ओर और कदम दो आधा-चक्र देता है।एक कदम नीचे दो आधा-चक्र क्षैतिज रूप से और आधा चक्र को लंबवत रूप से देता है।स्रोत डेटा ( 8×8 ) इन 64 & nbsp; आवृत्ति वर्गों के रैखिक संयोजन में बदल जाता है।

MD-DCT-IV
M-D DCT-IV केवल 1-D DCT-IV का विस्तार है $M$& nbsp; आयामी डोमेन।एक मैट्रिक्स या छवि के 2-डी डीसीटी-आईवी द्वारा दिया गया है


 * $$ X_{k,\ell} =

\sum_{n=0}^{N-1} \; \sum_{m=0}^{M-1} \ x_{n,m} \cos\left(\ \frac{\,( 2 m + 1 )( 2 k + 1 )\ \pi \,}{4N} \ \right) \cos\left(\ \frac{\, ( 2n + 1 )( 2 \ell + 1 )\ \pi \,}{4M} \ \right) ~,$$
 * के लिये $$ k = 0,\ 1,\ 2\ \ldots\ N-1 $$ तथा $$ \ell= 0,\ 1,\ 2,\ \ldots\ M-1 ~.$$

हम नियमित रूप से पंक्ति-स्तंभ विधि का उपयोग करके एमडी डीसीटी-आईवी की गणना कर सकते हैं या हम बहुपद परिवर्तन विधि का उपयोग कर सकते हैं तेज और कुशल गणना के लिए।इस एल्गोरिथ्म का मुख्य विचार बहुआयामी डीसीटी को सीधे 1-डी डीसीटी की श्रृंखला में बदलने के लिए बहुपद रूपांतरण का उपयोग करना है।MD DCT-IV में विभिन्न क्षेत्रों में कई अनुप्रयोग भी हैं।

गणना
हालांकि इन सूत्रों के प्रत्यक्ष अनुप्रयोग की आवश्यकता होगी $$~ \mathcal{O}(N^2) ~$$ संचालन, केवल ही चीज़ की गणना करना संभव है $$~ \mathcal{O}(N \log N ) ~$$ फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) के समान गणना को कारक करके जटिलता।एक के साथ संयुक्त एफएफटी के माध्यम से डीसीटी की गणना भी कर सकते हैं $$~\mathcal{O}(N)~$$ पूर्व और पोस्ट-प्रोसेसिंग स्टेप्स।सामान्य रूप में, $$~\mathcal{O}(N \log N )~$$ डीसीटी की गणना करने के तरीके फास्ट कोसाइन ट्रांसफॉर्म (एफसीटी) एल्गोरिदम के रूप में जाना जाता है।

सबसे कुशल एल्गोरिदम, सिद्धांत रूप में, आमतौर पर वे होते हैं जो सीधे डीसीटी के लिए विशिष्ट होते हैं, जैसा कि साधारण एफएफटी प्लस का उपयोग करने के विपरीत है $$~ \mathcal{O}(N) ~$$ अतिरिक्त संचालन (एक अपवाद के लिए नीचे देखें)।हालांकि, यहां तक कि विशेष डीसीटी एल्गोरिदम (उन सभी सहित जो सबसे कम ज्ञात अंकगणितीय गणना प्राप्त करते हैं, कम से कम दो की शक्ति के लिए। पावर-ऑफ-टू आकार) आमतौर पर एफएफटी एल्गोरिदम से निकटता से संबंधित होते हैं-चूंकि डीसीटी अनिवार्य रूप से रियल-ईवन के डीएफटी होते हैं।डेटा, एफएफटी लेकर और इस समरूपता के कारण निरर्थक संचालन को समाप्त करके तेज़ डीसीटी एल्गोरिथ्म डिजाइन कर सकता है।यह भी स्वचालित रूप से किया जा सकता है ।Cooley -Tukey FFT एल्गोरिथ्म पर आधारित एल्गोरिदम सबसे आम हैं, लेकिन कोई भी अन्य FFT एल्गोरिथ्म भी लागू होता है।उदाहरण के लिए, Winograd FFT एल्गोरिथ्म DFT के लिए न्यूनतम-मल्टीप्लिकेशन एल्गोरिदम की ओर जाता है, यद्यपि आम तौर पर अधिक परिवर्धन की लागत पर, और समान एल्गोरिथ्म द्वारा प्रस्तावित किया गया था DCT के लिए।क्योंकि DFTs, DCT, और इसी तरह के रूपांतरों के लिए एल्गोरिदम सभी इतने निकट से संबंधित हैं, रूपांतरण के लिए एल्गोरिदम में कोई भी सुधार सैद्धांतिक रूप से अन्य रूपांतरण के लिए तत्काल लाभ प्राप्त करेगा। ।

जबकि डीसीटी एल्गोरिदम जो अनमॉडिफाइड एफएफटी को नियोजित करते हैं, अक्सर सबसे अच्छे विशिष्ट डीसीटी एल्गोरिदम की तुलना में कुछ सैद्धांतिक ओवरहेड होते हैं, पूर्व में अलग लाभ भी होता है: अत्यधिक अनुकूलित एफएफटी कार्यक्रम व्यापक रूप से उपलब्ध हैं।इस प्रकार, व्यवहार में, सामान्य लंबाई के लिए उच्च प्रदर्शन प्राप्त करना अक्सर आसान होता है $N$ एफएफटी-आधारित एल्गोरिदम के साथ। दूसरी ओर, विशिष्ट डीसीटी एल्गोरिदम, छोटे, निश्चित आकारों के रूप में परिवर्तन के लिए व्यापक उपयोग देखें जैसे 8 × 8 DCT-II JPEG संपीड़न में उपयोग किया जाता है, या छोटे DCT (या MDCTs) आमतौर पर ऑडियो संपीड़न में उपयोग किए जाते हैं।(कम कोड आकार भी एम्बेडेड-डिवाइस अनुप्रयोगों के लिए विशेष DCT का उपयोग करने का कारण हो सकता है।)

वास्तव में, यहां तक कि साधारण एफएफटी का उपयोग करने वाले डीसीटी एल्गोरिदम कभी-कभी वास्तविक-सममितीय डेटा के बड़े एफएफटी से निरर्थक संचालन को छंटने के बराबर होते हैं, और वे अंकगणित गणना के दृष्टिकोण से भी इष्टतम हो सकते हैं।उदाहरण के लिए, टाइप- II DCT आकार के DFT के बराबर है $$~ 4N ~$$ रियल-ईवन समरूपता के साथ, जिनके समरूप तत्व शून्य हैं।एफएफटी के माध्यम से इसकी गणना करने के लिए सबसे आम तरीकों में से (जैसे कि FFTPACK और FFTW में उपयोग की जाने वाली विधि) का वर्णन किया गया था तथा, और इस विधि को हेंडसाइट में रेडिक्स -4 डिसीमेशन-इन-टाइम कोइली-टुकी एल्गोरिथ्म के चरण के रूप में देखा जा सकता है, जो डीसीटी-II के अनुरूप तार्किक रियल-ईवन डीएफटी पर लागू होता है। क्योंकि सम-इंडेक्स किए गए तत्व शून्य हैं, यह RADIX-4 कदम बिल्कुल स्प्लिट-रेडिक्स कदम के समान है।यदि बाद का आकार $$~ N ~$$ रियल-डेटा एफएफटी रियल-डेटा स्प्लिट-रेडिक्स एफएफटी एल्गोरिथ्म द्वारा भी किया जाता है। स्प्लिट-रेडिक्स एल्गोरिथ्म (के रूप में ), तब परिणामी एल्गोरिथ्म वास्तव में मेल खाता है जो पावर-ऑफ-टू डीसीटी-II के लिए सबसे कम प्रकाशित अंकगणित गिनती थी ($$~ 2 N \log_2 N - N + 2 ~$$ वास्तविक-शिथिल संचालन)।

ऑपरेशन की गिनती में हाल ही में कमी $$~ \tfrac{17}{9} N \log_2 N + \mathcal{O}(N)$$ इसके अलावा वास्तविक-डेटा FFT का उपयोग करता है। इसलिए, अंकगणितीय दृष्टिकोण से एफएफटी के माध्यम से डीसीटी की गणना करने के बारे में आंतरिक रूप से बुरा कुछ भी नहीं है - यह कभी -कभी केवल सवाल है कि क्या संबंधित एफएफटी एल्गोरिथ्म इष्टतम है।(एक व्यावहारिक मामले के रूप में, अलग एफएफटी दिनचर्या को लागू करने में फ़ंक्शन-कॉल ओवरहेड छोटे के लिए महत्वपूर्ण हो सकता है $$~ N ~,$$ लेकिन यह एल्गोरिथम प्रश्न के बजाय कार्यान्वयन है क्योंकि इसे अनियंत्रित या इनलाइनिंग द्वारा हल किया जा सकता है।)

IDCT का उदाहरण
कैपिटल लेटर ए की इस 8x8 ग्रेस्केल इमेज पर विचार करें।

[[File:dct-table.png|frame|center|संबंधित गुणांक (हमारी छवि के लिए विशिष्ट) के साथ असतत कोसाइन परिवर्तन के आधार कार्य। छवि का dct = $$ \begin{bmatrix} 6.1917 & -0.3411 & 1.2418 &  0.1492  &  0.1583  &  0.2742 &  -0.0724  &  0.0561 \\ 0.2205 & 0.0214 & 0.4503  &  0.3947  & -0.7846 &  -0.4391  &  0.1001  & -0.2554 \\ 1.0423 & 0.2214 & -1.0017 &  -0.2720  &  0.0789 &  -0.1952  &  0.2801  &  0.4713 \\ -0.2340 & -0.0392 & -0.2617 &  -0.2866 &   0.6351 &   0.3501 &  -0.1433  &  0.3550 \\ 0.2750 & 0.0226 & 0.1229  &  0.2183  & -0.2583  & -0.0742  & -0.2042  & -0.5906 \\ 0.0653 & 0.0428 & -0.4721 &  -0.2905  &  0.4745  &  0.2875  & -0.0284  & -0.1311 \\ 0.3169 & 0.0541 & -0.1033 &  -0.0225  & -0.0056  &  0.1017  & -0.1650 &  -0.1500 \\ -0.2970 & -0.0627 & 0.1960 &   0.0644  & -0.1136 &  -0.1031 &   0.1887  &  0.1444 \\ \end{bmatrix}

$$।]] प्रत्येक आधार फ़ंक्शन को इसके गुणांक से गुणा किया जाता है और फिर इस उत्पाद को अंतिम छवि में जोड़ा जाता है।



यह भी देखें

 * असतत तरंग बदलें
 * असतत cosine रूपांतरण | JPEGअलगकोज्यापरिवर्तनडीसीटी परिवर्तन के उदाहरण को समझने के लिए संभावित रूप से आसान है
 * फूरियर-संबंधित रूपांतरों की सूची
 * संशोधित असतत cosine रूपांतरण

बाहरी संबंध

 * Syed Ali Khayam: The Discrete Cosine Transform (DCT): Theory and Application
 * Implementation of MPEG integer approximation of 8x8 IDCT (ISO/IEC 23002-2)
 * Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. A free (GPL) C library that can compute fast DCTs (types I-IV) in one or more dimensions, of arbitrary size.
 * Takuya Ooura: General Purpose FFT Package, http://www.kurims.kyoto-u.ac.jp/~ooura/fft.html. Free C & FORTRAN libraries for computing fast DCTs (types II–III) in one, two or three dimensions, power of 2 sizes.
 * Tim Kientzle: Fast algorithms for computing the 8-point DCT and IDCT, http://drdobbs.com/parallel/184410889.
 * LTFAT is a free Matlab/Octave toolbox with interfaces to the FFTW implementation of the DCTs and DSTs of type I-IV.