डिजिटल इमेज प्रोसेसिंग

डिजिटल छवि प्रसंस्करण किसी कलन विधि (एल्गोरिदम) के माध्यम से डिजिटल छवियों को संसाधित करने के लिए डिजिटल संगणक (कंप्यूटर) का उपयोग है। डिजिटल एकल प्रसंस्करण के उपश्रेणी या क्षेत्र के रूप में, डिजिटल छवि प्रसंस्करण के समधर्मी (एनालॉग) छवि प्रसंस्करण पर कई फायदे हैं। यह निविष्टि डेटा पर कलन विधि (एल्गोरिदम) की विस्तृत श्रृंखला को उपयोजित करता है और प्रसंस्करण के दौरान शोर (कोलाहल) के निर्माण और विरूपण जैसी समस्याओं का परिवर्जन कर सकता है। चूंकि छवियों को दो विमाओ (शायद अधिक) पर निरूपित किया गया है, इसलिए डिजिटल छवि प्रसंस्करण को बहुविमीय प्रणालियों के रूप में प्रतिदर्श किया जा सकता है। डिजिटल छवि प्रसंस्करण का निर्माण और विकास मुख्य रूप से तीन कारकों से प्रभावित होता है, संगणक (कंप्यूटर) का विकास, गणित का विकास (विशेषकर असतत गणित सिद्धांत का निर्माण और सुधार), पर्यावरण, कृषि, सैन्य, उद्योग और चिकित्सा विज्ञान में अनुप्रयोगों की एक विस्तृत श्रृंखला की आवश्यकता में वृद्धि।

इतिहास
1960 के दशक में, डिजिटल छवि प्रसंस्करण की कई तकनीकें, या जिन्हें प्रायः डिजिटल चित्रण प्रसंस्करण कहा जाता है, बेल प्रयोगशाला, जेट प्रोपल्शन (प्रणोदन) प्रयोगशाला, मैसाचुसेट्स प्राद्योगिकी संस्थान, मैरीलैंड विश्वविद्यालय और कुछ अन्य शोध सुविधाएं उपग्रह बिंबावली (सैटेलाइट इमेजरी), मानक तंत्रिका-फोटो रूपांतरण (वायर-फोटो स्टैण्डर्ड कन्वर्शन), मेडिकल प्रतिबिंबन, वीडियोफोन, संप्रतीक अभिज्ञान (करैक्टर रिकग्निशन), और छायाचित्र वर्धन के लिए अनुप्रयोगों के साथ विकसित की गई। प्रारंभिक छवि प्रसंस्करण का उद्देश्य छवि की गुणवत्ता में सुधार तथा मनुष्यों के लिए लोगों के दृश्य प्रभाव में सुधार करना है। छवि प्रसंस्करण में, निविष्ट एक निम्न-कोटि वाली छवि होती है, और निर्गत उच्च कोटि वाली छवि प्राप्त होती है। सामान्य छवि प्रसंस्करण में छवि वर्धन, प्रत्यावर्तन, संकेतन और संपीड़न होता है। पहला सफल अनुप्रयोग अमेरिकन जेट प्रोपल्शन (प्रणोदन) प्रयोगशाला (JPL) था। उन्होंने सूर्य की स्थिति और चंद्रमा के वातावरण को ध्यान में रखते हुए 1964 में अन्तरिक्ष अनुवेदक रेज़र 7 द्वारा वापस भेजी गई हजारों चंद्र तस्वीरों पर छवि प्रसंस्करण तकनीकों जैसे कि ज्यामितीय सुधार, उन्नयन परिवर्तन, शोर हटाने आदि का उपयोग किया। कंप्यूटर द्वारा चंद्रमा की सतह के नक्शे की सफल मैपिंग का प्रभाव एक बड़ी सफलता रही है। बाद में, अंतरिक्ष यान द्वारा वापस भेजी गई लगभग 100,000 तस्वीरों पर अधिक जटिल छवि प्रसंस्करण का प्रदर्शन किया गया, ताकि स्थलाकृतिक मानचित्र, रंगीन मानचित्र और चंद्रमा का मनोरम मोज़ेक प्राप्त किया जा सके, जिसने असाधारण परिणाम प्राप्त किए और मानव लैंडिंग के लिए एक ठोस नींव रखी। चाँद। <रेफ नाम =: 1>

हालाँकि, उस युग के कंप्यूटिंग उपकरणों के साथ प्रसंस्करण की लागत काफी अधिक थी। यह 1970 के दशक में बदल गया, जब डिजिटल इमेज प्रोसेसिंग सस्ते कंप्यूटर के रूप में फैल गई और समर्पित हार्डवेयर उपलब्ध हो गया। इससे छवियों को वास्तविक समय में संसाधित किया जा रहा था, कुछ समर्पित समस्याओं जैसे कि टेलीविजन मानकों के रूपांतरण के लिए। जैसे-जैसे सामान्य-उद्देश्य वाले कंप्यूटर तेज होते गए, उन्होंने सबसे विशिष्ट और कंप्यूटर-गहन संचालन को छोड़कर सभी के लिए समर्पित हार्डवेयर की भूमिका निभानी शुरू कर दी। 2000 के दशक में उपलब्ध तेज़ कंप्यूटर और सिग्नल प्रोसेसर के साथ, डिजिटल इमेज प्रोसेसिंग इमेज प्रोसेसिंग का सबसे सामान्य रूप बन गया है, और आमतौर पर इसका उपयोग किया जाता है क्योंकि यह न केवल सबसे बहुमुखी तरीका है, बल्कि सबसे सस्ता भी है।

छवि सेंसर
आधुनिक छवि सेंसर के लिए आधार धातु-ऑक्साइड-सेमिकंडक्टर (एमओएस) तकनीक है, जो 1959 में बेल लैब्स में मोहम्मद एम। अटला और डावन काहंग द्वारा MOSFET (MOS फील्ड-इफेक्ट ट्रांजिस्टर) के आविष्कार से उत्पन्न होता है। इसने डिजिटल सेमीकंडक्टर इमेज सेंसर के विकास का नेतृत्व किया, जिसमें चार्ज-युग्मित डिवाइस (CCD) और बाद में CMOS सेंसर शामिल थे।

चार्ज-युग्मित डिवाइस का आविष्कार विलार्ड एस। बॉयल और जॉर्ज ई। स्मिथ ने 1969 में बेल लैब्स में किया था। एमओएस तकनीक पर शोध करते समय, उन्होंने महसूस किया कि एक इलेक्ट्रिक चार्ज चुंबकीय बुलबुले का सादृश्य था और इसे एक छोटे से एमओएस संधारित्र पर संग्रहीत किया जा सकता है।चूंकि यह एक पंक्ति में MOS कैपेसिटर की एक श्रृंखला को गढ़ने के लिए काफी सीधा था, इसलिए उन्होंने उनसे एक उपयुक्त वोल्टेज जोड़ा ताकि चार्ज को एक से अगले तक कदम रखा जा सके। CCD एक अर्धचालक सर्किट है जिसका उपयोग बाद में टेलीविजन प्रसारण के लिए पहले डिजिटल वीडियो कैमरों में किया गया था। NMOS एक्टिव-पिक्सेल सेंसर (APS) का आविष्कार 1980 के दशक के मध्य में जापान में ओलंपस द्वारा किया गया था।यह MOS सेमीकंडक्टर डिवाइस फैब्रिकेशन में अग्रिमों द्वारा सक्षम किया गया था, जिसमें MOSFET स्केलिंग छोटे माइक्रोन और फिर उप-माइक्रोन स्तर तक पहुंच गई थी। NMOS APS को 1985 में ओलंपस में त्सुतोमु नाकामुरा की टीम द्वारा गढ़ा गया था। CMOS एक्टिव-पिक्सेल सेंसर (CMOS सेंसर) को बाद में एरिक फॉसम की टीम द्वारा 1993 में नासा जेट प्रोपल्शन लेबोरेटरी में विकसित किया गया था। 2007 तक, CMOS सेंसर की बिक्री ने CCD सेंसर को पार कर लिया था।

छवि संपीड़न
डिजिटल इमेज कम्प्रेशन टेक्नोलॉजी में एक महत्वपूर्ण विकास असतत कोसाइन ट्रांसफॉर्म (डीसीटी) था, जो 1972 में एन। अहमद द्वारा प्रस्तावित एक हानिपूर्ण संपीड़न तकनीक थी। 1972 में नासिर अहमद। डीसीटी संपीड़न JPEG के लिए आधार बन गया, जिसे 1992 में संयुक्त फोटोग्राफिक विशेषज्ञों के समूह द्वारा पेश किया गया था। JPEG छवियों को बहुत छोटे फ़ाइल आकारों में संकुचित करता है, और इंटरनेट पर सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है। इसका अत्यधिक कुशल डीसीटी संपीड़न एल्गोरिथ्म डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था, हर दिन उत्पादित कई बिलियन JPEG छवियों के साथ.

डिजिटल सिग्नल प्रोसेसर (डीएसपी)
1970 के दशक में एमओएस प्रौद्योगिकी के व्यापक गोद लेने से इलेक्ट्रॉनिक सिग्नल प्रोसेसिंग में क्रांति ला दी गई थी। MOS इंटीग्रेटेड सर्किट तकनीक 1970 के दशक की शुरुआत में पहले सिंगल-चिप माइक्रोप्रोसेसर्स और माइक्रोकंट्रोलर्स के लिए आधार था, और फिर 1970 के दशक के अंत में पहला सिंगल-चिप डिजिटल सिग्नल प्रोसेसर (डीएसपी) चिप्स। डीएसपी चिप्स तब से डिजिटल इमेज प्रोसेसिंग में व्यापक रूप से उपयोग किया गया है।

असतत कोसाइन ट्रांसफॉर्म (डीसीटी) इमेज कम्प्रेशन एल्गोरिथ्म को डीएसपी चिप्स में व्यापक रूप से लागू किया गया है, जिसमें कई कंपनियां डीसीटी प्रौद्योगिकी के आधार पर डीएसपी चिप्स विकसित कर रही हैं।DCTs व्यापक रूप से एन्कोडिंग, डिकोडिंग, वीडियो कोडिंग, ऑडियो कोडिंग, मल्टीप्लेक्सिंग, कंट्रोल सिग्नलिंग, सिग्नलिंग, एनालॉग-टू-डिजिटल रूपांतरण, फॉर्मेटिंग ल्यूमिनेंस और रंग अंतर, और YUV444 और YUV411 जैसे रंग प्रारूपों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग एन्कोडिंग संचालन के लिए भी किया जाता है जैसे कि गति अनुमान, गति मुआवजा, अंतर-फ्रेम भविष्यवाणी, परिमाणीकरण, अवधारणात्मक भार, एन्ट्रापी एन्कोडिंग, चर एन्कोडिंग, और गति वैक्टर, और विभिन्न रंग प्रारूपों (YIQ, के बीच उलटा संचालन जैसे डिकोडिंग संचालनप्रदर्शन उद्देश्यों के लिए YUV और RGB)।डीसीटी का उपयोग आमतौर पर उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर चिप्स के लिए भी किया जाता है।

मेडिकल इमेजिंग
1972 में, ब्रिटिश कंपनी ईएमआई हाउसफील्ड के इंजीनियर ने हेड डायग्नोसिस के लिए एक्स-रे कम्प्यूटेड टोमोग्राफी डिवाइस का आविष्कार किया, जिसे आमतौर पर सीटी (कंप्यूटर टोमोग्राफी) कहा जाता है।सीटी न्यूक्लियस विधि मानव हेड सेक्शन के प्रक्षेपण पर आधारित है और क्रॉस-अनुभागीय छवि को फिर से बनाने के लिए कंप्यूटर द्वारा संसाधित किया जाता है, जिसे छवि पुनर्निर्माण कहा जाता है।1975 में, ईएमआई ने सफलतापूर्वक पूरे शरीर के लिए एक सीटी डिवाइस विकसित किया, जिसने मानव शरीर के विभिन्न हिस्सों की एक स्पष्ट टोमोग्राफिक छवि प्राप्त की।1979 में, इस नैदानिक तकनीक ने नोबेल पुरस्कार जीता। <रेफरी नाम =: 1 /> मेडिकल अनुप्रयोगों के लिए डिजिटल इमेज प्रोसेसिंग तकनीक को 1994 में स्पेस फाउंडेशन स्पेस टेक्नोलॉजी हॉल ऑफ फेम में शामिल किया गया था।

कार्य
डिजिटल इमेज प्रोसेसिंग बहुत अधिक जटिल एल्गोरिदम के उपयोग की अनुमति देती है, और इसलिए, सरल कार्यों में दोनों अधिक परिष्कृत प्रदर्शन की पेशकश कर सकती है, और उन तरीकों के कार्यान्वयन जो एनालॉग साधनों द्वारा असंभव होगा।

विशेष रूप से, डिजिटल छवि प्रसंस्करण एक ठोस अनुप्रयोग है, और एक व्यावहारिक तकनीक है:
 * वर्गीकरण
 * सुविधा निकासी
 * बहु-स्तरीय संकेत विश्लेषण
 * पैटर्न मान्यता
 * प्रक्षेपण

डिजिटल इमेज प्रोसेसिंग में उपयोग की जाने वाली कुछ तकनीकों में शामिल हैं:
 * अनिसोट्रोपिक प्रसार
 * छिपे हुए मार्कोव मॉडल
 * छवि संपादन
 * छवि बहाली
 * स्वतंत्र घटक विश्लेषण
 * रैखिक फ़िल्टरिंग
 * तंत्रिका - तंत्र
 * आंशिक अंतर समीकरण
 * Pixelation
 * प्वाइंट फीचर मिलान
 * प्रमुख घटक विश्लेषण
 * स्व-आयोजन नक्शे
 * तरंगिका

फ़िल्टरिंग
डिजिटल फ़िल्टर का उपयोग डिजिटल छवियों को धुंधला और तेज करने के लिए किया जाता है।फ़िल्टरिंग द्वारा किया जा सकता है:
 * स्थानिक डोमेन में विशेष रूप से डिज़ाइन किए गए गुठली (फ़िल्टर सरणी) के साथ संकल्प <रेफ नाम =: 0>
 * आवृत्ति (फूरियर) डोमेन में विशिष्ट आवृत्ति क्षेत्रों को मास्क करना

निम्नलिखित उदाहरण दोनों तरीके दिखाते हैं: रेफ नाम = गोंजालेज 2008>

फूरियर डोमेन फ़िल्टरिंग में इमेज पैडिंग
छवियों को आम तौर पर फूरियर स्पेस में बदलने से पहले गद्देदार किया जाता है, नीचे दिए गए हाईपास फ़िल्टर की गई छवियां विभिन्न पैडिंग तकनीकों के परिणामों को दर्शाती हैं:

ध्यान दें कि हाईपास फ़िल्टर बार -बार एज पैडिंग की तुलना में शून्य गद्देदार होने पर अतिरिक्त किनारों को दिखाता है।

फ़िल्टरिंग कोड उदाहरण
स्थानिक डोमेन हाईपास फ़िल्टरिंग के लिए MATLAB उदाहरण।

 IMG = चेकरबोर्ड (20);% जनरेट चेकरबोर्ड % ************************** स्थानिक डोमेन  *************************** klaplace = [0 -1 0;-1 5 -1;0 -1 0];% लाप्लासियन फ़िल्टर कर्नेल X = conv2 (img, klaplace);% के साथ परीक्षण img % 3x3 लाप्लासियन कर्नेल आकृति imshow (x, []) % दिखाते हैं लाप्लासियन फ़िल्टर्ड शीर्षक ('लाप्लासियन एज डिटेक्शन')

एफाइन ट्रांसफॉर्मेशन
Affine रूपांतरण पैमाने, घूमने, अनुवाद, दर्पण और कतरनी सहित बुनियादी छवि परिवर्तनों को सक्षम करते हैं जैसा कि निम्नलिखित उदाहरणों में दिखाया गया है:

एक छवि के लिए एफ़िन मैट्रिक्स को लागू करने के लिए, छवि को मैट्रिक्स में बदल दिया जाता है जिसमें प्रत्येक प्रविष्टि उस स्थान पर पिक्सेल तीव्रता से मेल खाती है। फिर प्रत्येक पिक्सेल के स्थान को एक वेक्टर के रूप में दर्शाया जा सकता है जो छवि में उस पिक्सेल के निर्देशांक को दर्शाता है, [x, y], जहां x और y छवि मैट्रिक्स में एक पिक्सेल की पंक्ति और स्तंभ हैं। यह समन्वय को एक एफ़िन-ट्रांसफ़ॉर्मेशन मैट्रिक्स से गुणा करने की अनुमति देता है, जो यह स्थिति देता है कि आउटपुट छवि में पिक्सेल मान की प्रतिलिपि बनाई जाएगी।

हालांकि, उन परिवर्तनों को अनुमति देने के लिए जिन्हें अनुवाद परिवर्तनों की आवश्यकता होती है, 3 आयामी सजातीय निर्देशांक की आवश्यकता होती है। तीसरा आयाम आमतौर पर एक गैर-शून्य स्थिरांक पर सेट होता है, आमतौर पर 1, ताकि नया निर्देशांक [x, y, 1] हो। यह समन्वय वेक्टर को 3 से 3 मैट्रिक्स से गुणा करने की अनुमति देता है, जिससे अनुवाद बदलाव सक्षम होते हैं। तो तीसरा आयाम, जो स्थिरांक 1 है, अनुवाद की अनुमति देता है।

चूंकि मैट्रिक्स गुणन साहचर्य है, इसलिए कई एफ़िन ट्रांसफ़ॉर्मेशन को एक ही एफ़िन ट्रांसफ़ॉर्मेशन में जोड़ा जा सकता है, ताकि ट्रांसफ़ॉर्मेशन किए जाने के क्रम में प्रत्येक व्यक्तिगत ट्रांसफ़ॉर्मेशन के मैट्रिक्स को गुणा किया जा सके। इसका परिणाम एक एकल मैट्रिक्स में होता है, जब एक बिंदु वेक्टर पर लागू किया जाता है, तो वही परिणाम देता है जो अनुक्रम में वेक्टर [x, y, 1] पर किए गए सभी व्यक्तिगत परिवर्तनों के समान होता है। इस प्रकार एफ़िन ट्रांसफ़ॉर्मेशन मैट्रिसेस के अनुक्रम को सिंगल एफ़िन ट्रांसफ़ॉर्मेशन मैट्रिक्स में घटाया जा सकता है।

उदाहरण के लिए, 2 आयामी निर्देशांक केवल मूल (0, 0) के बारे में रोटेशन की अनुमति देते हैं। लेकिन 3 आयामी सजातीय निर्देशांक का उपयोग पहले किसी भी बिंदु को (0, 0) में अनुवाद करने के लिए किया जा सकता है, फिर रोटेशन का प्रदर्शन किया जा सकता है, और अंत में मूल बिंदु (0, 0) का मूल बिंदु (पहले अनुवाद के विपरीत) में अनुवाद किया जा सकता है। इन 3 एफ़िन परिवर्तनों को एक एकल मैट्रिक्स में जोड़ा जा सकता है, इस प्रकार छवि में किसी भी बिंदु के चारों ओर घूमने की अनुमति मिलती।

छवि आकृति विज्ञान के साथ denoising
गणितीय आकृति विज्ञान छवियों को रोकने के लिए उपयुक्त है।गणितीय आकृति विज्ञान में संरचना तत्व महत्वपूर्ण हैं।

निम्नलिखित उदाहरण संरचनात्मक तत्वों के बारे में हैं।Denoise फ़ंक्शन, छवि के रूप में i, और संरचना तत्व b के रूप में b को नीचे और तालिका के रूप में दिखाया गया है।

उदा। $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 60 & 55 \\ 25 & 15 & 5 \end{bmatrix} B = \begin{bmatrix} 1 & 2 & 1 \\ 2 & 1 & 1 \\ 1 & 0 & 3 \end{bmatrix}$$ डिफाइन डिफेशन (i, b) (i, j) = $$max\{I(i+m, j+n) + B(m,n)\}$$।चलो फैलाव (i, b) = d (i, b)

D (i ', b) (1,1) = $$max(45+1,50+2,65+1,40+2,60+1,55+1,25+1,15+0,5+3) = 66$$ कटाव को परिभाषित करें (i, b) (i, j) = $$min\{I(i+m, j+n) - B(m,n)\}$$।चलो कटाव (i, b) = e (i, b)

ई (i ', b) (1,1) = $$min(45-1,50-2,65-1,40-2,60-1,55-1,25-1,15-0,5-3) = 2$$ फैलाव के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 66 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$ कटाव के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 2 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$ एक उद्घाटन विधि बस पहले कटाव है, और फिर फैलाव की विधि के विपरीत है।वास्तव में, d (i, b) और e (i, b) कन्वर्शन द्वारा लागू किया जा सकता है

एक छवि के लिए denoising विधि को लागू करने के लिए, छवि को ग्रेस्केल में बदल दिया जाता है। denoising विधि वाला एक मुखौटा तार्किक मैट्रिक्स है $$[1 1 1 ; 1 1 1 ; 1 1 1]$$। denoising विधियां चित्र के केंद्र से आधी ऊंचाई, आधी चौड़ाई के साथ शुरू होती हैं, और पंक्ति संख्या, स्तंभ संख्या की छवि सीमा के साथ समाप्त होती हैं। सीमा के साथ मूल छवि में पड़ोसी एक ब्लॉक है [केंद्र के नीचे का बिंदु: ऊपर का बिंदु, केंद्र के बाईं ओर का बिंदु: केंद्र के दाईं ओर का बिंदु]। कनवल्शन नेबर और स्ट्रक्चरिंग एलिमेंट और फिर सेंटर को कम से कम पड़ोसी से बदलें।

उदाहरण के लिए समापन विधि लें।

पहले फैलाव लूप के लिए ## पंक्ति रेंज से विंडो के साथ न्यूनतम निकालें [2 ~ छवि ऊंचाई - 1] स्तंभ रेंज के साथ [2 ~ छवि चौड़ाई - 1]
 * 1) छवि पढ़ें और इसे MATLAB के साथ ग्रेस्केल में परिवर्तित करें।
 * 2) एक छवि का आकार प्राप्त करें। रिटर्न वैल्यू रो नंबर और कॉलम नंबर वे सीमाएं हैं जिनका हम बाद में उपयोग करने जा रहे हैं।
 * 3) संरचित तत्व आपके फैलाव या कटाव समारोह पर निर्भर करते हैं। पिक्सेल के पड़ोसी का न्यूनतम एक कटाव विधि की ओर जाता है और अधिकतम पड़ोसी एक फैलाव विधि की ओर जाता है।
 * 4) फैलाव, कटाव और समापन के लिए समय निर्धारित करें।
 * 5) मूल छवि के समान आकार का एक शून्य मैट्रिक्स बनाएं।
 * 6) स्ट्रक्चरिंग विंडो के साथ पहले फैलाव।
 * 7) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कन्वर्शन है
 * 1) शून्य मैट्रिक्स के लिए न्यूनतम मान भरें और एक नई छवि सहेजें
 * 2) सीमा के लिए, यह अभी भी सुधार किया जा सकता है। चूंकि विधि में, एक सीमा को नजरअंदाज कर दिया जाता है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।

फिर कटाव (इनपुट के रूप में फैलाव छवि लें) लूप के लिए ## पंक्ति रेंज से विंडो के साथ अधिकतम निकालें [2 ~ छवि ऊंचाई - 1] कॉलम रेंज के साथ [2 ~ छवि चौड़ाई - 1]
 * 1) मूल छवि के समान आकार का एक शून्य मैट्रिक्स बनाएं।
 * 2) संरचना खिड़की के साथ कटाव।
 * 3) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कन्वर्शन है
 * 1) शून्य मैट्रिक्स के लिए अधिकतम मान भरें और एक नई छवि सहेजें
 * 2) सीमा के लिए, यह अभी भी सुधार किया जा सकता है। विधि में से, सीमा को नजरअंदाज कर दिया जाता है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।
 * 3) परिणाम उपरोक्त तालिका के रूप में दिखाए गए हैं

डिजिटल कैमरा छवि
डिजिटल कैमरों में सामान्यतः विशेष डिजिटल छवि प्रसंस्करण हार्डवेयर शामिल हैं - या तो अनुरागी चिप या अन्य चिप पर अतिरिक्त परिपथिकी (सर्किटरी) - अपने छवि संवेदक (सेंसर) से मूल एवं प्रारम्भिक डेटा को मानक छवि संचिका (फ़ाइल) प्रारूप में रंग-सुधारित छवि में परिवर्तित करने के लिए हैं। अतिरिक्त स्थिति प्रसंस्करण तकनीक अधिक स्वाभाविक रूप से दिखने वाली छवियों को बनाने के लिए कोर तीक्षणता (एज शार्पनेस) या रंग संतृप्ति को बढ़ाती है।

फिल्म
वेस्टवर्ल्ड (1973) पहली वैशिष्टय (फीचर) फिल्म थी जिसने डिजिटल छवि प्रसंस्करण से लेकर उन्मत्त (पिक्सललेट) छायाचित्रण तक एंड्रॉइड के दृष्टिकोण को अनुकारित करने के लिए उपयोग किया गया। छवि प्रसंस्करण का उपयोग क्रोमा कुंजी प्रभाव (क्रोमा कि इफ़ेक्ट) उत्पन्न करने के लिए भी किया जाता है जो अभिनेताओं की पृष्ठभूमि को प्राकृतिक या कलात्मक दृश्यों से बदल देता है।

मुखाकृति परिचयन
मुखाकृति परिचयन गणितीय आकृति विज्ञान, असतत कोज्या रूपांतरण के साथ कार्यान्वित किया जाता है जिसे सामान्यतः DCT और क्षैतिज प्रक्षेपण (गणित) कहा जाता है।

विशेष गुण-आधारित विधि के साथ सामान्य विधि
विशेष गुण-आधारित विधि मुखाकृति परिचयन के लिए त्वचा की टोन, कोर पहचान, चेहरे का आकार और चेहरे की विशेषता (जैसे आंखें, मुंह, आदि) का उपयोग किया जाता है। त्वचा की टोन, चेहरे का आकार, और सभी अद्वितीय तत्व जो केवल मानव चेहरे के पास हैं, उन्हें विशेषताओं के रूप में वर्णित किया जा सकता है।

प्रक्रिया स्पष्टीकरण

 * 1) चेहरे की छवियों के एक बैच को देखते हुए, सबसे पहले, चेहरे की छवियों का प्रतिदर्शी लेकर त्वचा की टोन परिसर (रेंज) निकालें। त्वचा की टोन परिसर (रेंज) केवल त्वचा फिल्टर है।
 * 2) त्वचा की टोन निकालने के की स्थिति में छवियों की तुलना करने के लिए संरचनात्मक समानता सूचकांक माप (SSIM) लगाया जा सकता है।
 * 3) सामान्य रूप से, HSV या RGB रंग स्थान त्वचा फ़िल्टर के लिए उपयुक्त होते हैं। उदहारण HSV प्रणाली, त्वचा की टोन परिसर (रेंज) [0,48,50] ~ [20,255,255] है
 * 4) त्वचा की टोन के साथ छवियों को फ़िल्टर करने के बाद, चेहरे का कोर प्राप्त करने के लिए, चटकीलेपन को दूर करने और अनुपस्थित त्वचा क्षेत्रों को भरने के लिए आकृति विज्ञान और DCT का उपयोग किया जाता है।
 * 5) अनुपस्थित त्वचा को भरने के लिए प्रारंभिक विधि या समापन विधि का उपयोग किया जा सकता है।
 * 6) DCT त्वचा की टोन जैसी वस्तुओं से बचने के लिए है। चूंकि मानव चेहरों की संव्यूति (टेक्सचर) हमेशा उच्च होते है।
 * 7) चेहरे का कोर प्राप्त करने के लिए सोबेल ऑपरेटर या अन्य ऑपरेटरों का उपयोग किया जाता है।
 * 8) आंखों जैसी मानवीय विशेषताओं को स्थापित करने के लिए, प्रक्षेपण का उपयोग करके और प्रक्षेपण के आयतचित्र (हिस्टोग्राम) के अधिकतम मान ज्ञात करते है जिससे माउस, बाल और होंठ जैसी विशेष गुण प्राप्त करने में मदद करता है।
 * 9) प्रक्षेपण केवल उच्च आवृत्ति को देखने के लिए छवि को प्रक्षेपित करता है जो सामान्यतः विशेष गुण की स्थिति है।

छवि कोटि पद्धति में संशोधन
छवि कोटि कैमरा कंपन से प्रभावित हो सकती है, अति प्रभावाधीन (ओवर-एक्सपोज़र), ग्रे स्तर के वितरण को बहुत केंद्रीकृत, और चटकीला आदि से प्रभावित किया जा सकता है, उदाहरण के लिए, चटकीले होने की समस्या को चौरसाई (स्मूथिंग) विधि द्वारा ठीक किया जा सकता है जबकि ग्रे स्तर वितरण समस्या को आयतचित्र (हिस्टोग्राम) समीकरण द्वारा संशोधित किया जा सकता है।

चौरसाई (स्मूथिंग) विधि
चित्रण में, अगर कुछ अनैच्छिक रंग है, तो अनैच्छिक रंग के आसपास कुछ रंग लेना और उनका औसत लिया जाता है। यह चौरसाई (स्मूथिंग) विधि के उपयोग का आसान तरीका है।

चौरसाई (स्मूथिंग) विधि को आवरण और संवलन के साथ परिपालित किया जा सकता है। उदाहरण के लिए नीचे दी गई छोटी छवि और आवरण देखें।

छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 1 & 4 & 6 \\ 1 & 28 & 30 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

आवरण$$ \begin{bmatrix} 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \end{bmatrix} $$है।

संवलन और चौरसाई (स्मूथिंग) के बाद, छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 9 & 10 & 6 \\ 1 & 9 & 9 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

छवियों का अवलोकन [1, 1], छवि [1, 2], छवि [2, 1], और छवि [2, 2]।

मूल छवि पिक्सेल 1, 4, 28, 30 है। मास्क को चिकना करने के बाद, पिक्सेल क्रमशः 9, 10, 9, 9 हो जाता है।

नई छवि [1, 1] = $$\tfrac{1}{9}$$ * (छवि [0,0]+छवि [0,1]+छवि [0,2]+छवि [1,0]+छवि [1,1]+छवि [1,2]+छवि [2,0]+छवि [2,1]+छवि [2,2])

नई छवि [1, 1] = फलक ($$\tfrac{1}{9}$$ * (2+5+6+3+1+4+1+28+30)) = 9

नई छवि [1, 2] = फलक ($$\tfrac{1}{9}$$ * (5+6+5+1+4+6+28+30+2)) = 10

नई छवि [2, 1] = फलक ($$\tfrac{1}{9}$$ * (3+1+4+1+28+30+73+3+2)) = 9

नई छवि [2, 2] = फलक ($$\tfrac{1}{9}$$ * (1+4+6+28+30+2+3+2+2)) = 9

ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि
सामान्यतः, नीचे दी गई छवि से ग्रे स्तर का आयतचित्र (हिस्टोग्राम) दिया जाता है। छवि से समान वितरण के लिए आयतचित्र (हिस्टोग्राम) को बदलना सामान्यतः हम आयतचित्र (हिस्टोग्राम) समकरण कहते हैं।



असतत समय में, ग्रे स्तर आयतचित्र (हिस्टोग्राम) का क्षेत्र है $$\sum_{i=0}^{k}H(p_i)$$ (चित्र 1 देखें) जबकि समान वितरण का क्षेत्रफल $$\sum_{i=0}^{k}G(q_i)$$ है (चित्र 2 देखें)। यह स्पष्ट है कि क्षेत्र नहीं बदलेगा, इसलिए $$\sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)$$।

समान वितरण से, $$q_i$$ की प्रायिकता $$\tfrac{N^2}{q_k - q_0}$$ है जब $$ 0 < i < k $$

निरंतर समय में, समीकरण $$\displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds$$ है।

इसके अलावा, किसी फलन की परिभाषा के आधार पर, ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि $$f$$ फलन प्राप्त करने जैसा है, यह f(p) = q को संतुष्ट करता है।

यह भी देखें
• Digital imaging

• Computer graphics

• Computer vision

• CVIPtools

• Digitizing

• Fourier transform

• Free boundary condition

• GPGPU

• Homomorphic filtering

• Image analysis

• IEEE Intelligent Transportation Systems Society

• Least-squares spectral analysis

• Multidimensional systems

• Relaxation labelling

• Remote sensing software

• Standard test image

• Superresolution

• Total variation denoising

• Machine Vision

• Bounded variation

• Radiomics

अग्रिम पठन

 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288

बाहरी संबंध

 * Lectures on Image Processing, by Alan Peters. Vanderbilt University. Updated 7 January 2016.
 * Processing digital images with computer algorithms

]