डिजिटल इमेज प्रोसेसिंग

डिजिटल छवि प्रसंस्करण किसी कलन विधि (एल्गोरिदम) के माध्यम से डिजिटल छवियों को संसाधित करने के लिए डिजिटल संगणक (कंप्यूटर) का उपयोग है। डिजिटल एकल प्रसंस्करण के उपश्रेणी या क्षेत्र के रूप में, डिजिटल छवि प्रसंस्करण के समधर्मी (एनालॉग) छवि प्रसंस्करण पर कई फायदे हैं। यह निविष्टि डेटा पर कलन विधि (एल्गोरिदम) की विस्तृत श्रृंखला को उपयोजित करता है और प्रसंस्करण के दौरान शोर (कोलाहल) के निर्माण और विरूपण जैसी समस्याओं का परिवर्जन कर सकता है। चूंकि छवियों को दो विमाओ (शायद अधिक) पर निरूपित किया गया है, इसलिए डिजिटल छवि प्रसंस्करण को बहुविमीय प्रणालियों के रूप में प्रतिदर्श किया जा सकता है। डिजिटल छवि प्रसंस्करण का निर्माण और विकास मुख्य रूप से तीन कारकों से प्रभावित होता है, संगणक (कंप्यूटर) का विकास, गणित का विकास (विशेषकर असतत गणित सिद्धांत का निर्माण और सुधार), पर्यावरण, कृषि, सैन्य, उद्योग और चिकित्सा विज्ञान में अनुप्रयोगों की एक विस्तृत श्रृंखला की आवश्यकता में वृद्धि।

इतिहास
1960 के दशक में, डिजिटल छवि प्रसंस्करण की कई तकनीकें, या जिन्हें प्रायः डिजिटल चित्रण प्रसंस्करण कहा जाता है, बेल प्रयोगशाला, जेट प्रोपल्शन (प्रणोदन) प्रयोगशाला, मैसाचुसेट्स प्राद्योगिकी संस्थान, मैरीलैंड विश्वविद्यालय और कुछ अन्य शोध सुविधाएं उपग्रह बिंबावली (सैटेलाइट इमेजरी), मानक तंत्रिका-फोटो संक्रिया(वायर-फोटो स्टैण्डर्ड कन्वर्शन), मेडिकल प्रतिबिंबन, वीडियोफोन, संप्रतीक अभिज्ञान (करैक्टर रिकग्निशन), और छायाचित्र वर्धन के लिए अनुप्रयोगों के साथ विकसित की गई। प्रारंभिक छवि प्रसंस्करण का उद्देश्य छवि की गुणवत्ता में सुधार तथा मनुष्यों के लिए लोगों के दृश्य प्रभाव में सुधार करना है। छवि प्रसंस्करण में, निविष्ट एक निम्न-कोटि वाली छवि होती है, और निर्गत उच्च कोटि वाली छवि प्राप्त होती है। सामान्य छवि प्रसंस्करण में छवि वर्धन, प्रत्यावर्तन, संकेतन और संपीड़न होता है। पहला सफल अनुप्रयोग अमेरिकन जेट प्रणोदन (प्रोपल्शन) प्रयोगशाला (JPL) था। उन्होंने सूर्य की स्थिति और चंद्रमा के वातावरण को ध्यान में रखते हुए 1964 में अन्तरिक्ष संसूचक रेज़र 7 द्वारा वापस भेजी गई हजारों चंद्र तस्वीरों पर छवि प्रसंस्करण तकनीकों जैसे कि ज्यामितीय सुधार, उन्नयन परिवर्तन, चटकीलापन हटाने आदि का उपयोग किया। संगणक (कंप्यूटर) द्वारा चंद्रमा की सतह के नक्शे की सफल मैपिंग का प्रभाव एक बड़ी सफलता रही है। बाद में, अंतरिक्ष यान द्वारा वापस भेजी गई लगभग 100,000 तस्वीरों पर अधिक जटिल छवि प्रसंस्करण का प्रदर्शन किया गया, ताकि स्थलाकृतिक मानचित्र, रंगीन मानचित्र और चंद्रमा का विशालदर्शी चित्र वर्ण प्राप्त किया जा सके, जिसने असाधारण परिणाम हासिल किए और चांद पर मानव के उतरने की ठोस नींव रखी। <रेफ नाम =: 1>

हालाँकि, उस युग के संगणक (कंप्यूटिंग) उपकरणों के साथ प्रसंस्करण की लागत काफी अधिक थी। यह 1970 के दशक में बदल गया, जब डिजिटल छवि प्रसंस्करण सस्ते संगणक (कंप्यूटर) के रूप में आ गई और उपयुक्त हार्डवेयर उपलब्ध हो गया। इससे छवियों को वास्तविक समय में संसाधित किया जाता है, कुछ निष्ठित समस्याओं जैसे कि दूरदर्शन (टेलीविजन) मानकों के संक्रिया के लिए। जैसे-जैसे सामान्य-प्रयोजन वाले संगणक (कंप्यूटर) तीव्रता से कार्य करने लगे, उन्होंने सबसे विशिष्ट और संगणक (कंप्यूटर)-गहन संचालन को छोड़कर सभी के लिए उपयुक्त हार्डवेयर की भूमिका निभानी शुरू कर दी। 2000 के दशक में उपलब्ध तीव्रता से कार्य करने वाला संगणक (कंप्यूटर) और एकल संसाधित्र (प्रोसेसर) के साथ, डिजिटल छवि प्रसंस्करण छवि प्रसंस्करण का सबसे सामान्य रूप बन गया है, और सामान्यतः छवि प्रसंस्करण में इसका उपयोग किया जाता है क्योंकि यह न केवल सबसे बहुमुखी तरीका है, बल्कि सबसे सस्ता भी है।

छवि संवेदक (सेंसर)
आधुनिक छवि संवेदक (सेंसर) का आधार धातु आक्साइड अर्धचालक (MOS) तकनीक है, जो 1959 में बेल प्रयोगशाला में मोहम्मद एम. अटाला और डॉन कहंग द्वारा MOSFET (MOS क्षेत्र प्रभावी ट्रांजिस्टर (फील्ड-इफेक्ट ट्रांजिस्टर)) के आविष्कार से उत्पन्न की गई। इससे डिजिटल अर्धचालक छवि संवेदक (सेंसर) का विकास हुआ, जिसमें आवेश युग्मित युक्ति (CCD) और बाद में CMOS संवेदक (सेंसर) शामिल हैं।

आवेश युग्मित युक्ति का आविष्कार विलार्ड एस. बॉयल और जॉर्ज ई. स्मिथ ने 1969 में बेल प्रयोगशाला में किया। MOS तकनीक पर शोध करते समय, उन्होंने महसूस किया कि विद्युत आवेश चुंबकीय बुद्बुद्द स्मृति का सादृश्य है और इसे छोटे से MOS संधारित्र पर संग्रहीत किया जा सकता है। चूंकि MOS संधारित्र की एक श्रृंखला को एक पंक्ति में बनाना काफी सरल होता है, इसलिए उन्होंने उनमे उपयुक्त वोल्टेज लगाया गया ताकि आवेश को एक से दूसरे तक ले जाया जा सके। CCD एक अर्धचालक परिपथ है जिसका उपयोग बाद में दूरदर्शन (टेलीविजन) प्रसारण के लिए पहले डिजिटल वीडियो कैमरों में किया गया।

NMOS एक्टिव-पिक्सेल संवेदक (सेंसर) (APS) का आविष्कार 1980 के दशक के मध्य में जापान में ओलंपस द्वारा किया गया था। यह MOS अर्धचालक युक्ति संरचना में अग्रिमों द्वारा सक्षम किया गया, जिसमें MOSFET प्रवर्धन छोटे माइक्रोन और फिर उप-माइक्रोन स्तर तक पहुंच गई। NMOS APS को 1985 में ओलंपस में त्सुतोमु नाकामुरा की टीम द्वारा बनाया गया। CMOS एक्टिव-पिक्सेल संवेदक (सेंसर) (CMOS संवेदक (सेंसर)) को बाद में एरिक फॉसम की टीम द्वारा 1993 में नासा जेट प्रणोदन (प्रोपल्शन) प्रयोगशाला में विकसित किया गया था। 2007 तक, CMOS संवेदक (सेंसर) की बिक्री ने CCD संवेदक (सेंसर) से अधिक बिक्री की।

छवि संपीडन
डिजिटल छवि संपीडन दूरदर्शन (टेक्नोलॉजी) में महत्वपूर्ण विकास असतत कोज्या रूपांतरण (DCT) है, जो नासिर अहमद द्वारा पहली बार 1972 में प्रस्तावित एक हानिपूर्ण संपीड़न तकनीक थी। DCT संपीड़न JPEG के लिए आधार बन गया, जिसे 1992 में संयुक्त छायाचित्रित (फोटोग्राफिक) विशेषज्ञों के समूह द्वारा प्रस्तुत किया गया। JPEG छवियों को बहुत छोटे फ़ाइल आकारों में संकुचित करता है, और इंटरनेट पर सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है। इसका अत्यधिक कुशल DCT संपीड़न कलन विधि (एल्गोरिथ्म) डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था, तक हर दिन कई अरब JPEG छवियों का उत्पादन किया गया।

डिजिटल संकेत संसाधित्र (प्रोसेसर) (DSP)
1970 के दशक में MOS तकनीक को व्यापक रूप से अपनाने से इलेक्ट्रॉनिक संकेत प्रसंस्करण में क्रांति आई। MOS समाकलित (इंटीग्रेटेड) परिपथ तकनीक 1970 के दशक की शुरुआत में पहले एकल-चिप सूक्ष्म संसाधित्र (माइक्रोप्रोसेसर्स) और माइक्रो नियंत्रक (माइक्रोकंट्रोलर्स) के लिए आधार है, और फिर 1970 के दशक के अंत में पहला एकल-चिप डिजिटल संकेत संसाधित्र (प्रोसेसर) (DSP) चिप। DSP चिप तब से डिजिटल छवि प्रसंस्करण में व्यापक रूप से उपयोग किया गया।

असतत कोज्या रूपांतरण (DCT) छवि संपीडन कलन विधि (एल्गोरिदम) को DSP चिप में व्यापक रूप से लागू किया गया है, जिसमें कई कंपनियां DCT प्रौद्योगिकी के आधार पर DSP चिप विकसित करती हैं। DCTs व्यापक रूप से एन्कोडिंग, डिकोडिंग, वीडियो कोडिंग, श्रव्य कोडिंग, बहुभाजन (मल्टीप्लेक्सिंग), नियंत्रण संकेत (कंट्रोल सिग्नल्स), संकेत (सिग्नल्स), समधर्मी (एनालॉग)-से-डिजिटल रूपांतरण, आरूपण ज्योतिर्मयता (फॉर्मेटिंग ल्यूमिनेंस) और रंग अंतर, और रंग प्रारूप जैसे YUV444 और YUV411 के लिए व्यापक रूप से उपयोग किया जाता है। DCT का उपयोग एन्कोडिंग संचालन के लिए भी किया जाता है जैसे कि गति अनुमान, गति प्रतिकर, अंतर-फ्रेम पूर्वाकलन, परिमाणीकरण, प्रात्यक्षिक भार, एन्ट्रापी एन्कोडिंग, चर (वेरिएबल) एन्कोडिंग, और गति सदिश, और विभिन्न रंग प्रारूपों के बीच विपरीत संचालन (YIQ, YUV और RGB) प्रदर्शनी (डिस्प्ले) प्रयोजन के लिए होते है। DCT का उपयोग सामान्यतः उच्च स्पष्टता दूरदर्शन (हाई-डेफिनिशन टेलीविज़न) (HDTV) एनकोडर/डिकोडर चिप के लिए भी किया जाता है।

चिकित्सीय प्रतिबिंबन (मेडिकल इमेजिंग)
1972 में, ब्रिटिश कंपनी EMI हाउसफील्ड के अभियांत्रिक ने मस्तष्क रोगनिदान के लिए एक्स-रे अभिकलित (कंप्यूटेड) टोमोग्राफी उपकरण का आविष्कार किया, जिसे समान्यतः CT (संगणक (कंप्यूटर) टोमोग्राफी) कहा जाता है। CT केन्द्रक (न्यूक्लियस) विधि मानव मस्तष्क के खंड के प्रक्षेपण पर आधारित है और संगणक (कंप्यूटर) द्वारा क्रॉस-अनुभागीय छवि के पुनर्निर्माण के लिए संसाधित की जाती है, जिसे छवि पुनर्निर्माण कहा जाता है। 1975 में, EMI ने सफलतापूर्वक पूरे शरीर के लिए एक CT उपकरण विकसित किया, जिसने मानव शरीर के विभिन्न हिस्सों की एक स्पष्ट टोमोग्राफिक छवि प्राप्त की। 1979 में, इस रोगनिदान तकनीक ने नोबेल पुरस्कार जीता। <रेफरी नाम =: 1 /> चिकित्सा अनुप्रयोगों के लिए डिजिटल छवि प्रसंस्करण तकनीक को 1994 में अंतरिक्ष अनुसंधान अंतरिक्ष प्रौद्योगिकी हॉल ऑफ फ़ेम में शामिल किया गया।

कार्य
डिजिटल छवि प्रसंस्करण बहुत अधिक जटिल कलन विधि (एल्गोरिदम) के उपयोग की अनुमति देता है, और इसलिए, सरल कार्यों में अधिक परिष्कृत प्रदर्शन और उन तरीकों के कार्यान्वयन का परिपालन कर सकता है जो समधर्मी (एनालॉग) माध्यमों से असंभव होगा।

विशेष रूप से, डिजिटल छवि प्रसंस्करण का एक ठोस अनुप्रयोग है, और एक प्रायोगिक तकनीक पर आधारित है:
 * वर्गीकरण
 * विशेषता निकर्ष
 * बहु-स्तरीय संकेत विश्लेषण
 * अभिरचना (पैटर्न) पहचान
 * प्रक्षेपण

डिजिटल छवि प्रसंस्करण में उपयोग की जाने वाली कुछ तकनीकों में शामिल हैं:
 * विषमदैशिक विसरण
 * अप्रत्यक्ष मार्कोव मॉडल
 * छवि संशोधन
 * छवि बहाली (प्रत्यावर्तन)
 * स्वतंत्र घटक विश्लेषण
 * रैखिक फ़िल्टरिंग
 * तंत्रिका - तंत्र
 * आंशिकअवकल समीकरण
 * पिक्सेलेशन
 * अभिलक्षण (फीचर) सुमेलन का उल्लेख
 * प्रमुख घटक विश्लेषण
 * स्व-आयोजन मानचित्र
 * तरंगिका

फ़िल्टरिंग
डिजिटल फिल्टर का उपयोग डिजिटल छवियों को धुंधला और तेज करने के लिए किया जाता है। फ़िल्टरिंग द्वारा किया जा सकता है:
 * स्थानिक कार्यक्षेत्र में विशेष रूप से बनाए गए कर्नेल (फ़िल्टर सरणी) के साथ संवलन <रेफ नाम =: 0>
 * आवृत्ति (फॉरिएर) कार्यक्षेत्र में विशिष्ट आवृत्ति क्षेत्रों का आवरण करता है

निम्नलिखित उदाहरण दोनों विधियों को दिखाते हैं: <रेफ नाम = गोंजालेज 2008>

फॉरिएर कार्यक्षेत्र फ़िल्टरिंग में छवि पैडिंग
छवियों को सामान्यतः फॉरिएर स्पेस में बदलने से पहले स्थूल (पैडेड) किया जाता है, नीचे दिए गए उच्च पारक (हाईपास) फ़िल्टर की गई छवियां विभिन्न पैडिंग तकनीकों के परिणामों को दर्शाती हैं।

ध्यान दें कि पुनरावर्ती कोर वाले पैडिंग की तुलना में शून्य स्थूल (पैडेड) होने पर उच्च पारक (हाईपास) फ़िल्टर अतिरिक्त कोर को दिखाता है।

फ़िल्टरिंग कोड उदाहरण
स्थानिक कार्यक्षेत्र उच्च पारक (हाईपास) फ़िल्टरिंग के लिए MATLAB उदाहरण है। % 3x3 लाप्लासियन कर्नेल

सजातीय संक्रिया
सजातीय संक्रिया पैमाने, घूर्णन, स्थानांतरण, दर्पण और अपरूपण सहित मूलभूत छवि परिवर्तनों को सक्षम करते हैं जैसा कि निम्नलिखित उदाहरणों में दिखाया गया है।

छवि के लिए सजातीय आव्यूह के उपयोग के लिए, छवि को आव्यूह में बदल दिया जाता है जिसमें प्रत्येक प्रविष्टि उस स्थान पर पिक्सेल तीव्रता के सामान होती है। फिर प्रत्येक पिक्सेल के स्थान को सदिश के रूप में दर्शाया जाता है जो छवि में उस पिक्सेल के निर्देशांक को दर्शाता है, [x, y], जहां x और y छवि आव्यूह में पिक्सेल की पंक्ति और स्तंभ हैं। यह निर्देशांक सजातीय-संक्रिया आव्यूह से गुणा करते है, जो यह स्थिति देता है कि निष्पाद (आउटपुट) छवि में पिक्सेल मान की प्रतिलिपि बनाई जाती है।

हालांकि, उन रूपांतरणों की अनुमति देने के लिए जिन्हें प्रतिश्रवणिक (ट्रांसलेशन) रूपांतरणों की आवश्यकता होती है, त्रि विमीय सजातीय निर्देशांक की आवश्यकता होती है। तीसरी विमा सामान्यतः अशून्य स्थिरांक के लिए समुच्चय होता है, सामान्यतः 1, ताकि नया निर्देशांक [x, y, 1] हो। यह निर्देशांक सदिश को 3 बटा 3 आव्यूह से गुणा करने की अनुमति देता है, जिससे अनुवाद बदलाव सक्षम होते हैं। तो तीसरी विमा, जो स्थिरांक 1 है, स्थानान्तरण की अनुमति देता है।

चूंकि आव्यूह गुणन साहचर्य है, इसलिए कई सजातीय रूपांतरणों को एक ही सजातीय संक्रियामें जोड़ा जा सकता है, ताकि रूपांतरण किए जाने के क्रम में प्रत्येक विशिष्ट संक्रिया के आव्यूह को गुणा किया जा सके। इसका परिणाम एक एकल आव्यूह होता है, जब एक सदिश बिंदु पर लागू किया जाता है, तो वह परिणाम प्राप्त होता है जो अनुक्रम में सदिश [x, y, 1] पर किए गए सभी विशिष्ट परिवर्तनों के समान होता है। इस प्रकार सजातीय संक्रिया आव्यूह के अनुक्रम को एकल सजातीय संक्रिया आव्यूह में घटाया जा सकता है।

उदाहरण के लिए, द्वी विमीय निर्देशांक केवल मूल (0, 0) के चारों ओर में घूर्णन की अनुमति देते हैं। लेकिन त्रि विमीय सजातीय निर्देशांक का उपयोग पहले किसी भी बिंदु को (0, 0) में स्थानान्तरित करने के लिए किया जा सकता है, फिर घूर्णन किया जा सकता है, और अंत में मूल बिंदु (0, 0) का मूल बिंदु (पहले स्थानांतरण के विपरीत) में स्थानांतरण किया जा सकता है। इन 3 सजातीय परिवर्तनों को एकल आव्यूह में जोड़ा जा सकता है, इस प्रकार छवि में किसी भी बिंदु के चारों ओर घूर्णन करता है।

छवि आकृति विज्ञान के साथ डेनोइसिंग
गणितीय आकृति विज्ञान छवियों को निरूपित करने के लिए उपयुक्त है। गणितीय आकृति विज्ञान में संरचना तत्व महत्वपूर्ण हैं।

निम्नलिखित उदाहरण संरचना तत्वों के बारे में हैं। डेनोइसे फलन, I के रूप में छवि, और B के रूप में संरचना तत्व को नीचे और तालिका के रूप में दिखाया गया है।

उदहारण के लिए $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 60 & 55 \\ 25 & 15 & 5 \end{bmatrix} B = \begin{bmatrix} 1 & 2 & 1 \\ 2 & 1 & 1 \\ 1 & 0 & 3 \end{bmatrix}$$

विस्तारण को परिभाषित करें (i, b) (i, j) = $$max\{I(i+m, j+n) + B(m,n)\}$$। माना विस्तारण (i, b) = d (i, b)

D(i ', b) (1,1) = $$max(45+1,50+2,65+1,40+2,60+1,55+1,25+1,15+0,5+3) = 66$$

अपक्षरण को परिभाषित करें (i, b) (i, j) = $$min\{I(i+m, j+n) - B(m,n)\}$$। माना अपक्षरण (i, b) = e (i, b)

E(i ', b) (1,1) = $$min(45-1,50-2,65-1,40-2,60-1,55-1,25-1,15-0,5-3) = 2$$

विस्तारण के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 66 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$अपक्षरण के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 2 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$

अभिमुख विधि केवल पहला अपक्षरण है, और फिर विस्तारण होता है जबकि संवरण विधि इसके विपरीत है। वास्तव में, D(i, b) और E(i, b) को संवलन द्वारा कार्यान्वित किया जा सकता है

छवि के लिए डेनोइसिंग विधि के उपयोग के लिए, छवि को ग्रे स्केल में परिवर्तित कर दिया जाता है। डेनोइसिंग विधि वाला आवरण तार्किक मैट्रिक्स $$[1 1 1 ; 1 1 1 ; 1 1 1]$$ है। डेनोइसिंग विधियां चित्र के केंद्र से आधी ऊंचाई, आधी चौड़ाई से शुरू होती हैं, और पंक्ति संख्या, स्तंभ संख्या की छवि सीमा के साथ समाप्त होती हैं। सीमा के साथ मूल छवि में सहवासी (नेबर) अवरोध (ब्लॉक) [केंद्र के नीचे का बिंदु: ऊपर का बिंदु, केंद्र के बाईं ओर का बिंदु: केंद्र के दाईं ओर का बिंदु] है। संवलन सहवासी (नेबर) और संरचना तत्व और फिर केंद्र को न्यूनतम सहवासी (नेबर) से बदलें।।

उदाहरण के लिए संवरण विधि लें।

प्रथम विस्तारण
 * 1) छवि पढ़ें और इसे Matlab के साथ ग्रेस्केल में बदलें।
 * 2) छवि की माप प्राप्त करें। प्रत्युत्तर (रिटर्न) मान पंक्ति संख्याएँ और स्तंभ संख्याएँ सीमाओ का बाद में उपयोग किया जाता है।
 * 3) संरचना तत्व आपके विस्तारण या अपक्षरण फलन पर निर्भर करते हैं। पिक्सेल के सहवासी (नेबर) का न्यूनतम अपक्षरण विधि की ओर अग्रसित है और अधिकतम सहवासी (नेबर) विस्तारण विधि की ओर अग्रसित है।
 * 4) विस्तारण, अपक्षरण और संवरण के लिए समय निर्धारित करें।
 * 5) मूल छवि के समान आकार का शून्य आव्यूह बनाएं।
 * 6) संरचना गवाक्ष (विंडो) के साथ प्रथम विस्तारण हैं।
 * 7) संरचना गवाक्ष (विंडो) 3*3 आव्यूह और संवलन है
 * 8) लूप के लिए पंक्ति श्रेणी से गवाक्ष (विंडो) के साथ न्यूनतम मान निकालें [2 ~ छवि ऊंचाई - 1] स्तंभ श्रेणी के साथ [2 ~ छवि चौड़ाई - 1]
 * 9) न्यूनतम मान को शून्य आव्यूह में भरें और एक नई छवि संचित करें
 * 10) सीमा के लिए, इसमें अभी भी सुधार किया जा सकता है। चूंकि विधि में, सीमा की उपेक्षा की जाती है। सीमाओं से निपटने के लिए पैडिंग तत्वों का उपयोग किया जाता है।

फिर अपक्षरण (विस्तारण छवि को निविष्ट के रूप में लें)
 * 1) मूल छवि के समान आकार का शून्य आव्यूह बनाएं।
 * 2) संरचनात्मक गवाक्ष (विंडो) के साथ अपक्षरण।
 * 3) संरचना गवाक्ष (विंडो) 3*3 आव्यूह और संवलन है
 * 4) लूप के लिए पंक्ति श्रेणी से गवाक्ष (विंडो) के साथ अधिकतम मान निकालें [2 ~ छवि ऊंचाई - 1] स्तंभ श्रेणी के साथ [2 ~ छवि चौड़ाई - 1]


 * 1) अधिकतम मान को शून्य आव्यूह में भरें और एक नई छवि संचित करें
 * 2) सीमा के लिए, इसमें अभी भी सुधार किया जा सकता है। चूंकि विधि में सीमा की उपेक्षा की जाती है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जाता है।
 * 3) परिणाम उपरोक्त तालिका के अनुसार हैं

डिजिटल कैमरा छवि
डिजिटल कैमरों में सामान्यतः विशेष डिजिटल छवि प्रसंस्करण हार्डवेयर शामिल हैं - या तो अनुरागी चिप या अन्य चिप पर अतिरिक्त परिपथिकी (सर्किटरी) - अपने छवि संवेदक (सेंसर) से मूल एवं प्रारम्भिक डेटा को मानक छवि संचिका (फ़ाइल) प्रारूप में रंग-सुधारित छवि में परिवर्तित करने के लिए हैं। अतिरिक्त स्थिति प्रसंस्करण तकनीक अधिक स्वाभाविक रूप से दिखने वाली छवियों को बनाने के लिए कोर तीक्षणता (एज शार्पनेस) या रंग संतृप्ति को बढ़ाती है।

फिल्म
वेस्टवर्ल्ड (1973) पहली वैशिष्टय (फीचर) फिल्म थी जिसने डिजिटल छवि प्रसंस्करण से लेकर उन्मत्त (पिक्सललेट) छायाचित्रण तक एंड्रॉइड के दृष्टिकोण को अनुकारित करने के लिए उपयोग किया गया। छवि प्रसंस्करण का उपयोग क्रोमा कुंजी प्रभाव (क्रोमा कि इफ़ेक्ट) उत्पन्न करने के लिए भी किया जाता है जो अभिनेताओं की पृष्ठभूमि को प्राकृतिक या कलात्मक दृश्यों से बदल देता है।

मुखाकृति परिचयन
मुखाकृति परिचयन गणितीय आकृति विज्ञान, असतत कोज्या संक्रियाके साथ कार्यान्वित किया जाता है जिसे सामान्यतः DCT और क्षैतिज प्रक्षेपण (गणित) कहा जाता है।

विशेष गुण-आधारित विधि के साथ सामान्य विधि
विशेष गुण-आधारित विधि मुखाकृति परिचयन के लिए त्वचा की टोन, कोर पहचान, चेहरे का आकार और चेहरे की विशेषता (जैसे आंखें, मुंह, आदि) का उपयोग किया जाता है। त्वचा की टोन, चेहरे का आकार, और सभी अद्वितीय तत्व जो केवल मानव चेहरे के पास हैं, उन्हें विशेषताओं के रूप में वर्णित किया जा सकता है।

प्रक्रिया स्पष्टीकरण

 * 1) चेहरे की छवियों के एक बैच को देखते हुए, सबसे पहले, चेहरे की छवियों का प्रतिदर्शी लेकर त्वचा की टोन परिसर (रेंज) निकालें। त्वचा की टोन परिसर (रेंज) केवल त्वचा फिल्टर है।
 * 2) त्वचा की टोन निकालने के की स्थिति में छवियों की तुलना करने के लिए संरचनात्मक समानता सूचकांक माप (SSIM) लगाया जा सकता है।
 * 3) सामान्य रूप से, HSV या RGB रंग स्थान त्वचा फ़िल्टर के लिए उपयुक्त होते हैं। उदहारण HSV प्रणाली, त्वचा की टोन परिसर (रेंज) [0,48,50] ~ [20,255,255] है
 * 4) त्वचा की टोन के साथ छवियों को फ़िल्टर करने के बाद, चेहरे का कोर प्राप्त करने के लिए, चटकीलेपन को दूर करने और अनुपस्थित त्वचा क्षेत्रों को भरने के लिए आकृति विज्ञान और DCT का उपयोग किया जाता है।
 * 5) अनुपस्थित त्वचा को भरने के लिए प्रारंभिक विधि या समापन विधि का उपयोग किया जा सकता है।
 * 6) DCT त्वचा की टोन जैसी वस्तुओं से बचने के लिए है। चूंकि मानव चेहरों की संव्यूति (टेक्सचर) हमेशा उच्च होते है।
 * 7) चेहरे का कोर प्राप्त करने के लिए सोबेल ऑपरेटर या अन्य ऑपरेटरों का उपयोग किया जाता है।
 * 8) आंखों जैसी मानवीय विशेषताओं को स्थापित करने के लिए, प्रक्षेपण का उपयोग करके और प्रक्षेपण के आयतचित्र (हिस्टोग्राम) के अधिकतम मान ज्ञात करते है जिससे माउस, बाल और होंठ जैसी विशेष गुण प्राप्त करने में मदद करता है।
 * 9) प्रक्षेपण केवल उच्च आवृत्ति को देखने के लिए छवि को प्रक्षेपित करता है जो सामान्यतः विशेष गुण की स्थिति है।

छवि कोटि पद्धति में संशोधन
छवि कोटि कैमरा कंपन से प्रभावित हो सकती है, अति प्रभावाधीन (ओवर-एक्सपोज़र), ग्रे स्तर के वितरण को बहुत केंद्रीकृत, और चटकीला आदि से प्रभावित किया जा सकता है, उदाहरण के लिए, चटकीले होने की समस्या को चौरसाई (स्मूथिंग) विधि द्वारा ठीक किया जा सकता है जबकि ग्रे स्तर वितरण समस्या को आयतचित्र (हिस्टोग्राम) समीकरण द्वारा संशोधित किया जा सकता है।

चौरसाई (स्मूथिंग) विधि
चित्रण में, अगर कुछ अनैच्छिक रंग है, तो अनैच्छिक रंग के आसपास कुछ रंग लेना और उनका औसत लिया जाता है। यह चौरसाई (स्मूथिंग) विधि के उपयोग का आसान तरीका है।

चौरसाई (स्मूथिंग) विधि को आवरण और संवलन के साथ परिपालित किया जा सकता है। उदाहरण के लिए नीचे दी गई छोटी छवि और आवरण देखें।

छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 1 & 4 & 6 \\ 1 & 28 & 30 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

आवरण$$ \begin{bmatrix} 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \end{bmatrix} $$है।

संवलन और चौरसाई (स्मूथिंग) के बाद, छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 9 & 10 & 6 \\ 1 & 9 & 9 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

छवियों का अवलोकन [1, 1], छवि [1, 2], छवि [2, 1], और छवि [2, 2]।

मूल छवि पिक्सेल 1, 4, 28, 30 है। मास्क को चिकना करने के बाद, पिक्सेल क्रमशः 9, 10, 9, 9 हो जाता है।

नई छवि [1, 1] = $$\tfrac{1}{9}$$ * (छवि [0,0]+छवि [0,1]+छवि [0,2]+छवि [1,0]+छवि [1,1]+छवि [1,2]+छवि [2,0]+छवि [2,1]+छवि [2,2])

नई छवि [1, 1] = फलक ($$\tfrac{1}{9}$$ * (2+5+6+3+1+4+1+28+30)) = 9

नई छवि [1, 2] = फलक ($$\tfrac{1}{9}$$ * (5+6+5+1+4+6+28+30+2)) = 10

नई छवि [2, 1] = फलक ($$\tfrac{1}{9}$$ * (3+1+4+1+28+30+73+3+2)) = 9

नई छवि [2, 2] = फलक ($$\tfrac{1}{9}$$ * (1+4+6+28+30+2+3+2+2)) = 9

ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि
सामान्यतः, नीचे दी गई छवि से ग्रे स्तर का आयतचित्र (हिस्टोग्राम) दिया जाता है। छवि से समान वितरण के लिए आयतचित्र (हिस्टोग्राम) को बदलना सामान्यतः हम आयतचित्र (हिस्टोग्राम) समकरण कहते हैं।



असतत समय में, ग्रे स्तर आयतचित्र (हिस्टोग्राम) का क्षेत्र है $$\sum_{i=0}^{k}H(p_i)$$ (चित्र 1 देखें) जबकि समान वितरण का क्षेत्रफल $$\sum_{i=0}^{k}G(q_i)$$ है (चित्र 2 देखें)। यह स्पष्ट है कि क्षेत्र नहीं बदलेगा, इसलिए $$\sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)$$।

समान वितरण से, $$q_i$$ की प्रायिकता $$\tfrac{N^2}{q_k - q_0}$$ है जब $$ 0 < i < k $$

निरंतर समय में, समीकरण $$\displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds$$ है।

इसके अलावा, किसी फलन की परिभाषा के आधार पर, ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि $$f$$ फलन प्राप्त करने जैसा है, यह f(p) = q को संतुष्ट करता है।

यह भी देखें
• Digital imaging

• Computer graphics

• Computer vision

• CVIPtools

• Digitizing

• Fourier transform

• Free boundary condition

• GPGPU

• Homomorphic filtering

• Image analysis

• IEEE Intelligent Transportation Systems Society

• Least-squares spectral analysis

• Multidimensional systems

• Relaxation labelling

• Remote sensing software

• Standard test image

• Superresolution

• Total variation denoising

• Machine Vision

• Bounded variation

• Radiomics

अग्रिम पठन

 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288

बाहरी संबंध

 * Lectures on Image Processing, by Alan Peters. Vanderbilt University. Updated 7 January 2016.
 * Processing digital images with computer algorithms

]