डिजिटल इमेज प्रोसेसिंग

डिजिटल छवि प्रसंस्करण किसी कलन विधि (एल्गोरिदम) के माध्यम से डिजिटल छवियों को संसाधित करने के लिए डिजिटल संगणक (कंप्यूटर) का उपयोग है। डिजिटल एकल प्रसंस्करण के उपश्रेणी या क्षेत्र के रूप में, डिजिटल छवि प्रसंस्करण के समधर्मी (एनालॉग) छवि प्रसंस्करण पर कई फायदे हैं। यह निविष्टि डेटा पर कलन विधि (एल्गोरिदम) की विस्तृत श्रृंखला को उपयोजित करता है और प्रसंस्करण के दौरान शोर (कोलाहल) के निर्माण और विरूपण जैसी समस्याओं का परिवर्जन कर सकता है। चूंकि छवियों को दो विमाओ (शायद अधिक) पर निरूपित किया गया है, इसलिए डिजिटल छवि प्रसंस्करण को बहुविमीय प्रणालियों के रूप में प्रतिदर्श किया जा सकता है। डिजिटल छवि प्रसंस्करण का निर्माण और विकास मुख्य रूप से तीन कारकों से प्रभावित होता है, संगणक (कंप्यूटर) का विकास, गणित का विकास (विशेषकर असतत गणित सिद्धांत का निर्माण और सुधार), पर्यावरण, कृषि, सैन्य, उद्योग और चिकित्सा विज्ञान में अनुप्रयोगों की एक विस्तृत श्रृंखला की आवश्यकता में वृद्धि।

इतिहास
1960 के दशक में, डिजिटल छवि प्रसंस्करण की कई तकनीकें, या जिन्हें प्रायः डिजिटल चित्रण प्रसंस्करण कहा जाता है, बेल प्रयोगशाला, जेट प्रोपल्शन (प्रणोदन) प्रयोगशाला, मैसाचुसेट्स प्राद्योगिकी संस्थान, मैरीलैंड विश्वविद्यालय और कुछ अन्य शोध सुविधाएं उपग्रह बिंबावली (सैटेलाइट इमेजरी), मानक तंत्रिका-फोटो रूपांतरण (वायर-फोटो स्टैण्डर्ड कन्वर्शन), मेडिकल प्रतिबिंबन, वीडियोफोन, संप्रतीक अभिज्ञान (करैक्टर रिकग्निशन), और छायाचित्र वर्धन के लिए अनुप्रयोगों के साथ विकसित की गई। प्रारंभिक छवि प्रसंस्करण का उद्देश्य छवि की गुणवत्ता में सुधार तथा मनुष्यों के लिए लोगों के दृश्य प्रभाव में सुधार करना है। छवि प्रसंस्करण में, निविष्ट एक निम्न-कोटि वाली छवि होती है, और निर्गत उच्च कोटि वाली छवि प्राप्त होती है। सामान्य छवि प्रसंस्करण में छवि वर्धन, प्रत्यावर्तन, संकेतन और संपीड़न होता है। पहला सफल अनुप्रयोग अमेरिकन जेट प्रोपल्शन (प्रणोदन) प्रयोगशाला (JPL) था। उन्होंने सूर्य की स्थिति और चंद्रमा के वातावरण को ध्यान में रखते हुए 1964 में अन्तरिक्ष अनुवेदक रेज़र 7 द्वारा वापस भेजी गई हजारों चंद्र तस्वीरों पर छवि प्रसंस्करण तकनीकों जैसे कि ज्यामितीय सुधार, उन्नयन परिवर्तन, शोर हटाने आदि का उपयोग किया। कंप्यूटर द्वारा चंद्रमा की सतह के नक्शे की सफल मैपिंग का प्रभाव एक बड़ी सफलता रही है। बाद में, अंतरिक्ष यान द्वारा वापस भेजी गई लगभग 100,000 तस्वीरों पर अधिक जटिल छवि प्रसंस्करण का प्रदर्शन किया गया, ताकि स्थलाकृतिक मानचित्र, रंगीन मानचित्र और चंद्रमा का मनोरम मोज़ेक प्राप्त किया जा सके, जिसने असाधारण परिणाम प्राप्त किए और मानव लैंडिंग के लिए एक ठोस नींव रखी। चाँद। <रेफ नाम =: 1>

हालाँकि, उस युग के कंप्यूटिंग उपकरणों के साथ प्रसंस्करण की लागत काफी अधिक थी। यह 1970 के दशक में बदल गया, जब डिजिटल इमेज प्रोसेसिंग सस्ते कंप्यूटर के रूप में फैल गई और समर्पित हार्डवेयर उपलब्ध हो गया। इससे छवियों को वास्तविक समय में संसाधित किया जा रहा था, कुछ समर्पित समस्याओं जैसे कि टेलीविजन मानकों के रूपांतरण के लिए। जैसे-जैसे सामान्य-उद्देश्य वाले कंप्यूटर तेज होते गए, उन्होंने सबसे विशिष्ट और कंप्यूटर-गहन संचालन को छोड़कर सभी के लिए समर्पित हार्डवेयर की भूमिका निभानी शुरू कर दी। 2000 के दशक में उपलब्ध तेज़ कंप्यूटर और सिग्नल प्रोसेसर के साथ, डिजिटल इमेज प्रोसेसिंग इमेज प्रोसेसिंग का सबसे सामान्य रूप बन गया है, और आमतौर पर इसका उपयोग किया जाता है क्योंकि यह न केवल सबसे बहुमुखी तरीका है, बल्कि सबसे सस्ता भी है।

छवि सेंसर
आधुनिक छवि सेंसर के लिए आधार धातु-ऑक्साइड-सेमिकंडक्टर (एमओएस) तकनीक है, जो 1959 में बेल लैब्स में मोहम्मद एम। अटला और डावन काहंग द्वारा MOSFET (MOS फील्ड-इफेक्ट ट्रांजिस्टर) के आविष्कार से उत्पन्न होता है। इसने डिजिटल सेमीकंडक्टर इमेज सेंसर के विकास का नेतृत्व किया, जिसमें चार्ज-युग्मित डिवाइस (CCD) और बाद में CMOS सेंसर शामिल थे।

चार्ज-युग्मित डिवाइस का आविष्कार विलार्ड एस। बॉयल और जॉर्ज ई। स्मिथ ने 1969 में बेल लैब्स में किया था। एमओएस तकनीक पर शोध करते समय, उन्होंने महसूस किया कि एक इलेक्ट्रिक चार्ज चुंबकीय बुलबुले का सादृश्य था और इसे एक छोटे से एमओएस संधारित्र पर संग्रहीत किया जा सकता है।चूंकि यह एक पंक्ति में MOS कैपेसिटर की एक श्रृंखला को गढ़ने के लिए काफी सीधा था, इसलिए उन्होंने उनसे एक उपयुक्त वोल्टेज जोड़ा ताकि चार्ज को एक से अगले तक कदम रखा जा सके। CCD एक अर्धचालक सर्किट है जिसका उपयोग बाद में टेलीविजन प्रसारण के लिए पहले डिजिटल वीडियो कैमरों में किया गया था। NMOS एक्टिव-पिक्सेल सेंसर (APS) का आविष्कार 1980 के दशक के मध्य में जापान में ओलंपस द्वारा किया गया था।यह MOS सेमीकंडक्टर डिवाइस फैब्रिकेशन में अग्रिमों द्वारा सक्षम किया गया था, जिसमें MOSFET स्केलिंग छोटे माइक्रोन और फिर उप-माइक्रोन स्तर तक पहुंच गई थी। NMOS APS को 1985 में ओलंपस में त्सुतोमु नाकामुरा की टीम द्वारा गढ़ा गया था। CMOS एक्टिव-पिक्सेल सेंसर (CMOS सेंसर) को बाद में एरिक फॉसम की टीम द्वारा 1993 में नासा जेट प्रोपल्शन लेबोरेटरी में विकसित किया गया था। 2007 तक, CMOS सेंसर की बिक्री ने CCD सेंसर को पार कर लिया था।

छवि संपीड़न
डिजिटल इमेज कम्प्रेशन टेक्नोलॉजी में एक महत्वपूर्ण विकास असतत कोसाइन ट्रांसफॉर्म (डीसीटी) था, जो 1972 में एन। अहमद द्वारा प्रस्तावित एक हानिपूर्ण संपीड़न तकनीक थी। 1972 में नासिर अहमद। डीसीटी संपीड़न JPEG के लिए आधार बन गया, जिसे 1992 में संयुक्त फोटोग्राफिक विशेषज्ञों के समूह द्वारा पेश किया गया था। JPEG छवियों को बहुत छोटे फ़ाइल आकारों में संकुचित करता है, और इंटरनेट पर सबसे व्यापक रूप से उपयोग की जाने वाली छवि फ़ाइल प्रारूप बन गया है। इसका अत्यधिक कुशल डीसीटी संपीड़न एल्गोरिथ्म डिजिटल छवियों और डिजिटल तस्वीरों के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था, हर दिन उत्पादित कई बिलियन JPEG छवियों के साथ.

डिजिटल सिग्नल प्रोसेसर (डीएसपी)
1970 के दशक में एमओएस प्रौद्योगिकी के व्यापक गोद लेने से इलेक्ट्रॉनिक सिग्नल प्रोसेसिंग में क्रांति ला दी गई थी। MOS इंटीग्रेटेड सर्किट तकनीक 1970 के दशक की शुरुआत में पहले सिंगल-चिप माइक्रोप्रोसेसर्स और माइक्रोकंट्रोलर्स के लिए आधार था, और फिर 1970 के दशक के अंत में पहला सिंगल-चिप डिजिटल सिग्नल प्रोसेसर (डीएसपी) चिप्स। डीएसपी चिप्स तब से डिजिटल इमेज प्रोसेसिंग में व्यापक रूप से उपयोग किया गया है।

असतत कोसाइन ट्रांसफॉर्म (डीसीटी) इमेज कम्प्रेशन एल्गोरिथ्म को डीएसपी चिप्स में व्यापक रूप से लागू किया गया है, जिसमें कई कंपनियां डीसीटी प्रौद्योगिकी के आधार पर डीएसपी चिप्स विकसित कर रही हैं।DCTs व्यापक रूप से एन्कोडिंग, डिकोडिंग, वीडियो कोडिंग, ऑडियो कोडिंग, मल्टीप्लेक्सिंग, कंट्रोल सिग्नलिंग, सिग्नलिंग, एनालॉग-टू-डिजिटल रूपांतरण, फॉर्मेटिंग ल्यूमिनेंस और रंग अंतर, और YUV444 और YUV411 जैसे रंग प्रारूपों के लिए उपयोग किए जाते हैं।डीसीटी का उपयोग एन्कोडिंग संचालन के लिए भी किया जाता है जैसे कि गति अनुमान, गति मुआवजा, अंतर-फ्रेम भविष्यवाणी, परिमाणीकरण, अवधारणात्मक भार, एन्ट्रापी एन्कोडिंग, चर एन्कोडिंग, और गति वैक्टर, और विभिन्न रंग प्रारूपों (YIQ, के बीच उलटा संचालन जैसे डिकोडिंग संचालनप्रदर्शन उद्देश्यों के लिए YUV और RGB)।डीसीटी का उपयोग आमतौर पर उच्च-परिभाषा टेलीविजन (एचडीटीवी) एनकोडर/डिकोडर चिप्स के लिए भी किया जाता है।

मेडिकल इमेजिंग
1972 में, ब्रिटिश कंपनी ईएमआई हाउसफील्ड के इंजीनियर ने हेड डायग्नोसिस के लिए एक्स-रे कम्प्यूटेड टोमोग्राफी डिवाइस का आविष्कार किया, जिसे आमतौर पर सीटी (कंप्यूटर टोमोग्राफी) कहा जाता है।सीटी न्यूक्लियस विधि मानव हेड सेक्शन के प्रक्षेपण पर आधारित है और क्रॉस-अनुभागीय छवि को फिर से बनाने के लिए कंप्यूटर द्वारा संसाधित किया जाता है, जिसे छवि पुनर्निर्माण कहा जाता है।1975 में, ईएमआई ने सफलतापूर्वक पूरे शरीर के लिए एक सीटी डिवाइस विकसित किया, जिसने मानव शरीर के विभिन्न हिस्सों की एक स्पष्ट टोमोग्राफिक छवि प्राप्त की।1979 में, इस नैदानिक तकनीक ने नोबेल पुरस्कार जीता। <रेफरी नाम =: 1 /> मेडिकल अनुप्रयोगों के लिए डिजिटल इमेज प्रोसेसिंग तकनीक को 1994 में स्पेस फाउंडेशन स्पेस टेक्नोलॉजी हॉल ऑफ फेम में शामिल किया गया था।

कार्य
डिजिटल इमेज प्रोसेसिंग बहुत अधिक जटिल एल्गोरिदम के उपयोग की अनुमति देती है, और इसलिए, सरल कार्यों में दोनों अधिक परिष्कृत प्रदर्शन की पेशकश कर सकती है, और उन तरीकों के कार्यान्वयन जो एनालॉग साधनों द्वारा असंभव होगा।

विशेष रूप से, डिजिटल छवि प्रसंस्करण एक ठोस अनुप्रयोग है, और एक व्यावहारिक तकनीक है:
 * वर्गीकरण
 * सुविधा निकासी
 * बहु-स्तरीय संकेत विश्लेषण
 * पैटर्न मान्यता
 * प्रक्षेपण

डिजिटल इमेज प्रोसेसिंग में उपयोग की जाने वाली कुछ तकनीकों में शामिल हैं:
 * अनिसोट्रोपिक प्रसार
 * छिपे हुए मार्कोव मॉडल
 * छवि संपादन
 * छवि बहाली
 * स्वतंत्र घटक विश्लेषण
 * रैखिक फ़िल्टरिंग
 * तंत्रिका - तंत्र
 * आंशिक अंतर समीकरण
 * Pixelation
 * प्वाइंट फीचर मिलान
 * प्रमुख घटक विश्लेषण
 * स्व-आयोजन नक्शे
 * तरंगिका

फ़िल्टरिंग
डिजिटल फ़िल्टर का उपयोग डिजिटल छवियों को धुंधला और तेज करने के लिए किया जाता है।फ़िल्टरिंग द्वारा किया जा सकता है:
 * स्थानिक डोमेन में विशेष रूप से डिज़ाइन किए गए गुठली (फ़िल्टर सरणी) के साथ संकल्प <रेफ नाम =: 0>
 * आवृत्ति (फूरियर) डोमेन में विशिष्ट आवृत्ति क्षेत्रों को मास्क करना

निम्नलिखित उदाहरण दोनों तरीके दिखाते हैं: रेफ नाम = गोंजालेज 2008>

फूरियर डोमेन फ़िल्टरिंग में इमेज पैडिंग
छवियों को आम तौर पर फूरियर स्पेस में बदलने से पहले गद्देदार किया जाता है, नीचे दिए गए हाईपास फ़िल्टर की गई छवियां विभिन्न पैडिंग तकनीकों के परिणामों को दर्शाती हैं:

ध्यान दें कि हाईपास फ़िल्टर बार -बार एज पैडिंग की तुलना में शून्य गद्देदार होने पर अतिरिक्त किनारों को दिखाता है।

फ़िल्टरिंग कोड उदाहरण
स्थानिक डोमेन हाईपास फ़िल्टरिंग के लिए MATLAB उदाहरण।

 IMG = चेकरबोर्ड (20);% जनरेट चेकरबोर्ड % ************************** स्थानिक डोमेन  *************************** klaplace = [0 -1 0;-1 5 -1;0 -1 0];% लाप्लासियन फ़िल्टर कर्नेल X = conv2 (img, klaplace);% के साथ परीक्षण img % 3x3 लाप्लासियन कर्नेल आकृति imshow (x, []) % दिखाते हैं लाप्लासियन फ़िल्टर्ड शीर्षक ('लाप्लासियन एज डिटेक्शन')

एफाइन ट्रांसफॉर्मेशन
Affine रूपांतरण पैमाने, घूमने, अनुवाद, दर्पण और कतरनी सहित बुनियादी छवि परिवर्तनों को सक्षम करते हैं जैसा कि निम्नलिखित उदाहरणों में दिखाया गया है:

एक छवि में एफाइन मैट्रिक्स को लागू करने के लिए, छवि को मैट्रिक्स में बदल दिया जाता है जिसमें प्रत्येक प्रविष्टि उस स्थान पर पिक्सेल तीव्रता से मेल खाती है। तब प्रत्येक पिक्सेल के स्थान को एक वेक्टर के रूप में दर्शाया जा सकता है जो छवि में उस पिक्सेल के निर्देशांक को दर्शाता है, [x, y], जहां x और y छवि मैट्रिक्स में एक पिक्सेल की पंक्ति और स्तंभ हैं। यह समन्वय को एक affine-transformation मैट्रिक्स से गुणा करने की अनुमति देता है, जो स्थिति देता है कि पिक्सेल मान को आउटपुट छवि में कॉपी किया जाएगा।

हालांकि, अनुवाद परिवर्तनों की आवश्यकता वाले परिवर्तनों की अनुमति देने के लिए, 3 आयामी सजातीय निर्देशांक की आवश्यकता होती है। तीसरा आयाम आमतौर पर एक गैर-शून्य स्थिरांक पर सेट होता है, आमतौर पर 1, ताकि नया समन्वय [x, y, 1] हो। यह समन्वय वेक्टर को 3 मैट्रिक्स द्वारा 3 से गुणा करने की अनुमति देता है, जिससे अनुवाद शिफ्ट को सक्षम किया जा सकता है। तो तीसरा आयाम, जो निरंतर 1 है, अनुवाद की अनुमति देता है।

क्योंकि मैट्रिक्स गुणा साहचर्य है, कई एफाइन परिवर्तनों को एक एकल एफाइन परिवर्तन में जोड़ा जा सकता है जो प्रत्येक व्यक्तिगत परिवर्तन के मैट्रिक्स को उस क्रम में गुणा करके गुणा किया जाता है जो परिवर्तनों को किया जाता है। यह एक एकल मैट्रिक्स में परिणाम देता है, जो एक बिंदु वेक्टर पर लागू होने पर, अनुक्रम में वेक्टर [x, y, 1] पर किए गए सभी व्यक्तिगत परिवर्तनों के समान परिणाम देता है। इस प्रकार Affine परिवर्तन मैट्रिसेस का एक अनुक्रम एक एकल affine परिवर्तन मैट्रिक्स में कम किया जा सकता है।

उदाहरण के लिए, 2 आयामी निर्देशांक केवल मूल (0, 0) के बारे में रोटेशन की अनुमति देते हैं। लेकिन 3 आयामी सजातीय निर्देशांक का उपयोग पहले किसी भी बिंदु (0, 0) पर अनुवाद करने के लिए किया जा सकता है, फिर रोटेशन का प्रदर्शन करें, और अंत में मूल (0, 0) को मूल बिंदु (पहले अनुवाद के विपरीत) पर वापस अनुवाद करें। इन 3 affine परिवर्तनों को एक एकल मैट्रिक्स में जोड़ा जा सकता है, इस प्रकार छवि में किसी भी बिंदु के आसपास रोटेशन की अनुमति देता है।

छवि आकृति विज्ञान के साथ denoising
गणितीय आकृति विज्ञान छवियों को रोकने के लिए उपयुक्त है।गणितीय आकृति विज्ञान में संरचना तत्व महत्वपूर्ण हैं।

निम्नलिखित उदाहरण संरचनात्मक तत्वों के बारे में हैं।Denoise फ़ंक्शन, छवि के रूप में i, और संरचना तत्व b के रूप में b को नीचे और तालिका के रूप में दिखाया गया है।

उदा। $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 60 & 55 \\ 25 & 15 & 5 \end{bmatrix} B = \begin{bmatrix} 1 & 2 & 1 \\ 2 & 1 & 1 \\ 1 & 0 & 3 \end{bmatrix}$$ डिफाइन डिफेशन (i, b) (i, j) = $$max\{I(i+m, j+n) + B(m,n)\}$$।चलो फैलाव (i, b) = d (i, b)

D (i ', b) (1,1) = $$max(45+1,50+2,65+1,40+2,60+1,55+1,25+1,15+0,5+3) = 66$$ कटाव को परिभाषित करें (i, b) (i, j) = $$min\{I(i+m, j+n) - B(m,n)\}$$।चलो कटाव (i, b) = e (i, b)

ई (i ', b) (1,1) = $$min(45-1,50-2,65-1,40-2,60-1,55-1,25-1,15-0,5-3) = 2$$ फैलाव के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 66 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$ कटाव के बाद $$(I') = \begin{bmatrix} 45 & 50 & 65 \\ 40 & 2 & 55 \\ 25 & 15 & 5 \end{bmatrix} $$ एक उद्घाटन विधि बस पहले कटाव है, और फिर फैलाव की विधि के विपरीत है।वास्तव में, d (i, b) और e (i, b) कन्वर्शन द्वारा लागू किया जा सकता है

एक छवि में डेनोइजिंग विधि को लागू करने के लिए, छवि को ग्रेस्केल में बदल दिया जाता है।डेनोइजिंग विधि के साथ एक मुखौटा तार्किक मैट्रिक्स है $$[1 1 1 ; 1 1 1 ; 1 1 1]$$। डेनोइजिंग के तरीके चित्र के केंद्र से आधी ऊंचाई, आधी चौड़ाई के साथ शुरू होते हैं, और पंक्ति संख्या, स्तंभ संख्या की छवि सीमा के साथ समाप्त होते हैं। पड़ोसी सीमा के साथ मूल छवि में एक ब्लॉक है [केंद्र के नीचे बिंदु: ऊपर बिंदु, केंद्र के बाईं ओर बिंदु: केंद्र के दाईं ओर बिंदु]। संकल्प पड़ोसी और संरचना तत्व और फिर केंद्र को न्यूनतम पड़ोसी के साथ बदलें।

उदाहरण के लिए समापन विधि लें।

पहले फैलाव लूप के लिए ## पंक्ति रेंज से विंडो के साथ न्यूनतम निकालें [2 ~ छवि ऊंचाई - 1] स्तंभ रेंज के साथ [2 ~ छवि चौड़ाई - 1]
 * 1) छवि पढ़ें और इसे MATLAB के साथ ग्रेस्केल में परिवर्तित करें।
 * 2) एक छवि का आकार प्राप्त करें। रिटर्न वैल्यू रो नंबर और कॉलम नंबर वे सीमाएं हैं जिनका हम बाद में उपयोग करने जा रहे हैं।
 * 3) संरचित तत्व आपके फैलाव या कटाव समारोह पर निर्भर करते हैं। पिक्सेल के पड़ोसी का न्यूनतम एक कटाव विधि की ओर जाता है और अधिकतम पड़ोसी एक फैलाव विधि की ओर जाता है।
 * 4) फैलाव, कटाव और समापन के लिए समय निर्धारित करें।
 * 5) मूल छवि के समान आकार का एक शून्य मैट्रिक्स बनाएं।
 * 6) स्ट्रक्चरिंग विंडो के साथ पहले फैलाव।
 * 7) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कन्वर्शन है
 * 1) शून्य मैट्रिक्स के लिए न्यूनतम मान भरें और एक नई छवि सहेजें
 * 2) सीमा के लिए, यह अभी भी सुधार किया जा सकता है। चूंकि विधि में, एक सीमा को नजरअंदाज कर दिया जाता है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।

फिर कटाव (इनपुट के रूप में फैलाव छवि लें) लूप के लिए ## पंक्ति रेंज से विंडो के साथ अधिकतम निकालें [2 ~ छवि ऊंचाई - 1] कॉलम रेंज के साथ [2 ~ छवि चौड़ाई - 1]
 * 1) मूल छवि के समान आकार का एक शून्य मैट्रिक्स बनाएं।
 * 2) संरचना खिड़की के साथ कटाव।
 * 3) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कन्वर्शन है
 * 1) शून्य मैट्रिक्स के लिए अधिकतम मान भरें और एक नई छवि सहेजें
 * 2) सीमा के लिए, यह अभी भी सुधार किया जा सकता है। विधि में से, सीमा को नजरअंदाज कर दिया जाता है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।
 * 3) परिणाम उपरोक्त तालिका के रूप में दिखाए गए हैं

डिजिटल कैमरा चित्र
डिजिटल कैमरों में आम तौर पर विशेष डिजिटल इमेज प्रोसेसिंग हार्डवेयर शामिल होते हैं-या तो समर्पित चिप्स या अन्य चिप्स पर जोड़ा सर्किटरी-कच्चे डेटा को उनके छवि सेंसर से एक मानक छवि फ़ाइल प्रारूप में रंग-सही छवि में परिवर्तित करने के लिए।अतिरिक्त पोस्ट प्रोसेसिंग तकनीक अधिक स्वाभाविक रूप से दिखने वाली छवियों को बनाने के लिए एज शार्पनेस या रंग संतृप्ति को बढ़ाती है।

फिल्म
वेस्टवर्ल्ड (1973) एंड्रॉइड के दृष्टिकोण को अनुकरण करने के लिए पिक्सेलेट फोटोग्राफी के लिए डिजिटल इमेज प्रोसेसिंग का उपयोग करने वाली पहली फीचर फिल्म थी। छवि प्रसंस्करण का उपयोग क्रोमा प्रमुख प्रभाव का उत्पादन करने के लिए भी किया जाता है जो प्राकृतिक या कलात्मक दृश्यों के साथ अभिनेताओं की पृष्ठभूमि को बदल देता है।

फेस डिटेक्शन
फेस डिटेक्शन को गणितीय आकृति विज्ञान, असतत कोसाइन ट्रांसफॉर्म के साथ लागू किया जा सकता है जिसे आमतौर पर डीसीटी, और क्षैतिज प्रक्षेपण (गणित) कहा जाता है।

सुविधा-आधारित पद्धति के साथ सामान्य विधि

चेहरे का पता लगाने की फीचर-आधारित विधि त्वचा की टोन, एज डिटेक्शन, फेस शेप और फेस का पता लगाने के लिए चेहरे (जैसे आंखों, मुंह, आदि) की सुविधा का उपयोग कर रही है। त्वचा की टोन, चेहरे का आकार, और सभी अद्वितीय तत्व जो केवल मानव चेहरे को केवल सुविधाओं के रूप में वर्णित किया जा सकता है।

प्रक्रिया स्पष्टीकरण


 * 1) चेहरे की छवियों के एक बैच को देखते हुए, पहले, चेहरे की छवियों का नमूना करके त्वचा की टोन रेंज निकालें। स्किन टोन रेंज सिर्फ एक स्किन फिल्टर है।
 * 2) संरचनात्मक समानता सूचकांक माप (SSIM) को त्वचा की टोन निकालने के संदर्भ में छवियों की तुलना करने के लिए लागू किया जा सकता है।
 * 3) सामान्य रूप से, एचएसवी या आरजीबी रंग स्थान त्वचा फिल्टर के लिए उपयुक्त हैं। उदा। HSV मोड, स्किन टोन रेंज [0,48,50] ~ [20,255,255] है
 * 4) त्वचा की टोन के साथ छवियों को फ़िल्टर करने के बाद, चेहरे को किनारे करने के लिए, आकारिकी और डीसीटी का उपयोग शोर को हटाने और लापता त्वचा क्षेत्रों को भरने के लिए किया जाता है।
 * 5) ओपनिंग विधि या समापन विधि का उपयोग लापता त्वचा को भरने के लिए किया जा सकता है।
 * 6) DCT टोन जैसी त्वचा के साथ वस्तु से बचने के लिए है। चूंकि मानव चेहरों में हमेशा अधिक बनावट होती है।
 * 7) सोबेल ऑपरेटर या अन्य ऑपरेटरों को फेस एज का पता लगाने के लिए लागू किया जा सकता है।
 * 8) आंखों की तरह मानव सुविधाओं की स्थिति के लिए, प्रक्षेपण का उपयोग करके और प्रक्षेपण के हिस्टोग्राम के शिखर को खोजने में माउस, बाल और होंठ जैसी विस्तार सुविधा प्राप्त करने में मदद मिलती है।
 * 9) प्रक्षेपण केवल उच्च आवृत्ति को देखने के लिए छवि को पेश कर रहा है जो आमतौर पर सुविधा की स्थिति है।

छवि कोटि पद्धति में संशोधन
छवि कोटि कैमरा कंपन से प्रभावित हो सकती है, अति प्रभावाधीन (ओवर-एक्सपोज़र), ग्रे स्तर के वितरण को बहुत केंद्रीकृत, और चटकीला आदि से प्रभावित किया जा सकता है, उदाहरण के लिए, शोर की समस्या को चौरसाई विधि द्वारा हल किया जा सकता है जबकि ग्रे स्तर वितरण समस्या को हिस्टोग्राम समीकरण द्वारा सुधार किया जा सकता है।

चौरसाई (स्मूथिंग) विधि
चित्रण में, अगर कुछ अनैच्छिक रंग है, तो अनैच्छिक रंग के आसपास कुछ रंग लेना और उनका औसत लिया जाता है। यह चौरसाई (स्मूथिंग) विधि के उपयोग का आसान तरीका है।

चौरसाई (स्मूथिंग) विधि को आवरण और संवलन के साथ परिपालित किया जा सकता है। उदाहरण के लिए नीचे दी गई छोटी छवि और आवरण देखें।

छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 1 & 4 & 6 \\ 1 & 28 & 30 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

आवरण$$ \begin{bmatrix} 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \\ 1/9 & 1/9 & 1/9 \end{bmatrix} $$है।

संवलन और चौरसाई (स्मूथिंग) के बाद, छवि$$ \begin{bmatrix} 2 & 5 & 6 & 5\\ 3 & 9 & 10 & 6 \\ 1 & 9 & 9 & 2 \\ 7 & 3 & 2 & 2 \end{bmatrix} $$है।

छवियों का अवलोकन [1, 1], छवि [1, 2], छवि [2, 1], और छवि [2, 2]।

मूल छवि पिक्सेल 1, 4, 28, 30 है। मास्क को चिकना करने के बाद, पिक्सेल क्रमशः 9, 10, 9, 9 हो जाता है।

नई छवि [1, 1] = $$\tfrac{1}{9}$$ * (छवि [0,0]+छवि [0,1]+छवि [0,2]+छवि [1,0]+छवि [1,1]+छवि [1,2]+छवि [2,0]+छवि [2,1]+छवि [2,2])

नई छवि [1, 1] = फलक ($$\tfrac{1}{9}$$ * (2+5+6+3+1+4+1+28+30)) = 9

नई छवि [1, 2] = फलक ($$\tfrac{1}{9}$$ * (5+6+5+1+4+6+28+30+2)) = 10

नई छवि [2, 1] = फलक ($$\tfrac{1}{9}$$ * (3+1+4+1+28+30+73+3+2)) = 9

नई छवि [2, 2] = फलक ($$\tfrac{1}{9}$$ * (1+4+6+28+30+2+3+2+2)) = 9

ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि
सामान्यतः, नीचे दी गई छवि से ग्रे स्तर का आयतचित्र (हिस्टोग्राम) दिया जाता है। छवि से समान वितरण के लिए आयतचित्र (हिस्टोग्राम) को बदलना सामान्यतः हम आयतचित्र (हिस्टोग्राम) समकरण कहते हैं।



असतत समय में, ग्रे स्तर आयतचित्र (हिस्टोग्राम) का क्षेत्र है $$\sum_{i=0}^{k}H(p_i)$$ (चित्र 1 देखें) जबकि समान वितरण का क्षेत्रफल $$\sum_{i=0}^{k}G(q_i)$$ है (चित्र 2 देखें)। यह स्पष्ट है कि क्षेत्र नहीं बदलेगा, इसलिए $$\sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)$$।

समान वितरण से, $$q_i$$ की प्रायिकता $$\tfrac{N^2}{q_k - q_0}$$ है जब $$ 0 < i < k $$

निरंतर समय में, समीकरण $$\displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds$$ है।

इसके अलावा, किसी फलन की परिभाषा के आधार पर, ग्रे स्तर आयतचित्र (हिस्टोग्राम) विधि $$f$$ फलन प्राप्त करने जैसा है, यह f(p) = q को संतुष्ट करता है।

यह भी देखें
• Digital imaging

• Computer graphics

• Computer vision

• CVIPtools

• Digitizing

• Fourier transform

• Free boundary condition

• GPGPU

• Homomorphic filtering

• Image analysis

• IEEE Intelligent Transportation Systems Society

• Least-squares spectral analysis

• Multidimensional systems

• Relaxation labelling

• Remote sensing software

• Standard test image

• Superresolution

• Total variation denoising

• Machine Vision

• Bounded variation

• Radiomics

अग्रिम पठन

 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288
 * Rafael C. Gonzalez (2008). Digital Image Processing. Prentice Hall. ISBN 9780131687288

बाहरी संबंध

 * Lectures on Image Processing, by Alan Peters. Vanderbilt University. Updated 7 January 2016.
 * Processing digital images with computer algorithms

]