डिजिटल इमेज प्रोसेसिंग

डिजिटल इमेज प्रोसेसिंग   डिजिटल कंप्यूटर  का उपयोग   डिजिटल इमेज  एस को   एल्गोरिथम  के माध्यम से संसाधित करने के लिए है   डिजिटल सिग्नल प्रोसेसिंग  के उपश्रेणी या क्षेत्र के रूप में, डिजिटल इमेज प्रोसेसिंग के   एनालॉग इमेज प्रोसेसिंग  पर कई फायदे हैं। यह इनपुट डेटा पर एल्गोरिदम की एक विस्तृत श्रृंखला को लागू करने की अनुमति देता है और प्रसंस्करण के दौरान    शोर  और   विरूपण  के निर्माण जैसी समस्याओं से बच सकता है। चूंकि छवियों को दो आयामों (शायद अधिक) पर परिभाषित किया गया है, इसलिए डिजिटल इमेज प्रोसेसिंग को   बहुआयामी सिस्टम  के रूप में मॉडल किया जा सकता है। डिजिटल इमेज प्रोसेसिंग का निर्माण और विकास मुख्य रूप से तीन कारकों से प्रभावित होता है: पहला, कंप्यूटर का विकास; दूसरा, गणित का विकास (विशेषकर असतत गणित सिद्धांत का निर्माण और सुधार); तीसरा, पर्यावरण, कृषि, सैन्य, उद्योग और चिकित्सा विज्ञान में अनुप्रयोगों की एक विस्तृत श्रृंखला की मांग में वृद्धि हुई है।

इतिहास
डिजिटल इमेज प्रोसेसिंग, या डिजिटल पिक्चर प्रोसेसिंग की कई तकनीकों को 1960 के दशक में   बेल लेबोरेटरीज,   जेट प्रोपल्शन लेबोरेटरी ,   मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी ,    मैरीलैंड विश्वविद्यालय , और कुछ अन्य शोध सुविधाएं,   उपग्रह इमेजरी ,    वायर-फोटो  मानकों रूपांतरण,    चिकित्सा इमेजिंग ,   वीडियोफोन ,   वर्ण पहचान के लिए आवेदन के साथ , और फोटोग्राफ एन्हांसमेंट प्रारंभिक छवि प्रसंस्करण का उद्देश्य छवि की गुणवत्ता में सुधार करना था। इसका उद्देश्य मनुष्यों के लिए लोगों के दृश्य प्रभाव में सुधार करना था। छवि प्रसंस्करण में, इनपुट एक निम्न-गुणवत्ता वाली छवि है, और आउटपुट बेहतर गुणवत्ता वाली छवि है। सामान्य छवि प्रसंस्करण में छवि वृद्धि, बहाली, एन्कोडिंग और संपीड़न शामिल हैं। पहला सफल अनुप्रयोग अमेरिकन जेट प्रोपल्शन लेबोरेटरी (JPL) था। उन्होंने सूर्य की स्थिति और चंद्रमा के वातावरण को ध्यान में रखते हुए 1964 में स्पेस डिटेक्टर रेंजर 7 द्वारा वापस भेजी गई हजारों चंद्र तस्वीरों पर छवि प्रसंस्करण तकनीकों जैसे कि ज्यामितीय सुधार, उन्नयन परिवर्तन, शोर हटाने आदि का उपयोग किया। कंप्यूटर द्वारा चंद्रमा की सतह के नक्शे की सफल मैपिंग का प्रभाव एक बड़ी सफलता रही है। बाद में, अंतरिक्ष यान द्वारा वापस भेजी गई लगभग 100,000 तस्वीरों पर अधिक जटिल छवि प्रसंस्करण का प्रदर्शन किया गया, ताकि स्थलाकृतिक मानचित्र, रंगीन मानचित्र और चंद्रमा का मनोरम मोज़ेक प्राप्त किया जा सके, जिसने असाधारण परिणाम प्राप्त किए और मानव लैंडिंग के लिए एक ठोस नींव रखी। चंद्रमा<ref name=":1

हालाँकि, उस युग के कंप्यूटिंग उपकरणों के साथ प्रसंस्करण की लागत काफी अधिक थी। यह 1970 के दशक में बदल गया, जब डिजिटल इमेज प्रोसेसिंग सस्ते कंप्यूटर के रूप में फैल गई और समर्पित हार्डवेयर उपलब्ध हो गया। इससे छवियों को वास्तविक समय में संसाधित किया जा रहा था, कुछ समर्पित समस्याओं जैसे  टेलीविजन मानकों के रूपांतरण  के लिए। जैसे ही   सामान्य-उद्देश्य वाले कंप्यूटर  एस तेज हो गए, उन्होंने सबसे विशिष्ट और कंप्यूटर-गहन संचालन को छोड़कर सभी के लिए समर्पित हार्डवेयर की भूमिका निभानी शुरू कर दी। 2000 के दशक में उपलब्ध तेज़ कंप्यूटर और सिग्नल प्रोसेसर के साथ, डिजिटल इमेज प्रोसेसिंग इमेज प्रोसेसिंग का सबसे सामान्य रूप बन गया है, और आमतौर पर इसका उपयोग किया जाता है क्योंकि यह न केवल सबसे बहुमुखी तरीका है, बल्कि सबसे सस्ता भी है।

छवि सेंसर
आधुनिक  इमेज सेंसर  का आधार   मेटल-ऑक्साइड-सेमीकंडक्टर  (MOS) तकनीक है जो   एमओएसएफईटी  (एमओएस फील्ड-इफेक्ट ट्रांजिस्टर) के आविष्कार से   मोहम्मद एम। अटाला  और   डॉन कहंग  द्वारा   बेल लैब्स  में 1959 में उत्पन्न हुआ था। इससे डिजिटल   सेमीकंडक्टर  इमेज सेंसर का विकास हुआ, जिसमें   चार्ज-कपल्ड डिवाइस  (सीसीडी) और बाद में   सीएमओएस सेंसर  शामिल हैं।

चार्ज-कपल्ड डिवाइस का आविष्कार  विलार्ड एस. बॉयल  और   जॉर्ज ई. स्मिथ  ने बेल लैब्स में 1969 में किया था। एमओएस तकनीक पर शोध करते समय, उन्होंने महसूस किया कि एक विद्युत आवेश चुंबकीय बुलबुले की सादृश्यता है और इसे एक छोटे से   एमओएस संधारित्र  पर संग्रहीत किया जा सकता है। चूंकि यह    के लिए काफी सीधा था,  को एक पंक्ति में एमओएस कैपेसिटर की एक श्रृंखला बनाते थे, उन्होंने उन्हें एक उपयुक्त वोल्टेज से जोड़ा ताकि चार्ज को एक से दूसरे तक ले जाया जा सके। सीसीडी एक सेमीकंडक्टर सर्किट है जिसे बाद में   टेलीविजन प्रसारण  के लिए पहले   डिजिटल वीडियो कैमरा  एस में इस्तेमाल किया गया था।

एनएमओएस   सक्रिय-पिक्सेल सेंसर  (एपीएस) का आविष्कार    ओलंपस  द्वारा जापान में 1980 के दशक के मध्य में किया गया था। यह एमओएस   सेमीकंडक्टर डिवाइस फैब्रिकेशन  में प्रगति द्वारा सक्षम किया गया था,   एमओएसएफईटी स्केलिंग  के साथ छोटे    माइक्रोन और फिर सब-माइक्रोन  स्तरों तक पहुंच गया था। NMOS APS को 1985 में ओलिंप में त्सुतोमु नाकामुरा की टीम द्वारा तैयार किया गया था   सीएमओएस  सक्रिय-पिक्सेल सेंसर (सीएमओएस सेंसर) को बाद में   एरिक फॉसम  की टीम द्वारा   नासा    जेट प्रोपल्शन लेबोरेटरी  में 1993 में विकसित किया गया था। 2007 तक, सीएमओएस सेंसर की बिक्री सीसीडी सेंसर को पार कर गई थी

छवि संपीड़न
डिजिटल  छवि संपीड़न  तकनीक में एक महत्वपूर्ण विकास   असतत कोसाइन ट्रांसफॉर्म  (डीसीटी) था, एक   हानिपूर्ण संपीड़न  तकनीक जिसे पहली बार    नासिर अहमद  द्वारा 1972 में प्रस्तावित किया गया था। डीसीटी संपीड़न   जेपीईजी  का आधार बन गया, जिसे 1992 में   संयुक्त फोटोग्राफिक विशेषज्ञ समूह  द्वारा पेश किया गया था। जेपीईजी छवियों को बहुत छोटे फ़ाइल आकार में संकुचित करता है, और   इंटरनेट  पर सबसे व्यापक रूप से उपयोग किया जाने वाला   छवि फ़ाइल प्रारूप  बन गया है इसका अत्यधिक कुशल डीसीटी संपीड़न एल्गोरिदम   डिजिटल छवियों  और   डिजिटल फोटो  एस के व्यापक प्रसार के लिए काफी हद तक जिम्मेदार था। प्रतिदिन कई अरब JPEG छवियों का उत्पादन होता है

डिजिटल सिग्नल प्रोसेसर (डीएसपी)
इलेक्ट्रॉनिक  सिग्नल प्रोसेसिंग  में 1970 के दशक में   एमओएस प्रौद्योगिकी  को व्यापक रूप से अपनाने से क्रांति हुई थी   एमओएस इंटीग्रेटेड सर्किट  तकनीक 1970 के दशक की शुरुआत में पहली सिंगल-चिप   माइक्रोप्रोसेसरों  और   माइक्रोकंट्रोलर्स  का आधार थी। और फिर 1970 के दशक के अंत में पहला सिंगल-चिप   डिजिटल सिग्नल प्रोसेसर  (DSP) चिप्स  तब से डीएसपी चिप्स का व्यापक रूप से डिजिटल इमेज प्रोसेसिंग में उपयोग किया गया है

असतत कोसाइन ट्रांसफॉर्म (डीसीटी)   इमेज कंप्रेशन  एल्गोरिथम को डीएसपी चिप्स में व्यापक रूप से लागू किया गया है, जिसमें कई कंपनियां डीसीटी तकनीक पर आधारित डीएसपी चिप्स विकसित कर रही हैं। डीसीटी का व्यापक रूप से   एन्कोडिंग, डिकोडिंग,   वीडियो कोडिंग ,   ऑडियो कोडिंग ,   मल्टीप्लेक्सिंग , नियंत्रण सिग्नल,   सिग्नलिंग ,   एनालॉग-टू-डिजिटल रूपांतरण , स्वरूपण   ल्यूमिनेंस  और रंग अंतर के लिए व्यापक रूप से उपयोग किया जाता है।   YUV444  और   YUV411  जैसे रंग प्रारूप। डीसीटी का उपयोग एन्कोडिंग संचालन के लिए भी किया जाता है जैसे   गति अनुमान ,   गति मुआवजा ,   इंटर-फ्रेम  भविष्यवाणी,    क्वांटिज़ेशन , अवधारणात्मक भार,   एन्ट्रॉपी एन्कोडिंग , परिवर्तनीय एन्कोडिंग, और   गति वेक्टर  एस, और डिकोडिंग ऑपरेशन जैसे कि विभिन्न रंग प्रारूपों (  वाईआईक्यू ,   वाईयूवी  और   आरजीबी ) के बीच उलटा संचालन। डीसीटी का इस्तेमाल आमतौर पर   हाई-डेफिनिशन टेलीविजन  (एचडीटीवी) एन्कोडर/डिकोडर चिप्स के लिए भी किया जाता है।

मेडिकल इमेजिंग
1972 में, ब्रिटिश कंपनी ईएमआई हाउसफील्ड के इंजीनियर ने सिर के निदान के लिए एक्स-रे कंप्यूटेड टोमोग्राफी डिवाइस का आविष्कार किया, जिसे आमतौर पर सीटी (कंप्यूटर टोमोग्राफी) कहा जाता है। सीटी न्यूक्लियस विधि मानव सिर के खंड के प्रक्षेपण पर आधारित है और कंप्यूटर द्वारा क्रॉस-अनुभागीय छवि के पुनर्निर्माण के लिए संसाधित की जाती है, जिसे छवि पुनर्निर्माण कहा जाता है। 1975 में, ईएमआई ने सफलतापूर्वक पूरे शरीर के लिए एक सीटी उपकरण विकसित किया, जिसने मानव शरीर के विभिन्न भागों की एक स्पष्ट टोमोग्राफिक छवि प्राप्त की। 1979 में, इस निदान तकनीक ने नोबेल पुरस्कार जीता चिकित्सा अनुप्रयोगों के लिए डिजिटल इमेज प्रोसेसिंग तकनीक को  स्पेस फाउंडेशन  स्पेस टेक्नोलॉजी हॉल ऑफ फ़ेम में 1994 में शामिल किया गया था।

कार्य
डिजिटल इमेज प्रोसेसिंग बहुत अधिक जटिल एल्गोरिदम के उपयोग की अनुमति देता है, और इसलिए, सरल कार्यों में अधिक परिष्कृत प्रदर्शन और उन तरीकों के कार्यान्वयन की पेशकश कर सकता है जो एनालॉग माध्यमों से असंभव होगा।

विशेष रूप से, डिजिटल इमेज प्रोसेसिंग का एक ठोस अनुप्रयोग है, और एक व्यावहारिक तकनीक पर आधारित है:
 * वर्गीकरण
 * फ़ीचर निष्कर्षण
 * मल्टी-स्केल सिग्नल विश्लेषण
 * पैटर्न पहचान
 * प्रोजेक्शन

डिजिटल इमेज प्रोसेसिंग में उपयोग की जाने वाली कुछ तकनीकों में शामिल हैं:
 * अनिसोट्रोपिक प्रसार
 * हिडन मार्कोव मॉडल एस
 * छवि संपादन
 * छवि बहाली
 * स्वतंत्र घटक विश्लेषण
 * रैखिक फ़िल्टर आईएनजी
 * तंत्रिका नेटवर्क
 * आंशिक अंतर समीकरण
 * पिक्सेलेशन
 * प्वाइंट फीचर मैचिंग
 * प्रमुख घटक विश्लेषण
 * स्व-आयोजन मानचित्र s
 * तरंगिका s

छनन
डिजिटल फिल्टर का उपयोग डिजिटल छवियों को धुंधला और तेज करने के लिए किया जाता है। फ़िल्टरिंग द्वारा किया जा सकता है:
 * कनवल्शन विशेष रूप से डिजाइन किए गए    कर्नेल  (फ़िल्टर एरे) स्थानिक डोमई में \शुरू{बीमैट्रिक्स} 0 और 0 और 0 \\ 0 और 1 और 0 \\ 0 और 0 और 0 \अंत{बीमैट्रिक्स}  | - |      स्थानिक लोपास   | संरेखित करें = केंद्र |   \frac{1}{9}\बार \शुरू{बीमैट्रिक्स} 1 और 1 और 1 \\ 1 और 1 और 1 \\ 1 और 1 और 1 \अंत{बीमैट्रिक्स}  | - |     स्थानिक हाईपास   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 0 और -1 और 0 \\ -1 और 4 और -1 \\ 0 और -1 और 0 \अंत{बीमैट्रिक्स}  | |  - |      फूरियर प्रतिनिधित्व   | छद्म कोड:
 * [[File:Affine Transformation Original Checkerboard.jpg]]
 * [[File:Spatial Mean Filter Checkerboard.png]]

छवि = बिसात

एफ = छवि का फूरियर रूपांतरण

छवि दिखाएं: लॉग (1+निरपेक्ष मान (एफ))

| संरेखित करें"center"| | - |  फूरियर लोपास | संरेखित करें"center"| | संरेखित करें"center"| | - |  फूरियर हाईपास | संरेखित करें"center"| | संरेखित करें"center"| | - | }

फूरियर डोमेन फ़िल्टरिंग में छवि पैडिंग
छवियों को आम तौर पर फूरियर अंतरिक्ष में परिवर्तित होने से पहले गद्देदार किया जाता है, नीचे दी गई  हाईपास फ़िल्टर  एड छवियां विभिन्न पैडिंग तकनीकों के परिणामों को दर्शाती हैं:

{| वर्ग = विकिटेबल | - ! शून्य गद्देदार ! दोहराया किनारे गद्देदार | - |  - | }
 * [[File:Highpass FFT Filtered checkerboard.png]]
 * [[File:Highpass FFT Replicate.png]]

ध्यान दें कि बार-बार किनारे वाले पैडिंग की तुलना में शून्य गद्देदार होने पर हाईपास फ़िल्टर अतिरिक्त किनारों को दिखाता है।

फ़िल्टरिंग कोड उदाहरण
स्थानिक डोमेन हाईपास फ़िल्टरिंग के लिए MATLAB उदाहरण।

<वाक्यविन्यास हाइलाइट लैंग = matlab> आईएमजी = बिसात (20); % बिसात उत्पन्न करें % ************************** स्थानिक डोमेन  ********************* ****** क्लैप्लेस = [0 -1 0; -1 5 -1; 0 -1 0]; % लाप्लासियन फ़िल्टर कर्नेल एक्स = रूपांतरण 2 (आईएमजी, क्लैप्लेस); % convolve test img with % 3x3 लाप्लासियन कर्नेल आकृति imshow(X,[])% लाप्लासियन फ़िल्टर्ड दिखाएँ शीर्षक ('लाप्लासियन एज डिटेक्शन') 

फूरियर डोमेन फ़िल्टरिंग में छवि पैडिंग
छवियों को आम तौर पर फूरियर अंतरिक्ष में परिवर्तित होने से पहले गद्देदार किया जाता है, नीचे दी गई  हाईपास फ़िल्टर  एड छवियां विभिन्न पैडिंग तकनीकों के परिणामों को दर्शाती हैं:

{| वर्ग = विकिटेबल | - ! शून्य गद्देदार ! दोहराया किनारे गद्देदार | - |  - | }
 * [[File:Highpass FFT Filtered checkerboard.png]]
 * [[File:Highpass FFT Replicate.png]]

ध्यान दें कि बार-बार किनारे वाले पैडिंग की तुलना में शून्य गद्देदार होने पर हाईपास फ़िल्टर अतिरिक्त किनारों को दिखाता है।

फ़िल्टरिंग कोड उदाहरण
स्थानिक डोमेन हाईपास फ़िल्टरिंग के लिए MATLAB उदाहरण।

<वाक्यविन्यास हाइलाइट लैंग = matlab> आईएमजी = बिसात (20); % बिसात उत्पन्न करें % ************************** स्थानिक डोमेन  ********************* ****** क्लैप्लेस = [0 -1 0; -1 5 -1; 0 -1 0]; % लाप्लासियन फ़िल्टर कर्नेल एक्स = रूपांतरण 2 (आईएमजी, क्लैप्लेस); % convolve test img with % 3x3 लाप्लासियन कर्नेल आकृति imshow(X,[])% लाप्लासियन फ़िल्टर्ड दिखाएँ शीर्षक ('लाप्लासियन एज डिटेक्शन') 

एफ़िन ट्रांसफ़ॉर्मेशन
एफ़िन ट्रांसफ़ॉर्मेशन स्केल, रोटेट, ट्रांसलेशन, मिरर और शीयर सहित बेसिक इमेज ट्रांसफ़ॉर्मेशन को सक्षम करता है जैसा कि निम्नलिखित उदाहरणों में दिखाया गया है

{| वर्ग = विकिटेबल | - ! परिवर्तन का नाम ! एफ़िन मैट्रिक्स ! उदाहरण | - |     पहचान   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और 0 और 0 \\ 0 और 1 और 0 \\ 0 और 0 और 1 \अंत{बीमैट्रिक्स}  | - |     परावर्तन   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} -1 और 0 और 0 \\ 0 और 1 और 0 \\ 0 और 0 और 1 \अंत{बीमैट्रिक्स}  | - |      स्केल   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} c_x=2 और 0 और 0 \\ 0 और c_y=1 और 0 \\ 0 और 0 और 1 \अंत{बीमैट्रिक्स}  | - |     घुमाएँ  | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} \cos(\theta) और \sin(\theta) और 0 \\ -\sin(\theta) और \cos(\theta) & 0 \\ 0 और 0 और 1 \अंत{बीमैट्रिक्स}  | - |     अपरूपण   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और c_x=0.5 और 0 \\ c_y=0 और 1 और 0 \\ 0 और 0 और 1 \अंत{बीमैट्रिक्स}  | - | } एक छवि के लिए एफ़िन मैट्रिक्स को लागू करने के लिए, छवि को मैट्रिक्स में बदल दिया जाता है जिसमें प्रत्येक प्रविष्टि उस स्थान पर पिक्सेल तीव्रता से मेल खाती है। फिर प्रत्येक पिक्सेल के स्थान को एक वेक्टर के रूप में दर्शाया जा सकता है जो छवि में उस पिक्सेल के निर्देशांक को दर्शाता है, [x, y], जहां x और y छवि मैट्रिक्स में एक पिक्सेल की पंक्ति और स्तंभ हैं। यह समन्वय को एक एफ़िन-ट्रांसफ़ॉर्मेशन मैट्रिक्स से गुणा करने की अनुमति देता है, जो यह स्थिति देता है कि आउटपुट छवि में पिक्सेल मान की प्रतिलिपि बनाई जाएगी।
 * [[File:Checkerboard identity.svg]]
 * [[File:Checkerboard reflection.svg]]
 * [[File:Checkerboard scale.svg]]
 * [[File:Checkerboard rotate.svg]] जहां $θ = π⁄6 =30°$
 * [[File:Checkerboard shear.svg]]

हालांकि, अनुवाद रूपांतरणों की आवश्यकता वाले परिवर्तनों की अनुमति देने के लिए, 3 आयामी  सजातीय निर्देशांक  की आवश्यकता है। तीसरा आयाम आमतौर पर एक गैर-शून्य स्थिरांक पर सेट होता है, आमतौर पर 1, ताकि नया निर्देशांक [x, y, 1] हो। यह समन्वय वेक्टर को 3 से 3 मैट्रिक्स से गुणा करने की अनुमति देता है, जिससे अनुवाद बदलाव सक्षम होते हैं। तो तीसरा आयाम, जो स्थिरांक 1 है, अनुवाद की अनुमति देता है।

चूंकि मैट्रिक्स गुणन साहचर्य है, इसलिए कई एफ़िन ट्रांसफ़ॉर्मेशन को एक ही एफ़िन ट्रांसफ़ॉर्मेशन में जोड़ा जा सकता है, ताकि ट्रांसफ़ॉर्मेशन किए जाने के क्रम में प्रत्येक व्यक्तिगत ट्रांसफ़ॉर्मेशन के मैट्रिक्स को गुणा किया जा सके। इसका परिणाम एक एकल मैट्रिक्स में होता है, जब एक बिंदु वेक्टर पर लागू किया जाता है, तो वही परिणाम देता है जो अनुक्रम में वेक्टर [x, y, 1] पर किए गए सभी व्यक्तिगत परिवर्तनों के समान होता है। इस प्रकार एफ़िन ट्रांसफ़ॉर्मेशन मैट्रिसेस के अनुक्रम को सिंगल एफ़िन ट्रांसफ़ॉर्मेशन मैट्रिक्स में घटाया जा सकता है।

उदाहरण के लिए, 2 आयामी निर्देशांक केवल मूल (0, 0) के बारे में रोटेशन की अनुमति देते हैं। लेकिन 3 आयामी सजातीय निर्देशांक का उपयोग पहले किसी भी बिंदु को (0, 0) में अनुवाद करने के लिए किया जा सकता है, फिर रोटेशन का प्रदर्शन किया जा सकता है, और अंत में मूल बिंदु (0, 0) का मूल बिंदु (पहले अनुवाद के विपरीत) में अनुवाद किया जा सकता है। इन 3 एफ़िन परिवर्तनों को एक एकल मैट्रिक्स में जोड़ा जा सकता है, इस प्रकार छवि में किसी भी बिंदु के चारों ओर घूर्णन की अनुमति मिलती है

आकृति विज्ञान के साथ छवि निरूपण
गणितीय आकृति विज्ञान छवियों को निरूपित करने के लिए उपयुक्त है।   गणितीय आकृति विज्ञान  में संरचना तत्व ]] महत्वपूर्ण हैं।

निम्नलिखित उदाहरण संरचना तत्वों के बारे में हैं। denoise फ़ंक्शन, I के रूप में छवि, और B के रूप में संरचना तत्व को नीचे और तालिका के रूप में दिखाया गया है।

जैसे (मैं') = \शुरू {bmatrix} 45 और 50 और 65 \\ 40 और 60 और 55 \\ 25 और 15 और 5 \अंत{बीमैट्रिक्स} बी = \ शुरू {बीमैट्रिक्स} 1 और 2 और 1 \\ 2 और 1 और 1 \\ 1 और 0 और 3 \end{bmatrix}

Dilation (I, B) (i, j) =. को परिभाषित करें $$max\{I(i+m, j+n) + B(m,n)\}$$. चलो फैलाव (आई, बी) = डी (आई, बी)

डी (आई', बी) (1,1) = $$max(45+1,50+2,65+1,40+2,60+1,55+1,25+1,15+0,5+3) = 66$$

अपरदन को परिभाषित कीजिए (I, B)(i,j) = $$min\{I(i+m, j+n) - B(m,n)\}$$. माना अपरदन(I,B) = E(I,B)

ई (आई', बी) (1,1) = $$min(45-1,50-2,65-1,40-2,60-1,55-1,25-1,15-0,5-3) = 2$$

फैलाव के बाद (मैं') = \शुरू {bmatrix} 45 और 50 और 65 \\ 40 और 66 और 55 \\ 25 और 15 और 5 \अंत{बीमैट्रिक्स}  कटाव के बाद (मैं') = \शुरू {bmatrix} 45 और 50 और 65 \\ 40 और 2 और 55 \\ 25 और 15 और 5 \अंत{बीमैट्रिक्स} 

एक उद्घाटन विधि केवल पहले क्षरण है, और फिर फैलाव है जबकि समापन विधि इसके विपरीत है। वास्तव में, D(I,B) और E(I,B) को  कनवल्शन. द्वारा कार्यान्वित किया जा सकता है

{| वर्ग = विकिटेबल | - ! संरचना तत्व ! नकाब ! कोड ! उदाहरण | - |   मूल छवि | कोई नहीं | मूल छवि पढ़ने के लिए मैटलैब का प्रयोग करें <वाक्यविन्यास हाइलाइट लैंग = matlab> मूल imread('scene.jpg'); छवि = rgb2gray (मूल); [आर, सी, चैनल] = आकार (छवि); से = तार्किक ([1 1 1 1; 1 1 1; 1 1 1]); [पी, क्यू] = आकार (से); आधा एच = मंजिल (पी / 2); आधा डब्ल्यू = मंजिल (क्यू/2); समय = 3; % सभी विधियों के साथ 3 बार निरूपित करना  | - |  - |      फैलाव   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और 1 और 1 \\ 1 और 1 और 1 \\ 1 और 1 और 1 \अंत{बीमैट्रिक्स}  | फैलाव के लिए मैटलैब का प्रयोग करें <वाक्यविन्यास हाइलाइट लैंग = matlab> imwrite(image, "scene_dil.jpg) एक्सट्रैक्टमैक्स = शून्य (आकार (छवि), वर्ग (छवि)); मैं = 1 के लिए: समय   दिल_इमेज imread('scene_dil.jpg');    कर्नल के लिए = (आधा डब्ल्यू + 1): (सी - आधा डब्ल्यू)        पंक्ति के लिए = (आधा एच + 1) : (आर - आधा एच)            dpointD = पंक्ति - आधाH;            dpointU = पंक्ति + आधाH;            dpointL = col - आधाW;            dpointR = col + आधाW;            dneighbor = dil_image (dpointD:dpointU, dpointL:dpointR);            फ़िल्टर = पड़ोसी (से);            एक्सट्रैक्टमैक्स (पंक्ति, कॉल) = अधिकतम (फ़िल्टर);        अंत    अंत    imwrite(extractmax, "scene_dil.jpg); अंत  | - |     अपरदन   | संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और 1 और 1 \\ 1 और 1 और 1 \\ 1 और 1 और 1 \अंत{बीमैट्रिक्स} </गणित> | कटाव के लिए मैटलैब का प्रयोग करें <वाक्यविन्यास हाइलाइट लैंग = matlab> imwrite(image, 'scene_ero.jpg'); एक्सट्रैक्टमिन = शून्य (आकार (छवि), वर्ग (छवि)); मैं = 1: समय. के लिए एरो_इमेज imread('scene_ero.jpg'); कर्नल के लिए = (आधा डब्ल्यू + 1): (सी - आधा डब्ल्यू) पंक्ति के लिए = (आधा एच +1): (आर -आधा एच) पॉइंटडाउन = पंक्ति-आधा एच; पॉइंटअप = पंक्ति + आधा एच; पॉइंट लेफ्ट = कॉल-हाफ डब्ल्यू; पॉइंटराइट = कर्नल + हाफ डब्ल्यू; पड़ोसी = एरो_इमेज (पॉइंटडाउन: पॉइंटअप, पॉइंट लेफ्ट: पॉइंट राइट); फ़िल्टर = पड़ोसी (से); एक्सट्रैक्टमिन (पंक्ति, कर्नल) = मिनट (फ़िल्टर); अंत अंत imwrite(extractmin, "scene_ero.jpg); अंत </वाक्यविन्यास हाइलाइट> | - |  - |     उद्घाटन   |  संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और 1 और 1 \\ 1 और 1 और 1 \\ 1 और 1 और 1 \अंत{बीमैट्रिक्स} </गणित> |  खोलने के लिए मैटलैब का प्रयोग करें <वाक्यविन्यास हाइलाइट लैंग = matlab> imwrite(extractmin, "scene_opening.jpg) एक्सट्रैक्टोपेन = शून्य (आकार (छवि), वर्ग (छवि)); मैं = 1 के लिए: समय दिल_इमेज imread('scene_opening.jpg'); कर्नल के लिए = (आधा डब्ल्यू + 1): (सी - आधा डब्ल्यू) पंक्ति के लिए = (आधा एच + 1) : (आर - आधा एच) डीपॉइंटडी = पंक्ति - आधा एच; dpointU = पंक्ति + आधाH; dpointL = col - आधाW; dpointR = col + आधाW; dneighbor = dil_image (dpointD:dpointU, dpointL:dpointR); फ़िल्टर = पड़ोसी (से); एक्सट्रैक्टोपेन (पंक्ति, कॉल) = अधिकतम (फ़िल्टर); अंत अंत imwrite(extractopen, "scene_opening.jpg); अंत </वाक्यविन्यास हाइलाइट> | - |      समापन   |  संरेखित करें = केंद्र |   \शुरू{बीमैट्रिक्स} 1 और 1 और 1 \\ 1 और 1 और 1 \\ 1 और 1 और 1 \अंत{बीमैट्रिक्स} </गणित> |  बंद करने के लिए मैटलैब का प्रयोग करें <वाक्यविन्यास हाइलाइट लैंग = matlab> imwrite(extractmax, "scene_closing.jpg) एक्सट्रैक्टक्लोज़ = शून्य (आकार (छवि), वर्ग (छवि)); मैं = 1 के लिए: समय एरो_इमेज imread('scene_closing.jpg'); कर्नल के लिए = (आधा डब्ल्यू + 1): (सी - आधा डब्ल्यू) पंक्ति के लिए = (आधा एच + 1) : (आर - आधा एच) dpointD = पंक्ति - आधाH; dpointU = पंक्ति + आधाH; dpointL = col - आधाW; dpointR = col + आधाW; dneighbor = ero_image (dpointD:dpointU, dpointL:dpointR); फ़िल्टर = पड़ोसी (से); एक्सट्रैक्टक्लोज़ (पंक्ति, कॉल) = मिनट (फ़िल्टर); अंत अंत imwrite(extractclose, "scene_closing.jpg); अंत </वाक्यविन्यास हाइलाइट> | - | }
 * Lotus free.jpg
 * Lotus free dil.jpg . के साथ चित्र को नकारना
 * Lotus free erosion.jpg
 * Lotus free opening.jpg
 * Lotus free closing.jpg . के साथ डिनोइजिंग पिक्चर

एक छवि के लिए denoising विधि को लागू करने के लिए, छवि को ग्रेस्केल में बदल दिया जाता है। denoising विधि वाला एक मुखौटा तार्किक मैट्रिक्स है $$[1 1 1 ; 1 1 1 ; 1 1 1]$$. denoising विधियां चित्र के केंद्र से आधी ऊंचाई, आधी चौड़ाई के साथ शुरू होती हैं, और पंक्ति संख्या, स्तंभ संख्या की छवि सीमा के साथ समाप्त होती हैं। सीमा के साथ मूल छवि में पड़ोसी एक ब्लॉक है [केंद्र के नीचे का बिंदु: ऊपर का बिंदु, केंद्र के बाईं ओर का बिंदु: केंद्र के दाईं ओर का बिंदु]।  कनवल्शन  नेबर और स्ट्रक्चरिंग एलिमेंट और फिर सेंटर को कम से कम पड़ोसी से बदलें।

उदाहरण के लिए समापन विधि को लें।

पहले फैलाव
 * 1) छवि पढ़ें और इसे मैटलैब के साथ ग्रेस्केल में बदलें।
 * 2) एक छवि का आकार प्राप्त करें। वापसी मान पंक्ति संख्याएँ और स्तंभ संख्याएँ वे सीमाएँ हैं जिनका हम बाद में उपयोग करने जा रहे हैं।
 * 3) संरचना तत्व आपके फैलाव या क्षरण कार्य पर निर्भर करते हैं। एक पिक्सेल के पड़ोसी का न्यूनतम एक क्षरण विधि की ओर जाता है और अधिकतम पड़ोसी एक फैलाव विधि की ओर जाता है।
 * 4) फैलाव, कटाव और बंद होने का समय निर्धारित करें।
 * 5) मूल छवि के समान आकार का शून्य मैट्रिक्स बनाएं।
 * 6) स्ट्रक्चरिंग विंडो के साथ पहले फैलाव।
 * 7) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कनवल्शन है
 * 8) लूप के लिए पंक्ति श्रेणी से विंडो के साथ न्यूनतम निकालें [2  छवि ऊंचाई - 1] स्तंभ श्रेणी के साथ [2  छवि चौड़ाई - 1]
 * 9) न्यूनतम मान को शून्य मैट्रिक्स में भरें और एक नई छवि सहेजें
 * 10) सीमा के लिए, इसमें अभी भी सुधार किया जा सकता है। चूंकि विधि में, एक सीमा की उपेक्षा की जाती है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।

फिर कटाव (फैलाव छवि को इनपुट के रूप में लें)
 * 1) मूल छवि के समान आकार का शून्य मैट्रिक्स बनाएं।
 * 2) स्ट्रक्चरिंग विंडो के साथ कटाव।
 * 3) स्ट्रक्चरिंग विंडो 3*3 मैट्रिक्स और कनवल्शन है
 * 4) लूप के लिए पंक्ति श्रेणी से विंडो के साथ अधिकतम निकालें [2  छवि ऊंचाई - 1] स्तंभ श्रेणी के साथ [2  छवि चौड़ाई - 1]
 * 5) शून्य मैट्रिक्स में अधिकतम मान भरें और एक नई छवि सहेजें
 * 6) सीमा के लिए, इसमें अभी भी सुधार किया जा सकता है। चूंकि विधि में सीमा की उपेक्षा की जाती है। सीमाओं से निपटने के लिए पैडिंग तत्वों को लागू किया जा सकता है।
 * 7) परिणाम ऊपर दी गई तालिका के अनुसार हैं

डिजिटल कैमरा चित्र
डिजिटल कैमरों में आम तौर पर विशेष डिजिटल इमेज प्रोसेसिंग हार्डवेयर शामिल होता है - या तो समर्पित चिप्स या अन्य चिप्स पर अतिरिक्त सर्किटरी - अपने  छवि सेंसर  से कच्चे डेटा को    रंग-सुधारित  छवि। |  छवि फ़ाइल प्रारूप ]]। अतिरिक्त पोस्ट प्रोसेसिंग तकनीक अधिक स्वाभाविक रूप से दिखने वाली छवियां बनाने के लिए किनारे की तीक्ष्णता या रंग संतृप्ति को बढ़ाती हैं।

फिल्म
''  वेस्टवर्ल्ड " (1973) पहली फीचर फिल्म थी जिसमें   पिक्सललेट  फोटोग्राफी के लिए डिजिटल इमेज प्रोसेसिंग का उपयोग किया गया था ताकि एंड्रॉइड के दृष्टिकोण का अनुकरण किया जा सके। इमेज प्रोसेसिंग का उपयोग   क्रोमा कुंजी  प्रभाव उत्पन्न करने के लिए भी किया जाता है जो अभिनेताओं की पृष्ठभूमि को प्राकृतिक या कलात्मक दृश्यों से बदल देता है।

चेहरे का पता लगाना
फेस डिटेक्शन को   गणितीय आकृति विज्ञान,   डिस्क्रीट कोसाइन ट्रांसफॉर्म  के साथ कार्यान्वित किया जा सकता है जिसे आमतौर पर डीसीटी कहा जाता है, और क्षैतिज   प्रोजेक्शन (गणित) ।

सुविधा-आधारित पद्धति के साथ सामान्य विधि

चेहरे का पता लगाने की सुविधा-आधारित विधि चेहरे का पता लगाने के लिए त्वचा की टोन, किनारे का पता लगाने, चेहरे का आकार और चेहरे की विशेषता (जैसे आंखें, मुंह, आदि) का उपयोग कर रही है। त्वचा की टोन, चेहरे का आकार, और सभी अद्वितीय तत्व जो केवल मानव चेहरे के पास हैं, उन्हें विशेषताओं के रूप में वर्णित किया जा सकता है।

प्रक्रिया स्पष्टीकरण


 * 1) चेहरे की छवियों के एक बैच को देखते हुए, पहले चेहरे की छवियों का नमूना लेकर त्वचा की टोन रेंज निकालें। स्किन टोन रेंज सिर्फ एक स्किन फिल्टर है।
 * 2)   संरचनात्मक समानता  सूचकांक माप (एसएसआईएम) त्वचा की टोन निकालने के संदर्भ में छवियों की तुलना करने के लिए लागू किया जा सकता है।
 * 3) आम तौर पर, HSV या RGB रंग स्थान त्वचा फ़िल्टर के लिए उपयुक्त होते हैं। उदा. HSV मोड, स्किन टोन रेंज [0,48,50] ''' [20,255,255] है
 * 4) त्वचा की टोन के साथ छवियों को फ़िल्टर करने के बाद, चेहरे का किनारा पाने के लिए, शोर को दूर करने और लापता त्वचा क्षेत्रों को भरने के लिए आकृति विज्ञान और डीसीटी का उपयोग किया जाता है।
 * 5) छूटी हुई त्वचा को भरने के लिए उद्घाटन विधि या समापन विधि का उपयोग किया जा सकता है।
 * 6) DCT टोन जैसी त्वचा वाली वस्तु से बचने के लिए है। चूंकि मानव चेहरों की बनावट हमेशा ऊंची होती है।
 * 7) फेस एज का पता लगाने के लिए सोबेल ऑपरेटर या अन्य ऑपरेटरों को लगाया जा सकता है।
 * 8) आंखों जैसी मानवीय विशेषताओं को स्थापित करने के लिए, प्रोजेक्शन का उपयोग करके और प्रोजेक्शन के हिस्टोग्राम के शिखर का पता लगाने से माउस, बाल और होंठ जैसी डिटेल फीचर प्राप्त करने में मदद मिलती है।
 * 9) प्रोजेक्शन केवल उच्च आवृत्ति को देखने के लिए छवि को पेश कर रहा है जो आमतौर पर फीचर स्थिति है।

छवि गुणवत्ता पद्धति में सुधार
छवि गुणवत्ता कैमरा कंपन, अति-एक्सपोज़र, ग्रे स्तर वितरण बहुत केंद्रीकृत, और शोर आदि से प्रभावित हो सकती है। उदाहरण के लिए, शोर समस्या को  स्मूथिंग  विधि द्वारा हल किया जा सकता है जबकि ग्रे स्तर वितरण समस्या को   हिस्टोग्राम इक्वलाइजेशन  द्वारा सुधारा जा सकता है।.

 चौरसाई  विधि

ड्राइंग में, अगर कुछ असंतुष्ट रंग है, तो असंतुष्ट रंग के आसपास कुछ रंग लेना और उनका औसत लेना। यह चौरसाई विधि के बारे में सोचने का एक आसान तरीका है।

स्मूथिंग विधि को मास्क और  कनवल्शन  से लागू किया जा सकता है। उदाहरण के लिए नीचे दी गई छोटी छवि और मुखौटा लें।

छवि है  \शुरू{बीमैट्रिक्स} 2 और 5 और 6 और 5\\ 3 और 1 और 4 और 6 \\ 1 और 28 और 30 और 2 \\ 7 और 3 और 2 और 2 \अंत{बीमैट्रिक्स} </गणित>

मुखौटा है  \शुरू{बीमैट्रिक्स} 1/9 और 1/9 और 1/9 \\ 1/9 और 1/9 और 1/9 \\ 1/9 और 1/9 और 1/9 \अंत{बीमैट्रिक्स} </गणित>

कनवल्शन और स्मूथिंग के बाद, छवि है <गणित> \शुरू{बीमैट्रिक्स} 2 और 5 और 6 और 5\\ 3 और 9 और 10 और 6 \\ 1 और 9 और 9 और 2 \\ 7 और 3 और 2 और 2 \अंत{बीमैट्रिक्स} </गणित>

अवलोकन छवि [1, 1], छवि [1, 2], छवि [2, 1], और छवि [2, 2]।

मूल छवि पिक्सेल 1, 4, 28, 30 है। मास्क को चिकना करने के बाद, पिक्सेल क्रमशः 9, 10, 9, 9 हो जाता है।

नई छवि [1, 1] = $$\tfrac{1}{9}$$ * (छवि [0,0] + छवि [0,1] + छवि [0,2] + छवि [1,0] + छवि [1,1] + छवि [1,2] + छवि [2,0] +छवि[2,1]+छवि[2,2])

नई छवि [1, 1] = मंजिल$$\tfrac{1}{9}$$ * (2+5+6+3+1+4+1+28+30)) = 9

नई छवि [1, 2] = मंजिल ($$\tfrac{1}{9}$$ * (5+6+5+1+4+6+28+30+2)) = 10

नई छवि [2, 1] = मंजिल$$\tfrac{1}{9}$$ * (3+1+4+1+28+30+73+3+2)) = 9

नई छवि [2, 2] = मंजिल$$\tfrac{1}{9}$$ * (1+4+6+28+30+2+3+2+2)) = 9

ग्रे स्तर हिस्टोग्राम विधि

आम तौर पर, नीचे दी गई छवि से ग्रे स्तर का हिस्टोग्राम दिया जाता है। एक छवि से समान वितरण के लिए हिस्टोग्राम को बदलना आमतौर पर हम  हिस्टोग्राम इक्वलाइजेशन  कहते हैं।





असतत समय में, ग्रे लेवल हिस्टोग्राम का क्षेत्रफल होता है $$\sum_{i=0}^{k}H(p_i)$$(see figure 1) while the area of uniform distribution is $$\sum_{i=0}^{k}G(q_i)$$(see figure 2). It's clear that the area won't change, so $$\sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)$$.

एकसमान बंटन से की प्रायिकता $$q_i$$ is $$\tfrac{N^2}{q_k - q_0}$$ while the $$ 0 < i < k $$

निरंतर समय में, समीकरण है $$\displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds$$.

इसके अलावा, किसी फ़ंक्शन की परिभाषा के आधार पर, ग्रे लेवल हिस्टोग्राम विधि एक फ़ंक्शन खोजने जैसा है $$f$$ जो f(p)=q को संतुष्ट करता है।

{| वर्ग = विकिटेबल | - ! सुधार विधि ! मुद्दा ! सुधार से पहले ! प्रक्रिया ! सुधार के बाद | - |  - |  चौरसाई विधि | शोर मैटलैब के साथ, 0.01 पैरामीटर के साथ नमक और काली मिर्च को जोड़ा जाता है एक शोर छवि बनाने के लिए मूल छवि में। | \शुरू{बीमैट्रिक्स} 1/9 और 1/9 और 1/9 \\ 1/9 और 1/9 और 1/9 \\ 1/9 और 1/9 और 1/9 \अंत{बीमैट्रिक्स} </गणित>
 * Helmet with noise.jpg
 * 1) छवि पढ़ें और छवि को ग्रेस्केल में बदलें
 * 2) ग्रेसेल इमेज को मास्क के साथ सजाएं <गणित>
 * 1) denoisy छवि चरण 2 का परिणाम होगी।

| - |  - |  हिस्टोग्राम इक्वलाइजेशन | ग्रे स्तर का वितरण भी केंद्रीकृत |   हिस्टोग्राम इक्वलाइजेशन. का संदर्भ लें | - |  }
 * Helmet without noise.jpg
 * Cave scene before improvement.jpg
 * Cave scene after improvement.jpg

थकान का पता लगाने और निगरानी तकनीक
पिछले एक दशक में थकान निगरानी तकनीक में महत्वपूर्ण प्रगति हुई है। ये अभिनव प्रौद्योगिकी समाधान अब व्यावसायिक रूप से उपलब्ध हैं और सभी उद्योगों में ड्राइवरों, ऑपरेटरों और अन्य शिफ्ट श्रमिकों को वास्तविक सुरक्षा लाभ प्रदान करते हैं

सॉफ्टवेयर डेवलपर्स, इंजीनियरों और वैज्ञानिकों ने थकान या उनींदापन की स्थिति को निर्धारित करने के लिए विभिन्न शारीरिक संकेतों का उपयोग करके  थकान का पता लगाने वाला सॉफ्टवेयर  विकसित किया है। थकान निगरानी में मानक के रूप में मस्तिष्क गतिविधि (इलेक्ट्रोएन्सेफलोग्राम) की माप को व्यापक रूप से स्वीकार किया जाता है। थकान से संबंधित हानि को निर्धारित करने के लिए उपयोग की जाने वाली अन्य तकनीक में व्यवहार संबंधी लक्षण माप शामिल हैं जैसे; आंखों का व्यवहार, टकटकी की दिशा, स्टीयरिंग और थ्रॉटल उपयोग में सूक्ष्म सुधार के साथ-साथ हृदय गति परिवर्तनशीलता