इमेज ग्रेडिएंट

एक छवि ढाल एक छवि में तीव्रता या रंग में एक दिशात्मक परिवर्तन है। इमेज का ग्रेडियेंट   मूर्ति प्रोद्योगिकी  में मूलभूत बिल्डिंग ब्लॉक्स में से एक है। उदाहरण के लिए, कैनी एज डिटेक्टर  किनारे का पता लगाना  के लिए इमेज ग्रेडिएंट का उपयोग करता है।  डिजिटल छवि संपादन  के लिए ग्राफिक्स सॉफ्टवेयर में, ग्रेडिएंट या कलर ग्रेडिएंट शब्द का उपयोग रंग के क्रमिक मिश्रण के लिए भी किया जाता है, जिसे समान विक्षनरी के रूप में माना जा सकता है: छवियों में सफेद से काले रंग में उपयोग किए जाने वाले निम्न से उच्च मूल्यों तक का उन्नयन सही। इसका दूसरा नाम 'कलर प्रोग्रेस' है।

गणितीय रूप से, प्रत्येक छवि बिंदु पर एक दो-चर फ़ंक्शन (यहाँ छवि तीव्रता फ़ंक्शन) का ढाल क्षैतिज और ऊर्ध्वाधर दिशाओं में यौगिक  द्वारा दिए गए घटकों के साथ एक 2D वेक्टर (ज्यामितीय) है। प्रत्येक छवि बिंदु पर, ग्रेडिएंट वेक्टर अधिकतम संभावित तीव्रता वृद्धि की दिशा में इंगित करता है, और ग्रेडिएंट वेक्टर की लंबाई उस दिशा में परिवर्तन की दर से मेल खाती है। चूंकि एक डिजिटल छवि का तीव्रता कार्य केवल असतत बिंदुओं पर जाना जाता है, इस फ़ंक्शन के डेरिवेटिव को तब तक परिभाषित नहीं किया जा सकता जब तक कि हम यह नहीं मानते कि एक अंतर्निहित निरंतर फ़ंक्शन तीव्रता फ़ंक्शन है जिसे छवि बिंदुओं पर नमूना किया गया है। कुछ अतिरिक्त धारणाओं के साथ, निरंतर तीव्रता फ़ंक्शन के व्युत्पन्न की गणना नमूना तीव्रता फ़ंक्शन, यानी डिजिटल छवि पर एक फ़ंक्शन के रूप में की जा सकती है। इन व्युत्पन्न कार्यों के अनुमानों को सटीकता की अलग-अलग डिग्री पर परिभाषित किया जा सकता है। इमेज ग्रेडिएंट को अनुमानित करने का सबसे आम तरीका एक छवि को कर्नेल के साथ कनवल्शन करना है, जैसे कि सोबेल ऑपरेटर या प्रीविट ऑपरेटर।

अतिरिक्त जानकारी देने के लिए इमेज ग्रेडिएंट्स का उपयोग अक्सर मानचित्रों और आंकड़े के अन्य दृश्य प्रस्तुतियों में किया जाता है। भौगोलिक सूचना प्रणाली उपकरण दूसरों के बीच ऊंचाई और जनसंख्या घनत्व को इंगित करने के लिए रंग प्रगति का उपयोग करते हैं।

कंप्यूटर दृष्टि
छवि ग्रेडियेंट का उपयोग छवियों से जानकारी निकालने के लिए किया जा सकता है। इस उद्देश्य के लिए ग्रेडियेंट छवियां मूल छवि से बनाई जाती हैं (आमतौर पर फ़िल्टर के साथ दृढ़ संकल्प करके, सबसे सरल सोबेल फिल्टर में से एक)। एक ढाल छवि का प्रत्येक पिक्सेल मूल छवि में उसी बिंदु की तीव्रता में परिवर्तन को एक निश्चित दिशा में मापता है। दिशा की पूरी श्रृंखला प्राप्त करने के लिए, x और y दिशाओं में ग्रेडिएंट छवियों की गणना की जाती है।

सबसे आम उपयोगों में से एक एज डिटेक्शन है। ग्रेडिएंट छवियों की गणना करने के बाद, बड़े ग्रेडिएंट मान वाले पिक्सेल संभव एज पिक्सेल बन जाते हैं। ग्रेडिएंट की दिशा में सबसे बड़े ग्रेडिएंट वैल्यू वाले पिक्सल एज पिक्सल बन जाते हैं, और किनारों को ग्रेडिएंट दिशा के लंबवत दिशा में ट्रेस किया जा सकता है। ग्रेडिएंट्स का उपयोग करने वाले एज डिटेक्शन एल्गोरिदम का एक उदाहरण कैनी एज डिटेक्टर है।

इमेज ग्रेडिएंट्स का इस्तेमाल मजबूत फीचर और टेक्सचर मैचिंग के लिए भी किया जा सकता है। अलग-अलग प्रकाश व्यवस्था या कैमरा गुणों के कारण एक ही दृश्य की दो छवियों में अत्यधिक भिन्न पिक्सेल मान हो सकते हैं। यह मेल खाने वाले एल्गोरिदम को बहुत समान या समान सुविधाओं से मिलान करने में विफल कर सकता है। इसे हल करने का एक तरीका मूल छवियों से गणना की गई ढाल छवियों के आधार पर बनावट या फीचर हस्ताक्षरों की गणना करना है। ये ग्रेडिएंट प्रकाश और कैमरा परिवर्तनों के प्रति कम संवेदनशील होते हैं, इसलिए मिलान त्रुटियां कम हो जाती हैं।

गणित
एक छवि का ढाल इसके आंशिक व्युत्पन्न का एक सदिश है:


 * $$\nabla f=\begin{bmatrix}

g_{x} \\ g_{y} \end{bmatrix} = \begin{bmatrix} \frac{\partial f}{\partial x} \\ \frac{\partial f}{\partial y} \end{bmatrix} $$,

कहाँ:


 * $$\textstyle\frac{\partial f}{\partial x}$$ एक्स के संबंध में व्युत्पन्न है (एक्स दिशा में ढाल)


 * $$\textstyle\frac{\partial f}{\partial y}$$ y के संबंध में व्युत्पन्न है (y दिशा में ढाल)।

एक छवि के व्युत्पन्न को परिमित अंतरों द्वारा अनुमानित किया जा सकता है। यदि केंद्रीय अंतर का उपयोग किया जाता है, तो गणना करने के लिए $$\textstyle\frac{\partial f}{\partial y}$$ हम छवि के लिए 1-आयामी फ़िल्टर लागू कर सकते हैं $$\mathbf{A}$$ कर्नेल द्वारा (इमेज प्रोसेसिंग)#Convolution:



\frac{\partial f}{\partial y} = \begin{bmatrix} -1 \\ +1 \end{bmatrix} * \mathbf{A} $$ कहाँ $$*$$ 1-आयामी कनवल्शन ऑपरेशन को दर्शाता है। यह 2×1 फ़िल्टर छवि को आधे पिक्सेल से स्थानांतरित कर देगा। इससे बचने के लिए निम्न 3×1 फ़िल्टर करें

\begin{bmatrix} -1 \\ 0 \\ +1 \end{bmatrix} $$ इस्तेमाल किया जा सकता है। ढाल दिशा की गणना सूत्र द्वारा की जा सकती है:


 * $$\theta = \operatorname{tan{^-}{^1}} \left [ \frac{g_{y}}{g_{x}} \right ]$$,

और परिमाण द्वारा दिया गया है:
 * $$\sqrt{g_{y}^{2} + g_{x}^{2}}$$

यह भी देखें

 * ग्रेडिएंट-डोमेन इमेज प्रोसेसिंग
 * कलर बैंडिंग
 * posterization
 * छवि डेरिवेटिव
 * कुल भिन्नता denoising

बाहरी संबंध

 * GradientFilter function