फ़ीचर (कंप्यूटर विज़न): Difference between revisions

From Vigyanwiki
No edit summary
 
(33 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{short description|Piece of information about the content of an image}}
{{short description|Piece of information about the content of an image}}कंप्यूटर विज़न और इमेज (छवि) प्रसंस्करण में, '''फ़ीचर''' इमेज की सामग्री के विषय में जानकारी का एक अंश है, सामान्यतः इमेज के विषय में निश्चित क्षेत्र में कुछ गुण  हैं या नहीं हैं। फीचर्स इमेज में विशिष्ट संरचनाएं जैसे बिंदु, सिरा या वस्तु हो सकती हैं। फीचर्स सामान्य प्रतिवेश संचालन इमेज का परिणाम हो सकती हैं या फ़ीचर का पता लगाने के लिए इमेज पर प्रयुक्त भी हो सकती हैं। फीचर्स के अन्य उदाहरण इमेज अनुक्रमों में गति से संबंधित हैं, या विभिन्न इमेज क्षेत्रों के बीच घटता या सीमाओं के रूप में परिभाषित आकृतियों से संबंधित हैं।
{{FeatureDetectionCompVisNavbox}}


[[कंप्यूटर दृष्टि]] और छवि प्रसंस्करण में, फ़ीचर छवि की सामग्री के विषय में जानकारी का एक अंश है सामान्यतः छवि के विषय में कुछ क्षेत्र में कुछ गुण होते हैं। फीचर्स छवि में विशिष्ट संरचनाएं जैसे बिंदु, किनारे या वस्तु हो सकती हैं। फीचर्स सामान्य [[पड़ोस ऑपरेशन|प्रतिवेश ऑपरेशन]] छवि का परिणाम हो सकती हैं या फ़ीचर का पता लगाने छवि पर प्रयुक्त भी हो सकती हैं। फीचर्स के अन्य उदाहरण छवि अनुक्रमों में गति से संबंधित हैं, या विभिन्न छवि क्षेत्रों के बीच घटता या सीमाओं के रूप में परिभाषित आकृतियों से संबंधित हैं।
अधिक व्यापक रूप से सुविधा सूचना का कोई भाग है जो निश्चित अनुप्रयोग से संबंधित कम्प्यूटेशनल कार्य को हल करने के लिए प्रासंगिक है। यह सामान्य रूप से [[ फ़ीचर (मशीन लर्निंग) |मशीन लर्निंग]] (यंत्र अधिगम) और पैटर्न रिकग्निशन (पैटर्न मान्यता) में [[ फ़ीचर (मशीन लर्निंग) | फ़ीचर]] के समान ही है, यद्यपि इमेज प्रसंस्करण में फीचर्स का एक बहुत ही परिष्कृत संग्रह है। फ़ीचर अवधारणा बहुत सामान्य है और किसी विशेष कंप्यूटर विज़न प्रणाली में फीचर्स का चुनाव विशिष्ट समस्या पर अत्यधिक निर्भर हो सकता है।
 
अधिक व्यापक रूप से सुविधा सूचना का कोई भाग है जो निश्चित अनुप्रयोग से संबंधित कम्प्यूटेशनल कार्य को हल करने के लिए प्रासंगिक है। यह सामान्य रूप से [[ यंत्र अधिगम | यंत्र अधिगम]][[ फ़ीचर (मशीन लर्निंग) |(मशीन लर्निंग)]] और [[पैटर्न मान्यता|पैटर्न रिकग्निशन (पैटर्न मान्यता)]] में [[ फ़ीचर (मशीन लर्निंग) | फ़ीचर]] के समान ही है, यद्यपि [[ मूर्ति प्रोद्योगिकी |इमेज प्रोसेसिंग]] में फीचर्स का एक बहुत ही परिष्कृत संग्रह है। फ़ीचर अवधारणा बहुत सामान्य है और किसी विशेष कंप्यूटर विज़न सिस्टम में फीचर्स का चुनाव विशिष्ट समस्या पर अत्यधिक निर्भर हो सकता है।


== परिभाषा ==
== परिभाषा ==
किसी फ़ीचर का गठन करने की कोई सार्वभौमिक या सटीक परिभाषा नहीं है, और सटीक परिभाषा प्रायः समस्या या अनुप्रयोग के प्रकार पर निर्भर करती है। फिर भी, एक फ़ीचर को सामान्यत: एक [[डिजिटल छवि]] के एक दिलचस्प हिस्से के रूप में परिभाषित किया जाता है, और फीचर्स का उपयोग कई कंप्यूटर विज़न कलन विधि के लिए शुरुआती बिंदु के रूप में किया जाता है।
किसी फ़ीचर का गठन करने की कोई सार्वभौमिक या सटीक परिभाषा नहीं है, और सटीक परिभाषा प्रायः समस्या या अनुप्रयोग के प्रकार पर निर्भर करती है। फिर भी, एक फ़ीचर को सामान्यत: [[डिजिटल छवि|डिजिटल इमेज]] के एक उत्कृष्ट अंश के रूप में परिभाषित किया जाता है, और फीचर्स का उपयोग कई कंप्यूटर विज़न कलन विधि के लिए प्रारंभिक बिंदु के रूप में किया जाता है।


चूंकि फीचर्स का उपयोग बाद के कलन विधि के लिए शुरुआती बिंदु और मुख्य पुरातन के रूप में किया जाता है, इसलिए समग्र कलन विधि प्रायः इसके फीचर  संसूचक जितना ही अच्छा होगा। परिणामस्वरूप, एक ही दृश्य के दो या दो से अधिक अलग-अलग छवियों में एक ही फ़ीचर का पता लगाया जाएगा या नहीं फीचर संसूचक के लिए वांछनीय गुण आवृत्ति योग्यता है।
चूंकि फीचर्स का उपयोग बाद के कलन विधि के लिए प्रारंभिक बिंदु और मुख्य पुरातन के रूप में किया जाता है, इसलिए समग्र कलन विधि प्रायः इसके फीचर  संसूचक जितना ही अच्छा होगा। परिणामस्वरूप, एक ही दृश्य के दो या दो से अधिक अलग-अलग इमेज में एक ही फ़ीचर का पता लगाया जाएगा या नहीं, फीचर संसूचक के लिए वांछनीय गुण आवृत्ति योग्यता है।


फ़ीचर अनुसन्धान एक निम्न-स्तरीय इमेज प्रोसेसिंग ऑपरेशन है। जो की, यह सामान्यत: छवि पर पहले ऑपरेशन के रूप में किया जाता है, और यह देखने के लिए प्रत्येक [[पिक्सेल]] की जांच करता है कि उस पिक्सेल में कोई फ़ीचर मौजूद है या नहीं। यदि यह एक बड़े कलन विधि का हिस्सा है, तो कलन विधि सामान्यत केवल फीचर्स के क्षेत्र में छवि की जांच करेगा। फीचर अनुसन्धान के लिए एक अंतर्निहित पूर्व-आवश्यकता के रूप में, इनपुट इमेज को सामान्यत: पर [[स्केल स्पेस]] में [[ गौस्सियन धुंधलापन ]] कर्नेल द्वारा स्मूथ किया जाता है। स्केल-स्पेस प्रतिनिधित्व और एक या कई फीचर इमेज की गणना की जाती है, जिसे प्रायः स्थानीय[[ छवि व्युत्पन्न ]] ऑपरेशंस के संदर्भ में व्यक्त किया जाता है। .
फ़ीचर अनुसन्धान एक निम्न-स्तरीय इमेज प्रोसेसिंग संचालन है। जो की, सामान्यत: इमेज पर पहले संचालन के रूप में किया जाता है, और यह देखने के लिए प्रत्येक [[पिक्सेल]] की जांच करता है कि उस पिक्सेल में कोई फ़ीचर उपस्थिति है या नहीं है। यदि यह बड़े कलन विधि का हिस्सा है, तो कलन विधि सामान्यत: केवल फीचर्स के क्षेत्र में इमेज की जांच करेगा। फीचर अनुसन्धान के लिए एक अंतर्निहित पूर्व-आवश्यकता के रूप में, इनपुट इमेज को सामान्यत: [[स्केल स्पेस]] में [[ गौस्सियन धुंधलापन | गौस्सियन]] कर्नेल द्वारा सुचारू रूप से किया जाता है। स्केल-स्पेस प्रतिनिधित्व और एक या कई फीचर इमेज की गणना की जाती है, जिसे प्रायः लोकल[[ छवि व्युत्पन्न | इमेज व्युत्पन्न]] संचालन के संदर्भ में व्यक्त किया जाता है। .


कभी-कभी, जब फीचर अनुसन्धान [[कम्प्यूटेशनल रूप से महंगा]] होता है और समय की कमी होती है, तो फीचर अनुसन्धान चरण को निर्देशित करने के लिए एक उच्च स्तरीय कलन विधि का उपयोग किया जा सकता है, ताकि छवि के केवल कुछ हिस्सों को फीचर्स के लिए खोजा जा सके।
कभी-कभी, जब फीचर अनुसन्धान [[कम्प्यूटेशनल रूप से महंगा|गणना करने के रूप से महंगा]] होता है और समय की कमी होती है, तो फीचर अनुसन्धान चरण को निर्देशित करने के लिए एक उच्च स्तरीय कलन विधि का उपयोग किया जा सकता है, जिससे इमेज के केवल कुछ अंश को फीचर्स के लिए खोजा जा सके।


कई कंप्यूटर विज़न कलन विधि हैं जो प्रारंभिक चरण के रूप में फीचर अनुसन्धान का उपयोग करते हैं, इसलिए इसके परिणामस्वरूप, बहुत बड़ी संख्या में फीचर  संसूचक विकसित किए गए हैं। ये पता लगाए गए फीचर, कम्प्यूटेशनल जटिलता और दोहराने योग्यता के प्रकार में व्यापक रूप से भिन्न होते हैं।
कई कंप्यूटर विज़न कलन विधि हैं जो प्रारंभिक चरण के रूप में फीचर अनुसन्धान का उपयोग करते हैं, इसलिए इसके परिणामस्वरूप, बहुत बड़ी संख्या में फीचर  संसूचक विकसित किए गए हैं। ये फीचर, कम्प्यूटेशनल जटिलता और दोहराने योग्यता के प्रकार में व्यापक रूप से भिन्न होते हैं।


जब फीचर्स को एक छवि पर प्रयुक्त स्थानीय प्रतिवेश के संचालन के संदर्भ में परिभाषित किया जाता है, तो एक प्रक्रिया जिसे सामान्यत: पर 'फीचर एक्सट्रैक्शन' कहा जाता है, कोई भी फीचर अनुसन्धान दृष्टिकोणों के बीच अंतर कर सकता है जो स्थानीय निर्णय लेते हैं कि क्या किसी दिए गए चित्र में किसी दिए गए प्रकार की फ़ीचर है या नहीं। बिंदु या नहीं, और जो परिणाम के रूप में गैर-बाइनरी डेटा उत्पन्न करते हैं। भेद तब प्रासंगिक हो जाता है जब परिणामी खोजी गई फीचर्स अपेक्षाकृत विरल होती हैं। हालांकि स्थानीय निर्णय किए जाते हैं, फीचर अनुसन्धान स्टेप से आउटपुट को बाइनरी इमेज होने की आवश्यकता नहीं है। परिणाम प्रायः उन छवि बिंदुओं के सेट (जुड़े या असंबद्ध) निर्देशांक के संदर्भ में प्रस्तुत किया जाता है जहां फीचर्स का पता लगाया गया है, कभी-कभी उप-पिक्सेल सटीकता के साथ।
जब फीचर्स को इमेज पर प्रयुक्त लोकल प्रतिवेश के संचालन के संदर्भ में परिभाषित किया जाता है, तो एक प्रक्रिया जिसे सामान्यत: '''<nowiki/>'फीचर निष्कर्षण'''' कहा जाता है, कोई भी फीचर अनुसन्धान विज़नकोणों के बीच अंतर कर सकता है जो लोकल परिणाम उत्पन्न करता है कि किसी दिए गए इमेज बिंदु पर किसी दिए गए प्रकार की विशेषता है या नहीं, और जो परिणाम के रूप में अन्य-बाइनरी डेटा उत्पन्न करते हैं। विशिष्टता तब सुसंगत हो जाता है जब परिणाम खोजी गई फीचर्स अपेक्षाकृत विरल होती हैं। यद्यपि लोकल परिणाम किए जाते हैं, फीचर अनुसन्धान स्टेप से आउटपुट को बाइनरी इमेज होने की आवश्यकता नहीं है।कभी-कभी उप-पिक्सेल सटीकता के साथ, परिणाम प्रायः उन इमेज बिंदुओं के सेट (जुड़े या असंबद्ध) निर्देशांक के संदर्भ में प्रस्तुत किया जाता है जहां फीचर्स का पता लगाया गया है।


जब स्थानीय निर्णय लेने के बिना फीचर एक्सट्रैक्शन किया जाता है, तो परिणाम को प्रायः फीचर इमेज के रूप में संदर्भित किया जाता है। परिणामस्वरूप, एक फीचर छवि को छवि के रूप में देखा जा सकता है कि यह मूल छवि के समान स्थानिक (या लौकिक) चर का एक कार्य है, लेकिन जहां पिक्सेल मान तीव्रता या रंग के स्थान पर छवि फीचर्स के विषय में जानकारी रखते हैं। इसका तात्पर्य यह है कि एक फीचर इमेज को उसी तरह से प्रोसेस किया जा सकता है जैसे इमेज सेंसर द्वारा उत्पन्न एक साधारण इमेज। फीचर छवियों को प्रायः फीचर अनुसन्धान के लिए कलन विधि में एकीकृत कदम के रूप में गिना जाता है।
जब लोकल परिणाम लेने के बिना फीचर निष्कर्षण किया जाता है, तो परिणाम को प्रायः फीचर इमेज के रूप में संदर्भित किया जाता है। परिणामस्वरूप, एक फीचर इमेज को इमेज के रूप में देखा जा सकता है कि यह मूल इमेज के समान स्थानिक (या लौकिक) चर वस्तु का एक कार्य है, लेकिन जहां पिक्सेल मान तीव्रता या रंग के स्थान पर इमेज फीचर्स के विषय में जानकारी रखते हैं। इसका तात्पर्य यह है कि एक फीचर इमेज को उसी तरह से प्रक्रिया किया जा सकता है जैसे इमेज सेंसर द्वारा उत्पन्न एक साधारण इमेज हो। फीचर इमेज को प्रायः फीचर अनुसन्धान के लिए कलन विधि में एकीकृत कदम के रूप में गिना जाता है।


===फीचर वैक्टर और फीचर स्पेस ===
===फीचर वैक्टर और फीचर स्पेस(स्थान) ===
कुछ अनुप्रयोगों में, छवि डेटा से संबंधित जानकारी प्राप्त करने के लिए केवल एक प्रकार की फ़ीचर निकालना पर्याप्त नहीं है। इसके स्थान पर दो या दो से अधिक अलग-अलग फीचर्स को निकाला जाता है, जिसके परिणामस्वरूप प्रत्येक छवि बिंदु पर दो या दो से अधिक फीचर डिस्क्रिप्टर होते हैं। एक सामान्य अभ्यास इन सभी विवरणों द्वारा प्रदान की गई जानकारी को एकल वेक्टर के तत्वों के रूप में व्यवस्थित करना है, जिसे सामान्यत: फीचर वेक्टर के रूप में संदर्भित किया जाता है। सभी संभावित फीचर वैक्टर का सेट एक फीचर स्पेस बनाता है।<ref name="Umbaugh2005">{{cite book|author=Scott E Umbaugh|title=Computer Imaging: Digital Image Analysis and Processing|url=https://books.google.com/books?id=JNhRSAMFn6YC&q=%22feature+space%22|date=27 January 2005|publisher=CRC Press|isbn=978-0-8493-2919-7}}</ref>
कुछ अनुप्रयोगों में, इमेज डेटा से संबंधित जानकारी प्राप्त करने के लिए केवल एक प्रकार का फ़ीचर निकालना उपयुक्त नहीं है। इसके स्थान पर दो या दो से अधिक अलग-अलग फीचर्स को निकाला जाता है, जिसके परिणामस्वरूप प्रत्येक इमेज बिंदु पर दो या दो से अधिक फीचर वर्णनकर्ता होते हैं। एक सामान्य अभ्यास इन सभी विवरणों द्वारा प्रदान की गई जानकारी को एकल वेक्टर के तत्वों के रूप में व्यवस्थित करना है, जिसे सामान्यत: '''फीचर वेक्टर''' के रूप में संदर्भित किया जाता है। सभी संभावित फीचर वैक्टर का सेट एक '''फीचर स्पेस''' बनाता है।<ref name="Umbaugh2005">{{cite book|author=Scott E Umbaugh|title=Computer Imaging: Digital Image Analysis and Processing|url=https://books.google.com/books?id=JNhRSAMFn6YC&q=%22feature+space%22|date=27 January 2005|publisher=CRC Press|isbn=978-0-8493-2919-7}}</ref>


फीचर वैक्टर का एक सामान्य उदाहरण तब प्रकट होता है जब प्रत्येक छवि बिंदु को एक विशिष्ट वर्ग से संबंधित के रूप में वर्गीकृत किया जाता है। यह मानते हुए कि प्रत्येक छवि बिंदु में फीचर्स के उपयुक्त सेट के आधार पर एक संबंधित फीचर वेक्टर होता है, जिसका अर्थ है कि प्रत्येक वर्ग को संबंधित फीचर स्पेस में अच्छी तरह से अलग किया जाता है, मानक वर्गीकरण पद्धति का उपयोग करके प्रत्येक छवि बिंदु का वर्गीकरण किया जा सकता है।।
फीचर वैक्टर का एक सामान्य उदाहरण तब प्रकट होता है जब प्रत्येक इमेज बिंदु को एक विशिष्ट वर्ग से संबंधित के रूप में वर्गीकृत किया जाता है। यह मानते हुए कि प्रत्येक इमेज बिंदु में फीचर्स के उपयुक्त सेट के आधार पर एक संबंधित फीचर वेक्टर होता है, जिसका अर्थ है कि प्रत्येक वर्ग को संबंधित फीचर स्पेस में अच्छी तरह से अलग किया जाता है, मानक वर्गीकरण पद्धति का उपयोग करके प्रत्येक इमेज बिंदु का वर्गीकरण किया जा सकता है।।


एक अन्य और संबंधित उदाहरण तब होता है जब [[कृत्रिम तंत्रिका नेटवर्क]]-आधारित प्रसंस्करण छवियों पर प्रयुक्त होता है। तंत्रिका नेटवर्क को सिंचित इनपुट डेटा प्रायः प्रत्येक छवि बिंदु से फीचर वेक्टर के रूप में दिया जाता है, जहां वेक्टर छवि डेटा से निकाले गए कई अलग-अलग फीचर्स से बना होता है। सीखने के चरण के दौरान, नेटवर्क स्वयं यह पता लगा सकता है कि समस्या को हल करने के लिए विभिन्न फीचर्स का कौन सा संयोजन उपयोगी है।
एक अन्य और संबंधित उदाहरण तब होता है जब [[कृत्रिम तंत्रिका नेटवर्क|त्तंत्रिका नेटवर्क]]-आधारित प्रसंस्करण इमेज पर प्रयुक्त होता है। तंत्रिका नेटवर्क को सिंचित इनपुट डेटा प्रायः प्रत्येक इमेज बिंदु से फीचर वेक्टर के रूप में दिया जाता है, जहां वेक्टर इमेज डेटा से निकाले गए कई अलग-अलग फीचर्स से बना होता है। सीखने के चरण के दौरान, नेटवर्क स्वयं यह पता लगा सकता है कि समस्या को हल करने के लिए विभिन्न फीचर्स का कौन सा संयोजन उपयोगी है।


== प्रकार ==
== प्रकार ==


=== किनारों ===
=== सिरा ===


किनारे वे बिंदु होते हैं जहां दो छवि क्षेत्रों के बीच एक सीमा (या एक किनारा) होती है। सामान्य तौर पर, एक किनारा लगभग मनमाना आकार का हो सकता है, और इसमें जंक्शन सम्मिलित हो सकते हैं। व्यवहार में, किनारों को सामान्यत: पर छवि में बिंदुओं के सेट के रूप में परिभाषित किया जाता है, जिसमें एक मजबूत ढाल परिमाण होता है। इसके अलावा, कुछ सामान्य कलन विधि फिर एक किनारे का अधिक पूर्ण विवरण बनाने के लिए एक साथ उच्च ढाल वाले बिंदुओं को श्रृंखलाबद्ध करेंगे। ये कलन विधि सामान्यतः पर किनारे के गुणों पर कुछ बाधाएं डालते हैं, जैसे कि आकार, चिकनाई और ढाल मूल्य।
सिरा वे बिंदु होते हैं जहां दो इमेज क्षेत्रों के बीच सीमा (या सिरा) होती है। सामान्यतः सिरा लगभग एकपक्षीय आकार का हो सकता है, और इसमें संयोजन सम्मिलित हो सकते हैं। व्यवहारतः, सिरा को सामान्यत: इमेज में बिंदुओं के सेट के रूप में परिभाषित किया जाता है, जिसमें एक सशक्त ढाल परिमाण होता है। इसके अलावा, कुछ सामान्य कलन विधि फिर सिरा का अधिक पूर्ण विवरण बनाने के लिए एक साथ उच्च ढाल वाले बिंदुओं को श्रृंखलाबद्ध करेंगे। ये कलन विधि सामान्यतः सिरा के गुणों पर कुछ बाधाएं डालते हैं, जैसे कि आकार, चिकनाई और ढाल मूल्य है।


स्थानीय रूप से, किनारों में एक आयामी संरचना होती है।
लोकल रूप से, सिरा में एक आयामी संरचना होती है।


=== कोने / ब्याज अंक ===
=== कोने / सुविधा अंक ===


शब्दों के कोनों और ब्याज बिंदुओं का उपयोग कुछ हद तक परस्पर विनिमय के लिए किया जाता है और एक छवि में बिंदु जैसी फीचर्स को संदर्भित करता है, जिसमें एक स्थानीय दो आयामी संरचना होती है। कॉर्नर नाम की उत्पत्ति तब से हुई जब शुरुआती कलन विधि ने पहले [[ किनारे का पता लगाना ]] किया, और फिर दिशा (कोनों) में तेजी से बदलाव खोजने के लिए किनारों का विश्लेषण किया। इन कलन विधि को तब विकसित किया गया था ताकि स्पष्ट किनारे का पता लगाने की आवश्यकता न हो, उदाहरण के लिए [[छवि ढाल]] में [[वक्रता]] के उच्च स्तर की तलाश करके। तब यह देखा गया कि छवि के उन हिस्सों पर तथाकथित कोनों का भी पता लगाया जा रहा था जो पारंपरिक अर्थों में कोने नहीं थे (उदाहरण के लिए एक गहरे रंग की पृष्ठभूमि पर एक छोटा उज्ज्वल स्थान पाया जा सकता है)। इन बिंदुओं को प्रायः रुचि बिंदुओं के रूप में जाना जाता है, लेकिन शब्द का कोना परंपरा द्वारा उपयोग किया जाता है{{citation needed|date=May 2020}}.
शब्दों के कोनों और सुविधा बिंदुओं का उपयोग कुछ सीमा तक परस्पर विनिमय के लिए किया जाता है और एक इमेज में बिंदु जैसी फीचर्स को संदर्भित करता है, जिसमें एक लोकल दो आयामी संरचना होती है। "कॉर्नर" नाम की उत्पत्ति तब से हुई जब प्रारंभिक कलन विधि ने पहले [[ किनारे का पता लगाना |सिरा का पता लगाया]] , और फिर दिशा (कोनों) में तेजी से बदलाव अन्वेषण के लिए सिरा का विश्लेषण किया। इन कलन विधि को तब विकसित किया गया था ताकि स्पष्ट   सिरा का पता लगाने की आवश्यकता न हो, उदाहरण के लिए [[छवि ढाल|इमेज ढाल]] में [[वक्रता]] के उच्च स्तर की अनुसंधान करके। तब यह देखा गया कि इमेज के उन अंश पर तथाकथित कोनों का भी पता लगाया जा रहा था जो पारंपरिक अर्थों में कोने नहीं थे (उदाहरण के लिए एक गहरे रंग की पृष्ठभूमि पर एक छोटा उज्ज्वल स्थान पाया जा सकता है)। इन बिंदुओं को प्रायः रुचि बिंदुओं के रूप में जाना जाता है, लेकिन शब्द का कोना परंपरा द्वारा उपयोग किया जाता है{{citation needed|date=May 2020}}.


=== बूँदें / ब्याज बिंदुओं के क्षेत्र ===
=== बिंदु / सुविधा बिंदुओं के क्षेत्र ===


ब्लॉब्स क्षेत्रों के संदर्भ में छवि संरचनाओं का एक पूरक विवरण प्रदान करते हैं, जो कोनों के विपरीत अधिक बिंदु-समान होते हैं। फिर भी, ब्लॉब डिस्क्रिप्टर में प्रायः एक पसंदीदा बिंदु (ऑपरेटर प्रतिक्रिया का एक स्थानीय अधिकतम या गुरुत्वाकर्षण का केंद्र) हो सकता है, जिसका अर्थ है कि कई ब्लॉब  संसूचकों को रुचि बिंदु ऑपरेटर के रूप में भी माना जा सकता है। बूँद  संसूचक एक छवि में उन क्षेत्रों का पता लगा सकते हैं जो एक कोने वाले संसूचक द्वारा पहचाने जाने के लिए बहुत चिकने हैं।
बिंदुें क्षेत्रों के संदर्भ में इमेज संरचनाओं का एक पूरक विवरण प्रदान करते हैं, जो कोनों के विपरीत अधिक बिंदु-समान होते हैं। फिर भी, बिंदुें वर्णनकर्ता में प्रायः एक रुचिकर बिंदु (संक्रियक प्रतिक्रिया का एक लोकल अधिकतम या गुरुत्वाकर्षण का केंद्र) हो सकता है, जिसका अर्थ है कि कई बिंदुें संसूचकों को रुचि बिंदु संक्रियक के रूप में भी माना जा सकता है। बिंदु संसूचक एक इमेज में उन क्षेत्रों का पता लगा सकते हैं जो एक कोने वाले संसूचक द्वारा पहचाने जाने के लिए बहुत चिकने हैं।


एक छवि को सिकोड़ने और फिर कोने का पता लगाने पर विचार करें। संसूचक उन बिंदुओं पर प्रतिक्रिया देगा जो सिकुड़ी हुई छवि में तेज हैं, लेकिन मूल छवि में चिकने हो सकते हैं। यह इस बिंदु पर है कि कोने  संसूचक और बूँद संसूचक के बीच का अंतर कुछ अस्पष्ट हो जाता है। काफी हद तक, पैमाने की उपयुक्त धारणा को सम्मिलित करके इस अंतर को दूर किया जा सकता है। फिर भी, विभिन्न पैमानों पर विभिन्न प्रकार की छवि संरचनाओं के लिए उनकी प्रतिक्रिया गुणों के कारण, [[ कोने का पता लगाना ]] पर लेख में LoG और DoH [[ बूँद का पता लगाना ]] का भी उल्लेख किया गया है।
एक इमेज को सिकोड़ने और फिर कोने का पता लगाने पर विचार करें। संसूचक उन बिंदुओं पर प्रतिक्रिया देगा जो सिकुड़ी हुई इमेज में तेज हैं, लेकिन मूल इमेज में चिकने हो सकते हैं। यह इस बिंदु पर है कि कोने  संसूचक और बिंदु संसूचक के बीच का अंतर कुछ अस्पष्ट हो जाता है। काफी सीमा तक, पैमाने की उपयुक्त धारणा को सम्मिलित करके इस अंतर को दूर किया जा सकता है। फिर भी, विभिन्न पैमानों पर विभिन्न प्रकार की इमेज संरचनाओं के लिए उनकी प्रतिक्रिया गुणों के कारण,[[ कोने का पता लगाना ]]लेख में LoG और DoH [[ बूँद का पता लगाना | बिंदु का पता लगाना]] का भी उल्लेख किया गया है।


=== लकीरें ===
=== लकीरें ===


लम्बी वस्तुओं के लिए, लकीरों की धारणा एक प्राकृतिक उपकरण है। एक ग्रे-लेवल छवि से गणना की गई एक रिज डिस्क्रिप्टर को औसत दर्जे की धुरी के सामान्यीकरण के रूप में देखा जा सकता है। एक व्यावहारिक दृष्टिकोण से, एक रिज को एक आयामी वक्र के रूप में माना जा सकता है जो समरूपता के अक्ष का प्रतिनिधित्व करता है, और इसके अतिरिक्त प्रत्येक रिज बिंदु से जुड़े स्थानीय रिज की चौड़ाई का एक गुण है। दुर्भाग्य से, हालांकि, किनारा-, कॉर्नर- या ब्लॉब फीचर्स की तुलना में ग्रे-लेवल इमेज के सामान्य वर्गों से रिज फीचर्स को निकालना कलन विधििक रूप से कठिन है। फिर भी, रिज डिस्क्रिप्टर का उपयोग प्रायः हवाई छवियों में सड़क निष्कर्षण और चिकित्सा छवियों में रक्त वाहिकाओं को निकालने के लिए किया जाता है - [[ रिज का पता लगाना ]] देखें।
लम्बी वस्तुओं के लिए, लकीरों की धारणा एक प्राकृतिक उपकरण है। ग्रे-स्तर इमेज से गणना की गई लकीरें वर्णनकर्ता को औसत स्तर की धुरी के सामान्यीकरण के रूप में देखा जा सकता है। एक व्यावहारिक विज़नकोण से, लकीरें को एक आयामी वक्र के रूप में माना जा सकता है जो समरूपता के अक्ष का प्रतिनिधित्व करता है, और इसके अतिरिक्त प्रत्येक लकीरें बिंदु से जुड़े लोकल लकीरें की चौड़ाई का एक गुण है। दुर्भाग्य से, तथापि, सिरा-, कॉर्नर- या बिंदुें फीचर्स की तुलना में ग्रे-स्तर इमेज के सामान्य वर्गों से लकीरें फीचर्स को निकालना कलन विधििक रूप से कठिन है। फिर भी, लकीरें वर्णनकर्ता का उपयोग प्रायः कल्पित इमेज में सरणी निष्कर्षण और चिकित्सा इमेज में रक्त वाहिकाओं को निकालने के लिए किया जाता है - [[ रिज का पता लगाना | लकीरें का पता लगाना]] देखें।


== पता लगाना {{anchor|Detectors}} ==
== पता लगाना {{anchor|Detectors}} ==
[[File:Writing Desk with Harris Detector.png|thumb]]फ़ीचर अनुसन्धान में छवि जानकारी के सार की गणना करने और प्रत्येक छवि बिंदु पर स्थानीय निर्णय लेने के तरीके सम्मिलित हैं, चाहे उस बिंदु पर किसी दिए गए प्रकार की छवि फ़ीचर हो या नहीं। परिणामी फीचर्स छवि डोमेन के सबसेट होंगे, प्रायः अलग-अलग बिंदुओं, निरंतर घटता या जुड़े क्षेत्रों के रूप में।
[[File:Writing Desk with Harris Detector.png|thumb]]फ़ीचर अनुसन्धान में इमेज जानकारी के सार की गणना करने और प्रत्येक इमेज बिंदु पर लोकल परिणाम लेने के विधि सम्मिलित हैं, चाहे उस बिंदु पर किसी दिए गए प्रकार की इमेज फ़ीचर हो या नहीं। परिणामी फीचर्स इमेज डोमेन के सबसेट होंगे, प्रायः अलग-अलग बिंदुओं, निरंतर घटता या जुड़े क्षेत्रों के रूप में।
 
फीचर्स का निष्कर्षण कभी-कभी कई स्केलिंग पर किया जाता है। इनमें से एक तरीका [[स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म|स्केल अपरिवर्तनीय फीचर परिवर्तन(scale invariant feature]]


फीचर्स का निष्कर्षण कभी-कभी कई स्केलिंग पर किया जाता है। इनमें से एक तरीका [[स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म]] (SIFT) है।
[[स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म|transform)]](SIFT) है।
{{Further|topic=Combination Of Shifted FIlter REsponses|COSFIRE}}
{{Further|topic=Combination Of Shifted FIlter REsponses|COSFIRE}}


{| class="wikitable"
{| class="wikitable"
|+ Common feature detectors and their classification:
|+ सामान्य फ़ीचर संसूचक और उनका वर्गीकरण:
!Feature detector!![[Edge detection|Edge]]!![[Corner detection|Corner]]!![[Blob detection|Blob]]!![[Ridge detection|Ridge]]
!Feature detector!![[Edge detection|Edge]]!![[Corner detection|Corner]]!![[Blob detection|Blob]]!![[Ridge detection|Ridge]]
|-
|-
Line 231: Line 230:


== निष्कर्षण ==
== निष्कर्षण ==
{{broader|Feature extraction (machine learning)}}
एक बार फीचर्स का पता चलने के बाद, फ़ीचर के आसपास एक लोकल इमेज खंड निकाला जा सकता है। इस निष्कर्षण में काफी मात्रा में इमेज प्रोसेसिंग सम्मिलित हो सकती है। परिणाम को फीचर वर्णनकर्ता या फीचर वेक्टर के रूप में जाना जाता है। वर्णन करने के लिए उपयोग किए जाने वाले विज़नकोणों में, एन-जेट और लोकल हिस्टोग्राम का उल्लेख किया जा सकता है (लोकल हिस्टोग्राम वर्णनकर्ता के एक उदाहरण के लिए स्केल-इनवेरिएंट फीचर ट्रांसफ़ॉर्म देखें)। इस तरह की फ़ीचर जानकारी के अलावा, फीचर अनुसन्धान उपाय अपने आप में पूरक फ़ीचर भी प्रदान कर सकता है, जैसे कि सिरा अभिविन्यास और सिरा अनुसन्धान में प्रवणता परिमाण और बिंदु का पता लगाने में ध्रुवीयता और बिंदु की ताकत है।
 
एक बार फीचर्स का पता चलने के बाद, फ़ीचर के आसपास एक स्थानीय छवि पैच निकाला जा सकता है। इस निष्कर्षण में काफी मात्रा में इमेज प्रोसेसिंग सम्मिलित हो सकती है। परिणाम को फीचर डिस्क्रिप्टर या फीचर वेक्टर के रूप में जाना जाता है। वर्णन करने के लिए उपयोग किए जाने वाले दृष्टिकोणों में, एन-जेट | एन-जेट और स्थानीय हिस्टोग्राम का उल्लेख किया जा सकता है (स्थानीय हिस्टोग्राम डिस्क्रिप्टर के एक उदाहरण के लिए स्केल-इनवेरिएंट फीचर ट्रांसफ़ॉर्म देखें)। इस तरह की फ़ीचर जानकारी के अलावा, फीचर अनुसन्धान स्टेप अपने आप में पूरक फ़ीचरएँ भी प्रदान कर सकता है, जैसे कि किनारा अभिविन्यास और किनारा अनुसन्धान में ग्रेडिएंट परिमाण और ब्लॉब अनुसन्धान में पोलरिटी और ब्लॉब की ताकत।


===निम्न स्तर===
===निम्न स्तर===
* किनारे का पता लगाना
* सिरा का पता लगाना
* कोने का पता लगाना
* कोने का पता लगाना
* बूँद का पता लगाना
* बिंदु का पता लगाना
* रिज का पता लगाना
* लकीरें का पता लगाना
* स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म
* स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म


Line 245: Line 242:
* बढ़त की दिशा, बदलती तीव्रता, स्वतः संबंध।
* बढ़त की दिशा, बदलती तीव्रता, स्वतः संबंध।


==== छवि गति ====
==== इमेज गति ====
*[[गति का पता लगाना]]। क्षेत्र आधारित, अंतर दृष्टिकोण। [[ऑप्टिकल प्रवाह]]।
*[[गति का पता लगाना]]। क्षेत्र आधारित,अंतर विज़नकोण। [[ऑप्टिकल प्रवाह|प्रकाशीय प्रवाह]]।


=== आकार आधारित ===
=== आकार आधारित ===


* थ्रेसहोल्डिंग (इमेज प्रोसेसिंग)
* थ्रेसहोल्डिंग (इमेज प्रसंस्करण)
* [[बूँद निष्कर्षण]]
* [[बूँद निष्कर्षण|बिंदु निष्कर्षण]]
* [[टेम्पलेट मिलान]]
* [[टेम्पलेट मिलान|आकार पट्ट मिलान]]
* [[हफ़ ट्रांसफॉर्म]]
* [[हफ़ ट्रांसफॉर्म|हफ़ परिवर्तन]]
** पंक्तियाँ
** पंक्तियाँ
** वृत्त/दीर्घवृत्त
** वृत्त/दीर्घवृत्त
** मनमाना आकार (सामान्यीकृत हफ़ ट्रांसफ़ॉर्म)
** एकपक्षीय आकार (सामान्यीकृत हफ़ ट्रांसफ़ॉर्म)
** किसी भी पैरामीटर योग्य फ़ीचर के साथ काम करता है (वर्ग चर, क्लस्टर पहचान, आदि ..)
** किसी भी पैरामीटर योग्य फ़ीचर के साथ काम करता है (वर्ग चर, क्लस्टर पहचान, आदि ..)
* [[सामान्यीकृत हफ़ परिवर्तन]]
* [[सामान्यीकृत हफ़ परिवर्तन]]


=== लचीले तरीके ===
=== लचीले विधि ===
* विकृत, परिचालित आकार
* विकृत, परिचालित आकार
* सक्रिय आकृति (साँप)
* सक्रिय आकृति (साँप)
Line 267: Line 264:
{{main|Visual descriptor}}
{{main|Visual descriptor}}


छवि डेटा में एक विशिष्ट संरचना के संदर्भ में परिभाषित एक विशिष्ट छवि फ़ीचर को प्रायः विभिन्न तरीकों से प्रदर्शित किया जा सकता है। उदाहरण के लिए, एक किनारे को प्रत्येक छवि बिंदु में एक [[बूलियन चर]] के रूप में दर्शाया जा सकता है जो बताता है कि उस बिंदु पर एक किनारा मौजूद है या नहीं। वैकल्पिक रूप से, हम इसके स्थान पर एक प्रतिनिधित्व का उपयोग कर सकते हैं जो किनारे के अस्तित्व के बूलियन बयान के स्थान पर मापन अनिश्चितता प्रदान करता है और इसे किनारे के [[अभिविन्यास (ज्यामिति)]] के विषय में जानकारी के साथ जोड़ देता है। इसी तरह, एक विशिष्ट क्षेत्र का रंग या तो औसत रंग (तीन स्केलर) या [[रंग हिस्टोग्राम]] (तीन कार्यों) के संदर्भ में प्रदर्शित किया जा सकता है।
इमेज डेटा में एक विशिष्ट संरचना के संदर्भ में परिभाषित एक विशिष्ट इमेज फ़ीचर को प्रायः विभिन्न तरीकों से प्रदर्शित किया जा सकता है। उदाहरण के लिए, एक   सिरा को प्रत्येक इमेज बिंदु में एक [[बूलियन चर]] के रूप में दर्शाया जा सकता है जो बताता है कि उस बिंदु पर एक   सिरा उपस्थिति है या नहीं। वैकल्पिक रूप से, हम इसके स्थान पर एक प्रतिनिधित्व का उपयोग कर सकते हैं जो   सिरा के अस्तित्व के बूलियन बयान के स्थान पर मापन अनिश्चितता प्रदान करता है और इसे सिरा के [[अभिविन्यास (ज्यामिति)]] के विषय में जानकारी के साथ जोड़ देता है। इसी तरह, एक विशिष्ट क्षेत्र का रंग या तो औसत रंग (तीन स्केलर) या [[रंग हिस्टोग्राम]] (तीन कार्यों) के संदर्भ में प्रदर्शित किया जा सकता है।


जब एक कंप्यूटर विज़न सिस्टम या कंप्यूटर विज़न एल्गोरिथम डिज़ाइन किया जाता है तो फीचर प्रतिनिधित्व का विकल्प एक महत्वपूर्ण मुद्दा हो सकता है। कुछ मामलों में, समस्या को हल करने के लिए किसी फ़ीचर के विवरण में उच्च स्तर का विवरण आवश्यक हो सकता है, लेकिन यह अधिक डेटा और अधिक मांग वाले प्रसंस्करण से निपटने की कीमत पर आता है। नीचे, उपयुक्त प्रतिनिधित्व को चुनने के लिए प्रासंगिक कारकों में से कुछ पर चर्चा की गई है। इस चर्चा में, एक फीचर प्रतिनिधित्व के एक उदाहरण को कहा जाता है{{visible anchor|feature descriptor}}, या बस वर्णनकर्ता।
जब एक कंप्यूटर विज़न सिस्टम या कंप्यूटर विज़न एल्गोरिथम डिज़ाइन किया जाता है तो फीचर प्रतिनिधित्व का विकल्प एक महत्वपूर्ण मुद्दा हो सकता है। कुछ मामलों में, समस्या को हल करने के लिए किसी फ़ीचर के विवरण में उच्च स्तर का विवरण आवश्यक हो सकता है, लेकिन यह अधिक डेटा और अधिक मांग वाले प्रसंस्करण से निपटने की लागत पर आता है। नीचे, उपयुक्त प्रतिनिधित्व को चुनने के लिए प्रासंगिक कारकों में से कुछ पर चर्चा की गई है। इस चर्चा में, एक फीचर प्रतिनिधित्व के एक उदाहरण को {{visible anchor|फ़ीचर वर्णनकर्ता}} या केवल वर्णनकर्ता कहा जाता है।


=== [[निश्चितता]] या विश्वास ===
=== [[निश्चितता]] या विश्वास ===
छवि फीचर्स के दो उदाहरण एक छवि अनुक्रम में स्थानीय बढ़त अभिविन्यास और स्थानीय वेग हैं। अभिविन्यास के मामले में, इस फ़ीचर का मान अधिक या कम अपरिभाषित हो सकता है यदि संबंधित प्रतिवेश में एक से अधिक किनारे मौजूद हों। स्थानीय वेग अपरिभाषित है यदि संबंधित छवि क्षेत्र में कोई स्थानिक भिन्नता नहीं है। इस अवलोकन के परिणामस्वरूप, फीचर प्रतिनिधित्व का उपयोग करना प्रासंगिक हो सकता है जिसमें फीचर वैल्यू के विषय में बयान से संबंधित निश्चितता या विश्वास का एक उपाय सम्मिलित है। अन्यथा, यह एक विशिष्ट स्थिति है कि एक ही विवरणक का उपयोग इस वर्णनकर्ता की व्याख्या में परिणामी अस्पष्टता के साथ, कम निश्चितता के फीचर मूल्यों और शून्य के निकट फ़ीचर मूल्यों का प्रतिनिधित्व करने के लिए किया जाता है। आवेदन के आधार पर, ऐसी अस्पष्टता स्वीकार्य हो भी सकती है और नहीं भी हो सकती है।
इमेज फीचर्स के दो उदाहरण इमेज अनुक्रम में लोकल बढ़त अभिविन्यास और लोकल वेग हैं। अभिविन्यास के विषय में, इस फ़ीचर का मान अधिक या कम अपरिभाषित हो सकता है यदि संबंधित प्रतिवेश में एक से अधिक   सिरा उपस्थिति हों। लोकल वेग अपरिभाषित है यदि संबंधित इमेज क्षेत्र में कोई स्थानिक भिन्नता नहीं है। इस अवलोकन के परिणामस्वरूप, फीचर प्रतिनिधित्व का उपयोग करना प्रासंगिक हो सकता है जिसमें फीचर महत्व के विषय में विवरण से संबंधित निश्चितता या विश्वास का एक उपाय सम्मिलित है। अन्यथा, यह एक विशिष्ट स्थिति है कि एक ही विवरणक का उपयोग इस वर्णनकर्ता की व्याख्या में परिणामी अस्पष्टता के साथ, कम निश्चितता के फीचर मूल्यों और शून्य के निकट फ़ीचर मूल्यों का प्रतिनिधित्व करने के लिए किया जाता है। आवेदन के आधार पर, ऐसी अस्पष्टता स्वीकार्य हो भी सकती है और नहीं भी हो सकती है।


विशेष रूप से, यदि एक चित्रित छवि का उपयोग बाद के प्रसंस्करण में किया जाएगा, तो निश्चितता या विश्वास के विषय में जानकारी सम्मिलित करने वाले फीचर प्रतिनिधित्व को नियोजित करना एक अच्छा विचार हो सकता है। यह एक नए फीचर डिस्क्रिप्टर को कई डिस्क्रिप्टर से गणना करने में सक्षम बनाता है, उदाहरण के लिए एक ही छवि बिंदु पर गणना की जाती है, लेकिन अलग-अलग पैमानों पर, या अलग-अलग लेकिन प्रतिवेशी बिंदुओं से, भारित औसत के संदर्भ में जहां वजन संबंधित निश्चितताओं से प्राप्त होता है। सरलतम मामले में, संबंधित संगणना को चित्रित छवि के निम्न-पास फ़िल्टरिंग के रूप में प्रयुक्त किया जा सकता है। परिणामी फीचर छवि, सामान्य रूप से, शोर के प्रति अधिक स्थिर होगी।
विशेष रूप से, यदि एक चित्रित इमेज का उपयोग बाद के प्रसंस्करण में किया जाएगा, तो निश्चितता या विश्वास के विषय में जानकारी सम्मिलित करने वाले फीचर प्रतिनिधित्व को नियोजित करना एक अच्छा विचार हो सकता है। यह एक नए फीचर वर्णनकर्ता को कई वर्णनकर्ता से गणना करने में सक्षम बनाता है, उदाहरण के लिए एक ही इमेज बिंदु पर गणना की जाती है, लेकिन अलग-अलग पैमानों पर, या अलग-अलग लेकिन प्रतिवेशी बिंदुओं से, भारित औसत के संदर्भ में जहां वजन संबंधित निश्चितताओं से प्राप्त होता है। सरलतम विषय में, संबंधित संगणना को चित्रित इमेज के निम्न-पास फ़िल्टरिंग के रूप में प्रयुक्त किया जा सकता है। परिणामी फीचर इमेज, सामान्य रूप से, ध्वनि के प्रति अधिक स्थिर होगी।


=== [[औसत]]ता ===
=== [[औसत]]ता ===
निरूपण में सम्मिलित निश्चित उपायों के अलावा, संबंधित फीचर मानों का निरूपण स्वयं एक औसत संचालन के लिए उपयुक्त हो सकता है या नहीं। अधिकांश फीचर प्रस्तुतियों को व्यवहार में औसत किया जा सकता है, लेकिन केवल कुछ मामलों में परिणामी विवरणक को फीचर मान के संदर्भ में सही व्याख्या दी जा सकती है। ऐसे अभ्यावेदन को औसत कहा जाता है।
निरूपण में सम्मिलित निश्चित उपायों के अलावा, संबंधित फीचर मानों का निरूपण स्वयं एक औसत संचालन के लिए उपयुक्त हो सकता है या नहीं। अधिकांश फीचर प्रस्तुतियों को व्यवहार में औसत किया जा सकता है, लेकिन केवल कुछ मामलों में परिणामी विवरण को फीचर मान के संदर्भ में सही व्याख्या दी जा सकती है। ऐसे अभ्यावेदन को औसत कहा जाता है।


उदाहरण के लिए, यदि किसी किनारे के अभिविन्यास को कोण के संदर्भ में दर्शाया गया है, तो इस प्रतिनिधित्व में एक अनुरक्ति होना चाहिए जहां कोण अपने अधिकतम मान से न्यूनतम मान तक आच्छादित है। परिणामस्वरूप, ऐसा हो सकता है कि दो समान अभिविन्यास कोणों द्वारा दर्शाए जाते हैं जिनका तात्पर्य है जो मूल कोणों में से किसी के निकट नहीं है और इसलिए, यह प्रतिनिधित्व औसत नहीं है। किनारा अभिविन्यास के अन्य प्रतिनिधित्व जैसे संरचना टेन्सर हैं, जो औसत हैं।
उदाहरण के लिए, यदि किसी   सिरा के अभिविन्यास को कोण के संदर्भ में दर्शाया गया है, तो इस प्रतिनिधित्व में एक अनुरक्ति होना चाहिए जहां कोण अपने अधिकतम मान से न्यूनतम मान तक आच्छादित है। परिणामस्वरूप, ऐसा हो सकता है कि दो समान अभिविन्यास कोणों द्वारा दर्शाए जाते हैं जिनका तात्पर्य है जो मूल कोणों में से किसी के निकट नहीं है और इसलिए, यह प्रतिनिधित्व औसत नहीं है। सिरा अभिविन्यास के अन्य प्रतिनिधित्व जैसे संरचना टेन्सर हैं, जो औसत हैं।


एक अन्य उदाहरण गति से संबंधित है, जहां कुछ मामलों में केवल कुछ किनारों के सापेक्ष सामान्य वेग निकाला जा सकता है। यदि ऐसी दो फीचर्स निकाली गई हैं और उन्हें एक ही वास्तविक वेग के रूप में माना जा सकता है, तो यह वेग सामान्य वेग सदिशों के औसत के रूप में नहीं दिया जाता है। इसलिए, सामान्य वेग वैक्टर औसत नहीं हैं। इसके स्थान पर, मैट्रिसेस या टेन्सर्स का उपयोग करते हुए गतियों के अन्य निरूपण हैं, जो सामान्य वेग वर्णनकर्ताओं के औसत संचालन के संदर्भ में सही वेग देते हैं।{{citation needed|date=January 2022}}
एक अन्य उदाहरण गति से संबंधित है, जहां कुछ मामलों में केवल कुछ सिरा के सापेक्ष सामान्य वेग निकाला जा सकता है। यदि ऐसी दो फीचर्स निकाली गई हैं और उन्हें एक ही वास्तविक वेग के रूप में माना जा सकता है, तो यह वेग सामान्य वेग सदिशों के औसत के रूप में नहीं दिया जाता है। इसलिए, सामान्य वेग वैक्टर औसत नहीं हैं। इसके स्थान पर, मैट्रिसेस या टेन्सर्स का उपयोग करते हुए गतियों के अन्य निरूपण हैं, जो सामान्य वेग वर्णनकर्ताओं के औसत संचालन के संदर्भ में सही वेग देते हैं।{{citation needed|date=January 2022}}


== मिलान ==
== मिलान ==
{{main|Correspondence problem}}
{{main|Correspondence problem}}
प्रत्येक छवि में पाई गई फीचर्स को संबंधित बिंदुओं जैसे संबंधित फीचर्स को स्थापित करने के लिए कई छवियों से मिलान किया जा सकता है।
प्रत्येक इमेज में पाई गई फीचर्स को संबंधित बिंदुओं जैसे संबंधित फीचर्स को स्थापित करने के लिए कई इमेज से मिलान किया जा सकता है।
 
कलन विधि संदर्भ छवि और लक्ष्य छवि के बीच बिंदु पत्राचार की तुलना और विश्लेषण पर आधारित है। यदि अव्यवस्थित दृश्य का कोई भी हिस्सा प्रारंभ से अधिक पत्राचार साझा करता है, तो अव्यवस्थित दृश्य छवि के उस हिस्से को लक्षित किया जाता है और वहां संदर्भ वस्तु को सम्मिलित करने पर विचार किया जाता है।<ref>{{Cite web|url=https://www.mathworks.com/help/vision/examples/object-detection-in-a-cluttered-scene-using-point-feature-matching.html|title=पॉइंट फ़ीचर मैचिंग - MATLAB और सिमुलिंक का उपयोग करके एक अव्यवस्थित दृश्य में ऑब्जेक्ट डिटेक्शन|website=www.mathworks.com|access-date=2019-07-06}}</ref>
 


कलन विधि संदर्भ इमेज और लक्ष्य इमेज के बीच बिंदु पत्राचार की तुलना और विश्लेषण पर आधारित है। यदि अव्यवस्थित दृश्य का कोई भी अंश प्रारंभ से अधिक पत्राचार साझा करता है, तो अव्यवस्थित दृश्य इमेज के उस अंश को लक्षित किया जाता है और वहां संदर्भ वस्तु को सम्मिलित करने पर विचार किया जाता है।<ref>{{Cite web|url=https://www.mathworks.com/help/vision/examples/object-detection-in-a-cluttered-scene-using-point-feature-matching.html|title=पॉइंट फ़ीचर मैचिंग - MATLAB और सिमुलिंक का उपयोग करके एक अव्यवस्थित दृश्य में ऑब्जेक्ट डिटेक्शन|website=www.mathworks.com|access-date=2019-07-06}}</ref>
== यह भी देखें ==
== यह भी देखें ==
* कंप्यूटर दृष्टि
* कंप्यूटर विज़न
* [[स्वचालित छवि एनोटेशन]]
* [[स्वचालित छवि एनोटेशन|स्वचालित इमेज टिप्पणी]]
* [[फ़ीचर लर्निंग]]
* [[फ़ीचर लर्निंग|फ़ीचर अधिगम]]
* [[फीचर चयन]]
* [[फीचर चयन]]
* [[अग्रभूमि पहचान]]
* [[अग्रभूमि पहचान]]
* [[वैश्वीकरण (इमेज ट्रेसिंग)]]
* [[वैश्वीकरण (इमेज ट्रेसिंग)|वैश्वीकरण (इमेज अनुरेखण)]]


==संदर्भ==
==संदर्भ==
Line 317: Line 312:
| isbn=978-0470050118
| isbn=978-0470050118
}} (summary and review of a number of feature detectors formulated based on a scale-space operations)
}} (summary and review of a number of feature detectors formulated based on a scale-space operations)
{{DEFAULTSORT:Feature (Computer Vision)}}


{{Computer vision footer}}
[[Category:All articles with dead external links]]
{{DEFAULTSORT:Feature (Computer Vision)}}[[Category: फ़ीचर डिटेक्शन (कंप्यूटर विज़न) | फ़ीचर डिटेक्शन (कंप्यूटर विज़न) ]]  
[[Category:All articles with unsourced statements|Feature (Computer Vision)]]
 
[[Category:Articles with dead external links from June 2022]]
 
[[Category:Articles with hatnote templates targeting a nonexistent page|Feature (Computer Vision)]]
 
[[Category:Articles with unsourced statements from January 2022|Feature (Computer Vision)]]
[[Category: Machine Translated Page]]
[[Category:Articles with unsourced statements from May 2020|Feature (Computer Vision)]]
[[Category:Created On 08/06/2023]]
[[Category:Collapse templates|Feature (Computer Vision)]]
[[Category:Created On 08/06/2023|Feature (Computer Vision)]]
[[Category:Lua-based templates|Feature (Computer Vision)]]
[[Category:Machine Translated Page|Feature (Computer Vision)]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Feature (Computer Vision)]]
[[Category:Pages with script errors|Feature (Computer Vision)]]
[[Category:Sidebars with styles needing conversion|Feature (Computer Vision)]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Feature (Computer Vision)]]
[[Category:Templates generating microformats|Feature (Computer Vision)]]
[[Category:Templates that add a tracking category|Feature (Computer Vision)]]
[[Category:Templates that are not mobile friendly|Feature (Computer Vision)]]
[[Category:Templates that generate short descriptions|Feature (Computer Vision)]]
[[Category:Templates using TemplateData|Feature (Computer Vision)]]
[[Category:Wikipedia metatemplates|Feature (Computer Vision)]]
[[Category:फ़ीचर डिटेक्शन (कंप्यूटर विज़न)| फ़ीचर डिटेक्शन (कंप्यूटर विज़न) ]]

Latest revision as of 12:18, 12 September 2023

कंप्यूटर विज़न और इमेज (छवि) प्रसंस्करण में, फ़ीचर इमेज की सामग्री के विषय में जानकारी का एक अंश है, सामान्यतः इमेज के विषय में निश्चित क्षेत्र में कुछ गुण हैं या नहीं हैं। फीचर्स इमेज में विशिष्ट संरचनाएं जैसे बिंदु, सिरा या वस्तु हो सकती हैं। फीचर्स सामान्य प्रतिवेश संचालन इमेज का परिणाम हो सकती हैं या फ़ीचर का पता लगाने के लिए इमेज पर प्रयुक्त भी हो सकती हैं। फीचर्स के अन्य उदाहरण इमेज अनुक्रमों में गति से संबंधित हैं, या विभिन्न इमेज क्षेत्रों के बीच घटता या सीमाओं के रूप में परिभाषित आकृतियों से संबंधित हैं।

अधिक व्यापक रूप से सुविधा सूचना का कोई भाग है जो निश्चित अनुप्रयोग से संबंधित कम्प्यूटेशनल कार्य को हल करने के लिए प्रासंगिक है। यह सामान्य रूप से मशीन लर्निंग (यंत्र अधिगम) और पैटर्न रिकग्निशन (पैटर्न मान्यता) में फ़ीचर के समान ही है, यद्यपि इमेज प्रसंस्करण में फीचर्स का एक बहुत ही परिष्कृत संग्रह है। फ़ीचर अवधारणा बहुत सामान्य है और किसी विशेष कंप्यूटर विज़न प्रणाली में फीचर्स का चुनाव विशिष्ट समस्या पर अत्यधिक निर्भर हो सकता है।

परिभाषा

किसी फ़ीचर का गठन करने की कोई सार्वभौमिक या सटीक परिभाषा नहीं है, और सटीक परिभाषा प्रायः समस्या या अनुप्रयोग के प्रकार पर निर्भर करती है। फिर भी, एक फ़ीचर को सामान्यत: डिजिटल इमेज के एक उत्कृष्ट अंश के रूप में परिभाषित किया जाता है, और फीचर्स का उपयोग कई कंप्यूटर विज़न कलन विधि के लिए प्रारंभिक बिंदु के रूप में किया जाता है।

चूंकि फीचर्स का उपयोग बाद के कलन विधि के लिए प्रारंभिक बिंदु और मुख्य पुरातन के रूप में किया जाता है, इसलिए समग्र कलन विधि प्रायः इसके फीचर संसूचक जितना ही अच्छा होगा। परिणामस्वरूप, एक ही दृश्य के दो या दो से अधिक अलग-अलग इमेज में एक ही फ़ीचर का पता लगाया जाएगा या नहीं, फीचर संसूचक के लिए वांछनीय गुण आवृत्ति योग्यता है।

फ़ीचर अनुसन्धान एक निम्न-स्तरीय इमेज प्रोसेसिंग संचालन है। जो की, सामान्यत: इमेज पर पहले संचालन के रूप में किया जाता है, और यह देखने के लिए प्रत्येक पिक्सेल की जांच करता है कि उस पिक्सेल में कोई फ़ीचर उपस्थिति है या नहीं है। यदि यह बड़े कलन विधि का हिस्सा है, तो कलन विधि सामान्यत: केवल फीचर्स के क्षेत्र में इमेज की जांच करेगा। फीचर अनुसन्धान के लिए एक अंतर्निहित पूर्व-आवश्यकता के रूप में, इनपुट इमेज को सामान्यत: स्केल स्पेस में गौस्सियन कर्नेल द्वारा सुचारू रूप से किया जाता है। स्केल-स्पेस प्रतिनिधित्व और एक या कई फीचर इमेज की गणना की जाती है, जिसे प्रायः लोकल इमेज व्युत्पन्न संचालन के संदर्भ में व्यक्त किया जाता है। .

कभी-कभी, जब फीचर अनुसन्धान गणना करने के रूप से महंगा होता है और समय की कमी होती है, तो फीचर अनुसन्धान चरण को निर्देशित करने के लिए एक उच्च स्तरीय कलन विधि का उपयोग किया जा सकता है, जिससे इमेज के केवल कुछ अंश को फीचर्स के लिए खोजा जा सके।

कई कंप्यूटर विज़न कलन विधि हैं जो प्रारंभिक चरण के रूप में फीचर अनुसन्धान का उपयोग करते हैं, इसलिए इसके परिणामस्वरूप, बहुत बड़ी संख्या में फीचर संसूचक विकसित किए गए हैं। ये फीचर, कम्प्यूटेशनल जटिलता और दोहराने योग्यता के प्रकार में व्यापक रूप से भिन्न होते हैं।

जब फीचर्स को इमेज पर प्रयुक्त लोकल प्रतिवेश के संचालन के संदर्भ में परिभाषित किया जाता है, तो एक प्रक्रिया जिसे सामान्यत: 'फीचर निष्कर्षण' कहा जाता है, कोई भी फीचर अनुसन्धान विज़नकोणों के बीच अंतर कर सकता है जो लोकल परिणाम उत्पन्न करता है कि किसी दिए गए इमेज बिंदु पर किसी दिए गए प्रकार की विशेषता है या नहीं, और जो परिणाम के रूप में अन्य-बाइनरी डेटा उत्पन्न करते हैं। विशिष्टता तब सुसंगत हो जाता है जब परिणाम खोजी गई फीचर्स अपेक्षाकृत विरल होती हैं। यद्यपि लोकल परिणाम किए जाते हैं, फीचर अनुसन्धान स्टेप से आउटपुट को बाइनरी इमेज होने की आवश्यकता नहीं है।कभी-कभी उप-पिक्सेल सटीकता के साथ, परिणाम प्रायः उन इमेज बिंदुओं के सेट (जुड़े या असंबद्ध) निर्देशांक के संदर्भ में प्रस्तुत किया जाता है जहां फीचर्स का पता लगाया गया है।

जब लोकल परिणाम लेने के बिना फीचर निष्कर्षण किया जाता है, तो परिणाम को प्रायः फीचर इमेज के रूप में संदर्भित किया जाता है। परिणामस्वरूप, एक फीचर इमेज को इमेज के रूप में देखा जा सकता है कि यह मूल इमेज के समान स्थानिक (या लौकिक) चर वस्तु का एक कार्य है, लेकिन जहां पिक्सेल मान तीव्रता या रंग के स्थान पर इमेज फीचर्स के विषय में जानकारी रखते हैं। इसका तात्पर्य यह है कि एक फीचर इमेज को उसी तरह से प्रक्रिया किया जा सकता है जैसे इमेज सेंसर द्वारा उत्पन्न एक साधारण इमेज हो। फीचर इमेज को प्रायः फीचर अनुसन्धान के लिए कलन विधि में एकीकृत कदम के रूप में गिना जाता है।

फीचर वैक्टर और फीचर स्पेस(स्थान)

कुछ अनुप्रयोगों में, इमेज डेटा से संबंधित जानकारी प्राप्त करने के लिए केवल एक प्रकार का फ़ीचर निकालना उपयुक्त नहीं है। इसके स्थान पर दो या दो से अधिक अलग-अलग फीचर्स को निकाला जाता है, जिसके परिणामस्वरूप प्रत्येक इमेज बिंदु पर दो या दो से अधिक फीचर वर्णनकर्ता होते हैं। एक सामान्य अभ्यास इन सभी विवरणों द्वारा प्रदान की गई जानकारी को एकल वेक्टर के तत्वों के रूप में व्यवस्थित करना है, जिसे सामान्यत: फीचर वेक्टर के रूप में संदर्भित किया जाता है। सभी संभावित फीचर वैक्टर का सेट एक फीचर स्पेस बनाता है।[1]

फीचर वैक्टर का एक सामान्य उदाहरण तब प्रकट होता है जब प्रत्येक इमेज बिंदु को एक विशिष्ट वर्ग से संबंधित के रूप में वर्गीकृत किया जाता है। यह मानते हुए कि प्रत्येक इमेज बिंदु में फीचर्स के उपयुक्त सेट के आधार पर एक संबंधित फीचर वेक्टर होता है, जिसका अर्थ है कि प्रत्येक वर्ग को संबंधित फीचर स्पेस में अच्छी तरह से अलग किया जाता है, मानक वर्गीकरण पद्धति का उपयोग करके प्रत्येक इमेज बिंदु का वर्गीकरण किया जा सकता है।।

एक अन्य और संबंधित उदाहरण तब होता है जब त्तंत्रिका नेटवर्क-आधारित प्रसंस्करण इमेज पर प्रयुक्त होता है। तंत्रिका नेटवर्क को सिंचित इनपुट डेटा प्रायः प्रत्येक इमेज बिंदु से फीचर वेक्टर के रूप में दिया जाता है, जहां वेक्टर इमेज डेटा से निकाले गए कई अलग-अलग फीचर्स से बना होता है। सीखने के चरण के दौरान, नेटवर्क स्वयं यह पता लगा सकता है कि समस्या को हल करने के लिए विभिन्न फीचर्स का कौन सा संयोजन उपयोगी है।

प्रकार

सिरा

सिरा वे बिंदु होते हैं जहां दो इमेज क्षेत्रों के बीच सीमा (या सिरा) होती है। सामान्यतः सिरा लगभग एकपक्षीय आकार का हो सकता है, और इसमें संयोजन सम्मिलित हो सकते हैं। व्यवहारतः, सिरा को सामान्यत: इमेज में बिंदुओं के सेट के रूप में परिभाषित किया जाता है, जिसमें एक सशक्त ढाल परिमाण होता है। इसके अलावा, कुछ सामान्य कलन विधि फिर सिरा का अधिक पूर्ण विवरण बनाने के लिए एक साथ उच्च ढाल वाले बिंदुओं को श्रृंखलाबद्ध करेंगे। ये कलन विधि सामान्यतः सिरा के गुणों पर कुछ बाधाएं डालते हैं, जैसे कि आकार, चिकनाई और ढाल मूल्य है।

लोकल रूप से, सिरा में एक आयामी संरचना होती है।

कोने / सुविधा अंक

शब्दों के कोनों और सुविधा बिंदुओं का उपयोग कुछ सीमा तक परस्पर विनिमय के लिए किया जाता है और एक इमेज में बिंदु जैसी फीचर्स को संदर्भित करता है, जिसमें एक लोकल दो आयामी संरचना होती है। "कॉर्नर" नाम की उत्पत्ति तब से हुई जब प्रारंभिक कलन विधि ने पहले सिरा का पता लगाया , और फिर दिशा (कोनों) में तेजी से बदलाव अन्वेषण के लिए सिरा का विश्लेषण किया। इन कलन विधि को तब विकसित किया गया था ताकि स्पष्ट सिरा का पता लगाने की आवश्यकता न हो, उदाहरण के लिए इमेज ढाल में वक्रता के उच्च स्तर की अनुसंधान करके। तब यह देखा गया कि इमेज के उन अंश पर तथाकथित कोनों का भी पता लगाया जा रहा था जो पारंपरिक अर्थों में कोने नहीं थे (उदाहरण के लिए एक गहरे रंग की पृष्ठभूमि पर एक छोटा उज्ज्वल स्थान पाया जा सकता है)। इन बिंदुओं को प्रायः रुचि बिंदुओं के रूप में जाना जाता है, लेकिन शब्द का कोना परंपरा द्वारा उपयोग किया जाता है[citation needed].

बिंदु / सुविधा बिंदुओं के क्षेत्र

बिंदुें क्षेत्रों के संदर्भ में इमेज संरचनाओं का एक पूरक विवरण प्रदान करते हैं, जो कोनों के विपरीत अधिक बिंदु-समान होते हैं। फिर भी, बिंदुें वर्णनकर्ता में प्रायः एक रुचिकर बिंदु (संक्रियक प्रतिक्रिया का एक लोकल अधिकतम या गुरुत्वाकर्षण का केंद्र) हो सकता है, जिसका अर्थ है कि कई बिंदुें संसूचकों को रुचि बिंदु संक्रियक के रूप में भी माना जा सकता है। बिंदु संसूचक एक इमेज में उन क्षेत्रों का पता लगा सकते हैं जो एक कोने वाले संसूचक द्वारा पहचाने जाने के लिए बहुत चिकने हैं।

एक इमेज को सिकोड़ने और फिर कोने का पता लगाने पर विचार करें। संसूचक उन बिंदुओं पर प्रतिक्रिया देगा जो सिकुड़ी हुई इमेज में तेज हैं, लेकिन मूल इमेज में चिकने हो सकते हैं। यह इस बिंदु पर है कि कोने संसूचक और बिंदु संसूचक के बीच का अंतर कुछ अस्पष्ट हो जाता है। काफी सीमा तक, पैमाने की उपयुक्त धारणा को सम्मिलित करके इस अंतर को दूर किया जा सकता है। फिर भी, विभिन्न पैमानों पर विभिन्न प्रकार की इमेज संरचनाओं के लिए उनकी प्रतिक्रिया गुणों के कारण,कोने का पता लगाना लेख में LoG और DoH बिंदु का पता लगाना का भी उल्लेख किया गया है।

लकीरें

लम्बी वस्तुओं के लिए, लकीरों की धारणा एक प्राकृतिक उपकरण है। ग्रे-स्तर इमेज से गणना की गई लकीरें वर्णनकर्ता को औसत स्तर की धुरी के सामान्यीकरण के रूप में देखा जा सकता है। एक व्यावहारिक विज़नकोण से, लकीरें को एक आयामी वक्र के रूप में माना जा सकता है जो समरूपता के अक्ष का प्रतिनिधित्व करता है, और इसके अतिरिक्त प्रत्येक लकीरें बिंदु से जुड़े लोकल लकीरें की चौड़ाई का एक गुण है। दुर्भाग्य से, तथापि, सिरा-, कॉर्नर- या बिंदुें फीचर्स की तुलना में ग्रे-स्तर इमेज के सामान्य वर्गों से लकीरें फीचर्स को निकालना कलन विधििक रूप से कठिन है। फिर भी, लकीरें वर्णनकर्ता का उपयोग प्रायः कल्पित इमेज में सरणी निष्कर्षण और चिकित्सा इमेज में रक्त वाहिकाओं को निकालने के लिए किया जाता है - लकीरें का पता लगाना देखें।

पता लगाना

Writing Desk with Harris Detector.png

फ़ीचर अनुसन्धान में इमेज जानकारी के सार की गणना करने और प्रत्येक इमेज बिंदु पर लोकल परिणाम लेने के विधि सम्मिलित हैं, चाहे उस बिंदु पर किसी दिए गए प्रकार की इमेज फ़ीचर हो या नहीं। परिणामी फीचर्स इमेज डोमेन के सबसेट होंगे, प्रायः अलग-अलग बिंदुओं, निरंतर घटता या जुड़े क्षेत्रों के रूप में।

फीचर्स का निष्कर्षण कभी-कभी कई स्केलिंग पर किया जाता है। इनमें से एक तरीका स्केल अपरिवर्तनीय फीचर परिवर्तन(scale invariant feature

transform)(SIFT) है।

सामान्य फ़ीचर संसूचक और उनका वर्गीकरण:
Feature detector Edge Corner Blob Ridge
Canny[2] Yes No No No
Sobel Yes No No No
Harris & Stephens / Plessey[3] Yes Yes No No
SUSAN[4] Yes Yes No No
Shi & Tomasi[5] No Yes No No
Level curve curvature[6] No Yes No No
FAST[7] No Yes Yes No
Laplacian of Gaussian[6] No Yes Yes No
Difference of Gaussians[8][9] No Yes Yes No
Determinant of Hessian[6] No Yes Yes No
Hessian strength feature measures[10][11] No Yes Yes No
MSER[12] No No Yes No
Principal curvature ridges[13][14][15] No No No Yes
Grey-level blobs[16] No No Yes No

निष्कर्षण

एक बार फीचर्स का पता चलने के बाद, फ़ीचर के आसपास एक लोकल इमेज खंड निकाला जा सकता है। इस निष्कर्षण में काफी मात्रा में इमेज प्रोसेसिंग सम्मिलित हो सकती है। परिणाम को फीचर वर्णनकर्ता या फीचर वेक्टर के रूप में जाना जाता है। वर्णन करने के लिए उपयोग किए जाने वाले विज़नकोणों में, एन-जेट और लोकल हिस्टोग्राम का उल्लेख किया जा सकता है (लोकल हिस्टोग्राम वर्णनकर्ता के एक उदाहरण के लिए स्केल-इनवेरिएंट फीचर ट्रांसफ़ॉर्म देखें)। इस तरह की फ़ीचर जानकारी के अलावा, फीचर अनुसन्धान उपाय अपने आप में पूरक फ़ीचर भी प्रदान कर सकता है, जैसे कि सिरा अभिविन्यास और सिरा अनुसन्धान में प्रवणता परिमाण और बिंदु का पता लगाने में ध्रुवीयता और बिंदु की ताकत है।

निम्न स्तर

  • सिरा का पता लगाना
  • कोने का पता लगाना
  • बिंदु का पता लगाना
  • लकीरें का पता लगाना
  • स्केल-इनवेरिएंट फीचर ट्रांसफॉर्म

वक्रता

  • बढ़त की दिशा, बदलती तीव्रता, स्वतः संबंध।

इमेज गति

आकार आधारित

लचीले विधि

  • विकृत, परिचालित आकार
  • सक्रिय आकृति (साँप)

प्रतिनिधित्व

इमेज डेटा में एक विशिष्ट संरचना के संदर्भ में परिभाषित एक विशिष्ट इमेज फ़ीचर को प्रायः विभिन्न तरीकों से प्रदर्शित किया जा सकता है। उदाहरण के लिए, एक सिरा को प्रत्येक इमेज बिंदु में एक बूलियन चर के रूप में दर्शाया जा सकता है जो बताता है कि उस बिंदु पर एक सिरा उपस्थिति है या नहीं। वैकल्पिक रूप से, हम इसके स्थान पर एक प्रतिनिधित्व का उपयोग कर सकते हैं जो सिरा के अस्तित्व के बूलियन बयान के स्थान पर मापन अनिश्चितता प्रदान करता है और इसे सिरा के अभिविन्यास (ज्यामिति) के विषय में जानकारी के साथ जोड़ देता है। इसी तरह, एक विशिष्ट क्षेत्र का रंग या तो औसत रंग (तीन स्केलर) या रंग हिस्टोग्राम (तीन कार्यों) के संदर्भ में प्रदर्शित किया जा सकता है।

जब एक कंप्यूटर विज़न सिस्टम या कंप्यूटर विज़न एल्गोरिथम डिज़ाइन किया जाता है तो फीचर प्रतिनिधित्व का विकल्प एक महत्वपूर्ण मुद्दा हो सकता है। कुछ मामलों में, समस्या को हल करने के लिए किसी फ़ीचर के विवरण में उच्च स्तर का विवरण आवश्यक हो सकता है, लेकिन यह अधिक डेटा और अधिक मांग वाले प्रसंस्करण से निपटने की लागत पर आता है। नीचे, उपयुक्त प्रतिनिधित्व को चुनने के लिए प्रासंगिक कारकों में से कुछ पर चर्चा की गई है। इस चर्चा में, एक फीचर प्रतिनिधित्व के एक उदाहरण को फ़ीचर वर्णनकर्ता या केवल वर्णनकर्ता कहा जाता है।

निश्चितता या विश्वास

इमेज फीचर्स के दो उदाहरण इमेज अनुक्रम में लोकल बढ़त अभिविन्यास और लोकल वेग हैं। अभिविन्यास के विषय में, इस फ़ीचर का मान अधिक या कम अपरिभाषित हो सकता है यदि संबंधित प्रतिवेश में एक से अधिक सिरा उपस्थिति हों। लोकल वेग अपरिभाषित है यदि संबंधित इमेज क्षेत्र में कोई स्थानिक भिन्नता नहीं है। इस अवलोकन के परिणामस्वरूप, फीचर प्रतिनिधित्व का उपयोग करना प्रासंगिक हो सकता है जिसमें फीचर महत्व के विषय में विवरण से संबंधित निश्चितता या विश्वास का एक उपाय सम्मिलित है। अन्यथा, यह एक विशिष्ट स्थिति है कि एक ही विवरणक का उपयोग इस वर्णनकर्ता की व्याख्या में परिणामी अस्पष्टता के साथ, कम निश्चितता के फीचर मूल्यों और शून्य के निकट फ़ीचर मूल्यों का प्रतिनिधित्व करने के लिए किया जाता है। आवेदन के आधार पर, ऐसी अस्पष्टता स्वीकार्य हो भी सकती है और नहीं भी हो सकती है।

विशेष रूप से, यदि एक चित्रित इमेज का उपयोग बाद के प्रसंस्करण में किया जाएगा, तो निश्चितता या विश्वास के विषय में जानकारी सम्मिलित करने वाले फीचर प्रतिनिधित्व को नियोजित करना एक अच्छा विचार हो सकता है। यह एक नए फीचर वर्णनकर्ता को कई वर्णनकर्ता से गणना करने में सक्षम बनाता है, उदाहरण के लिए एक ही इमेज बिंदु पर गणना की जाती है, लेकिन अलग-अलग पैमानों पर, या अलग-अलग लेकिन प्रतिवेशी बिंदुओं से, भारित औसत के संदर्भ में जहां वजन संबंधित निश्चितताओं से प्राप्त होता है। सरलतम विषय में, संबंधित संगणना को चित्रित इमेज के निम्न-पास फ़िल्टरिंग के रूप में प्रयुक्त किया जा सकता है। परिणामी फीचर इमेज, सामान्य रूप से, ध्वनि के प्रति अधिक स्थिर होगी।

औसतता

निरूपण में सम्मिलित निश्चित उपायों के अलावा, संबंधित फीचर मानों का निरूपण स्वयं एक औसत संचालन के लिए उपयुक्त हो सकता है या नहीं। अधिकांश फीचर प्रस्तुतियों को व्यवहार में औसत किया जा सकता है, लेकिन केवल कुछ मामलों में परिणामी विवरण को फीचर मान के संदर्भ में सही व्याख्या दी जा सकती है। ऐसे अभ्यावेदन को औसत कहा जाता है।

उदाहरण के लिए, यदि किसी सिरा के अभिविन्यास को कोण के संदर्भ में दर्शाया गया है, तो इस प्रतिनिधित्व में एक अनुरक्ति होना चाहिए जहां कोण अपने अधिकतम मान से न्यूनतम मान तक आच्छादित है। परिणामस्वरूप, ऐसा हो सकता है कि दो समान अभिविन्यास कोणों द्वारा दर्शाए जाते हैं जिनका तात्पर्य है जो मूल कोणों में से किसी के निकट नहीं है और इसलिए, यह प्रतिनिधित्व औसत नहीं है। सिरा अभिविन्यास के अन्य प्रतिनिधित्व जैसे संरचना टेन्सर हैं, जो औसत हैं।

एक अन्य उदाहरण गति से संबंधित है, जहां कुछ मामलों में केवल कुछ सिरा के सापेक्ष सामान्य वेग निकाला जा सकता है। यदि ऐसी दो फीचर्स निकाली गई हैं और उन्हें एक ही वास्तविक वेग के रूप में माना जा सकता है, तो यह वेग सामान्य वेग सदिशों के औसत के रूप में नहीं दिया जाता है। इसलिए, सामान्य वेग वैक्टर औसत नहीं हैं। इसके स्थान पर, मैट्रिसेस या टेन्सर्स का उपयोग करते हुए गतियों के अन्य निरूपण हैं, जो सामान्य वेग वर्णनकर्ताओं के औसत संचालन के संदर्भ में सही वेग देते हैं।[citation needed]

मिलान

प्रत्येक इमेज में पाई गई फीचर्स को संबंधित बिंदुओं जैसे संबंधित फीचर्स को स्थापित करने के लिए कई इमेज से मिलान किया जा सकता है।

कलन विधि संदर्भ इमेज और लक्ष्य इमेज के बीच बिंदु पत्राचार की तुलना और विश्लेषण पर आधारित है। यदि अव्यवस्थित दृश्य का कोई भी अंश प्रारंभ से अधिक पत्राचार साझा करता है, तो अव्यवस्थित दृश्य इमेज के उस अंश को लक्षित किया जाता है और वहां संदर्भ वस्तु को सम्मिलित करने पर विचार किया जाता है।[17]

यह भी देखें

संदर्भ

  1. Scott E Umbaugh (27 January 2005). Computer Imaging: Digital Image Analysis and Processing. CRC Press. ISBN 978-0-8493-2919-7.
  2. Canny, J. (1986). "A Computational Approach To Edge Detection". IEEE Transactions on Pattern Analysis and Machine Intelligence. 8 (6): 679–714. doi:10.1109/TPAMI.1986.4767851. PMID 21869365. S2CID 13284142.
  3. C. Harris; M. Stephens (1988). "A combined corner and edge detector" (PDF). Proceedings of the 4th Alvey Vision Conference. pp. 147–151.
  4. S. M. Smith; J. M. Brady (May 1997). "SUSAN - a new approach to low level image processing". International Journal of Computer Vision. 23 (1): 45–78. doi:10.1023/A:1007963824710. S2CID 15033310.
  5. J. Shi; C. Tomasi (June 1994). "Good Features to Track". 9th IEEE Conference on Computer Vision and Pattern Recognition. Springer.
  6. 6.0 6.1 6.2 T. Lindeberg (1998). "Feature detection with automatic scale selection" (abstract). International Journal of Computer Vision. 30 (2): 77–116. doi:10.1023/A:1008045108935. S2CID 723210.
  7. E. Rosten; T. Drummond (2006). "Machine learning for high-speed corner detection". European Conference on Computer Vision. Springer. pp. 430–443. CiteSeerX 10.1.1.60.3991. doi:10.1007/11744023_34.
  8. J. L. Crowley and A. C. Parker, "A Representation for Shape Based on Peaks and Ridges in the Difference of Low Pass Transform[dead link]", IEEE Transactions on PAMI, PAMI 6 (2), pp. 156–170, March 1984.
  9. D. Lowe (2004). "Distinctive Image Features from Scale-Invariant Keypoints". International Journal of Computer Vision. 60 (2): 91. CiteSeerX 10.1.1.73.2924. doi:10.1023/B:VISI.0000029664.99615.94. S2CID 221242327.
  10. T. Lindeberg "Scale selection properties of generalized scale-space interest point detectors", Journal of Mathematical Imaging and Vision, Volume 46, Issue 2, pages 177-210, 2013.
  11. T. Lindeberg ``Image matching using generalized scale-space interest points", Journal of Mathematical Imaging and Vision, volume 52, number 1, pages 3-36, 2015.
  12. J. Matas; O. Chum; M. Urban; T. Pajdla (2002). "Robust wide baseline stereo from maximally stable extremum regions" (PDF). British Machine Vision Conference. pp. 384–393.
  13. R. Haralick, "Ridges and Valleys on Digital Images", Computer Vision, Graphics, and Image Processing vol. 22, no. 10, pp. 28–38, Apr. 1983.
  14. D. Eberly, R. Gardner, B. Morse, S. Pizer, C. Scharlach, Ridges for image analysis, Journal of Mathematical Imaging and Vision, v. 4 n. 4, pp. 353–373, Dec. 1994.
  15. T. Lindeberg (1998). "Edge detection and ridge detection with automatic scale selection" (abstract). International Journal of Computer Vision. 30 (2): 117–154. doi:10.1023/A:1008097225773. S2CID 207658261.
  16. T. Lindeberg (1993). "Detecting Salient Blob-Like Image Structures and Their Scales with a Scale-Space Primal Sketch: A Method for Focus-of-Attention" (abstract). International Journal of Computer Vision. 11 (3): 283–318. doi:10.1007/BF01469346. S2CID 11998035.
  17. "पॉइंट फ़ीचर मैचिंग - MATLAB और सिमुलिंक का उपयोग करके एक अव्यवस्थित दृश्य में ऑब्जेक्ट डिटेक्शन". www.mathworks.com. Retrieved 2019-07-06.


अग्रिम पठन