ब्लॉब संसूचक

From Vigyanwiki


कंप्यूटर विज़न में, ब्लॉब डिटेक्शन विधियों का उद्देश्य डिजिटल छवि में उन क्षेत्रों का अनुमान लगाना है जो आस-पास के क्षेत्रों की तुलना में चमक या रंग जैसे गुणों में भिन्न होते हैं। अनौपचारिक रूप से, ब्लॉब छवि का क्षेत्र है जिसमें कुछ गुण स्थिर या लगभग स्थिर होते हैं; बूँद के सभी बिंदुओं को कुछ अर्थों में एक-दूसरे के समान माना जा सकता है। ब्लॉब का अनुमान लगाने के लिए सबसे साधारण विधि कनवल्शन है।

छवि पर स्थिति के फ़ंक्शन के रूप में व्यक्त की गई रुचि की कुछ संपत्ति को देखते हुए, ब्लॉब डिटेक्टरों के दो मुख्य वर्ग हैं: (i) विभेदक कैलकुलस विधियां, जो स्थिति के संबंध में फ़ंक्शन के डेरिवेटिव पर आधारित हैं, और ( ii) स्थानीय मैक्सिमा और मिनिमा पर आधारित विधियां, जो फ़ंक्शन की स्थानीय मैक्सिमा और मिनिमा खोजने पर आधारित हैं। क्षेत्र में उपयोग की जाने वाली नवीनतम शब्दावली के साथ, इन डिटेक्टरों को रुचि बिंदु ऑपरेटर्स, या वैकल्पिक रूप से रुचि क्षेत्र ऑपरेटर्स ( रुचि बिंदु का अनुमान लगाना और कोने का अनुमान लगाना भी देखें) के रूप में भी संदर्भित किया जा सकता है।

ब्लॉब डिटेक्टरों के अध्ययन और विकास के लिए कई प्रेरणाएँ हैं। मुख्य कारण क्षेत्रों के बारे में पूरक जानकारी प्रदान करना है, जो किनारे का अनुमान लगाना या कोने का अनुमान लगाने से प्राप्त नहीं होती है। क्षेत्र में प्रारंभिक कार्य में, आगे की प्रक्रिया के लिए रुचि के क्षेत्रों को प्राप्त करने के लिए ब्लॉब डिटेक्शन का उपयोग किया गया था। ये क्षेत्र ऑब्जेक्ट पहचान और/या ऑब्जेक्ट वीडियो ट्रैकिंग के अनुप्रयोग के साथ छवि डोमेन में ऑब्जेक्ट या ऑब्जेक्ट के हिस्सों की उपस्थिति का संकेत दे सकते हैं। अन्य डोमेन में, जैसे छवि हिस्टोग्राम विश्लेषण, ब्लॉब डिस्क्रिप्टर का उपयोग विभाजन (छवि प्रसंस्करण) के अनुप्रयोग के साथ शिखर का अनुमान लगाना के लिए भी किया जा सकता है। ब्लॉब डिस्क्रिप्टर का अन्य सामान्य उपयोग बनावट (कंप्यूटर ग्राफिक्स) विश्लेषण और बनावट पहचान के लिए मुख्य प्राचीन के रूप में होता है। हाल के काम में, ब्लॉब डिस्क्रिप्टर को व्यापक बेसलाइन छवि पंजीकरण के लिए रुचि बिंदु का अनुमान लगाने और स्थानीय छवि आंकड़ों के आधार पर उपस्थिति-आधारित ऑब्जेक्ट पहचान के लिए सूचनात्मक छवि सुविधाओं की उपस्थिति का संकेत देने के लिए तीव्रता से लोकप्रिय उपयोग मिला है। लम्बी वस्तुओं की उपस्थिति का संकेत देने के लिए रिज का अनुमान लगाने की संबंधित धारणा भी है।

गॉसियन का लाप्लासियन

सबसे पहले और सबसे साधारण ब्लॉब डिटेक्टरों में से गाऊसी फिल्टर (एलओजी) के लाप्लासियन पर आधारित है। इनपुट छवि दी गई है , यह छवि गॉसियन कर्नेल द्वारा संयोजित है |

एक निश्चित पैमाने पर स्केल स्पेस प्रतिनिधित्व देने के लिए . फिर, लाप्लासियन ऑपरेटर को क्रियान्वित करने का परिणाम

की गणना की जाती है, जिसके परिणामस्वरूप साधारण तौर पर त्रिज्या के काले धब्बों के लिए मजबूत सकारात्मक प्रतिक्रिया होती है (द्वि-आयामी छवि के लिए, के लिए -आयामी छवि) और समान आकार की चमकदार बूँदों के लिए मजबूत नकारात्मक प्रतिक्रियाएँ। हालाँकि, इस ऑपरेटर को एकल पैमाने पर क्रियान्वित करते समय मुख्य समस्या यह है कि ऑपरेटर की प्रतिक्रिया छवि डोमेन में ब्लॉब संरचनाओं के आकार और प्री-स्मूथिंग के लिए उपयोग किए जाने वाले गॉसियन कर्नेल के आकार के बीच संबंध पर दृढ़ता से निर्भर होती है। छवि डोमेन में विभिन्न (अज्ञात) आकार के ब्लॉब्स को स्वचालित रूप से कैप्चर करने के लिए, बहु-स्तरीय दृष्टिकोण आवश्यक है।

स्वचालित स्केल चयन के साथ मल्टी-स्केल ब्लॉब डिटेक्टर प्राप्त करने का सीधा विधि स्केल-सामान्यीकृत लाप्लासियन ऑपरेटर पर विचार करना है

और स्केल-स्पेस मैक्सिमा/मिनिमा का अनुमान लगाने के लिए, ये ऐसे बिंदु हैं जो साथ स्थानीय मैक्सिमा/मिनिमा हैं अंतरिक्ष और पैमाने दोनों के संबंध में (लिंडेबर्ग 1994, 1998)। इस प्रकार, असतत द्वि-आयामी इनपुट छवि दी गई है त्रि-आयामी असतत स्केल-स्पेस वॉल्यूम गणना की जाती है और बिंदु को उज्ज्वल (अंधेरे) बूँद के रूप में माना जाता है यदि इस बिंदु पर मूल्य उसके सभी 26 पड़ोसियों के मूल्य से अधिक (छोटा) है। इस प्रकार, रुचि बिंदुओं का साथ चयन और तराजू के अनुसार किया जाता है