ब्लॉब संसूचक

From Vigyanwiki
Revision as of 14:54, 6 September 2023 by Abhishekkshukla (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)


कंप्यूटर विज़न में, ब्लॉब संसूचक विधियों का उद्देश्य डिजिटल इमेज में उन क्षेत्रों का अनुमान लगाना है जो समीप के क्षेत्रों की तुलना में ब्राइटनेस या कलर जैसे गुणों में भिन्न होते हैं। यह अनौपचारिक रूप से, ब्लॉब इमेज का क्षेत्र होता है जिसमें पूर्णतया गुण स्थिर या प्रायः स्थिर होते हैं | इसमें ब्लॉब के सभी बिंदुओं को पूर्णतया अर्थों में प्रत्येक के समान माना जा सकता है। ब्लॉब का अनुमान लगाने के लिए सबसे साधारण विधि कनवल्शन होती है।

इसमें इमेज पर स्थिति के फलन के रूप में व्यक्त की गई रुचि की पूर्णतया गुण को देखते हुए, ब्लॉब संसूचक के दो मुख्य वर्ग होते हैं | (i) विभेदक कैलकुलस विधियां, जो स्थिति के संबंध में फलन के व्युत्पन्न पर आधारित होता हैं, और ( ii) स्थानीय मैक्सिमा और मिनिमा पर आधारित विधियां, जो फलन की स्थानीय मैक्सिमा और मिनिमा खोज पर आधारित होती हैं।इस प्रकार क्षेत्र में उपयोग की जाने वाली नवीनतम शब्दावली के साथ, इन संसूचक को रुचि बिंदु संचालक, या वैकल्पिक रूप से रुचि क्षेत्र संचालक (रुचि बिंदु का अनुमान लगाना और कोण का अनुमान लगाना भी देखें) के रूप में भी संदर्भित किया जा सकता है।

ब्लॉब संसूचक के अध्ययन और विकास के लिए अनेक प्रेरणाएँ होती हैं। इसका मुख्य कारण क्षेत्रों के बारे में पूर्ण जानकारी प्रदान करना है, जिनको कोर संसूचक का अनुमान लगाना या कोण का अनुमान लगाने से प्राप्त नहीं होता है। इसके क्षेत्र में प्रारंभिक कार्य में, पूर्व की प्रक्रिया के लिए रुचि के क्षेत्रों को प्राप्त करने के लिए ब्लॉब संसूचक का उपयोग किया गया था। यह क्षेत्र वस्तु समानता और वस्तु वीडियो ट्रैकिंग के अनुप्रयोग के साथ इमेज डोमेन में वस्तु या वस्तु के भागों की उपस्थिति का संकेत दे सकते हैं। अन्य डोमेन में, जैसे इमेज हिस्टोग्राम विश्लेषण, ब्लॉब डिस्क्रिप्टर का उपयोग विभाजन (इमेज प्रसंस्करण) के अनुप्रयोग के साथ शिखर का अनुमान लगाना के लिए भी किया जा सकता है। ब्लॉब डिस्क्रिप्टर का अन्य सामान्य उपयोग प्रकृति (कंप्यूटर ग्राफिक्स) विश्लेषण और प्रकृति पहचान के लिए मुख्य प्राचीन रूप में होता है। वर्तमान के कार्य में, ब्लॉब डिस्क्रिप्टर को व्यापक आधारभूत इमेज पंजीकरण के लिए रुचि बिंदु का अनुमान लगाने और स्थानीय इमेज आंकड़ों के आधार पर उपस्थिति-आधारित वस्तु पहचान के लिए सूचनात्मक इमेज सुविधाओं की उपस्थिति का संकेत देने के लिए तीव्रता से इसमें लोकप्रिय उपयोग मिला है। लम्बी वस्तुओं की उपस्थिति का संकेत देने के लिए रिज का अनुमान लगाने की संबंधित धारणा भी होती है।

गॉसियन का लाप्लासियन

सबसे प्रथम और सबसे साधारण ब्लॉब संसूचक में से गाऊसी फिल्टर (एलओजी) के लाप्लासियन पर आधारित होता है। इसमें इनपुट इमेज , दी गई है यह इमेज गॉसियन कर्नेल द्वारा संयोजित है |

एक निश्चित मापदंड पर मापदंड स्पेस प्रतिनिधित्व देने के लिए . यह, लाप्लासियन ऑपरेटर को क्रियान्वित करने का परिणाम होता हैं |

इसमें गणना की जाती है, जिसके परिणामस्वरूप सामान्यतः त्रिज्या के अंधेरे ब्लब्स के लिए शक्तिशाली धनात्मक प्रतिक्रियाएं होती हैं। जिनकी गणना की जाती है, और जिसके परिणामस्वरूप सामान्यतःत्रिज्या के अंधेरे ब्लब्स के लिए शक्तिशाली धनात्मक प्रतिक्रियाएं होती हैं | यह या -आयामी इमेज के लिए) और ब्राइट ब्लब्स के लिए शक्तिशाली ऋणात्मक प्रतिक्रियाएं होती हैं यह समान आकार की होती हैं | चूँकि, इस ऑपरेटर को एकल मापदंड पर प्रयुक्त करते समय मुख्य समस्या यह है कि ऑपरेटर की प्रतिक्रिया इमेज डोमेन में ब्लॉब संरचनाओं के आकार और प्री-स्मूथिंग के लिए उपयोग किए जाने वाले गॉसियन कर्नेल के आकार के मध्य संबंध पर दृढ़ता से निर्भर होती है। इमेज डोमेन में विभिन्न (अज्ञात) आकार के ब्लॉब्स को स्वचालित रूप से आकर्षित करने के लिए, बहु-स्तरीय दृष्टिकोण आवश्यक होता है।

स्वचालित मापदंड चयन के साथ मल्टी- मापदंड ब्लॉब संसूचक प्राप्त करने की सही विधि मापदंड -सामान्यीकृत लाप्लासियन ऑपरेटर पर विचार करना है |

और मापदंड -स्पेस मैक्सिमा/मिनिमा का अनुमान लगाने के लिए, यह ऐसे बिंदु होते हैं जो स्पेस और मापदंड दोनों के संबंध में साथ के स्थानीय मैक्सिमा/मिनिमा होते हैं | और (लिंडेबर्ग 1994, 1998) में इस प्रकार, असतत द्वि-आयामी इनपुट इमेज को देखते हुए त्रि-आयामी असतत मापदंड -स्पेस वॉल्यूम की गणना की जाती है और बिंदु को ब्राइट (अंधेरे) ब्लॉब के रूप में माना जाता है यदि इस बिंदु पर मान अधिक (छोटा) है और इसके सभी 26 निकटतम के मूल्य से अधिक हैं । तब इस प्रकार, ब्याज अंक और मापदंड का साथ चयन के अनुसार किया जाता है |

.


मान लीजिए कि ब्लॉब की यह धारणा "ब्लॉब" की धारणा की संक्षिप्त और गणितीय रूप से स्पष्ट परिचालन परिभाषा प्रदान करती है, जिनका सीधे ब्लॉब का खोज करने के लिए कुशल और शक्तिशाली एल्गोरिदम की ओर ले जाती है। सामान्यीकृत लाप्लासियन ऑपरेटर के मापदंड -स्पेस मैक्सिमा से परिभाषित ब्लॉब के पूर्णतया मूलभूत गुण यह हैं कि प्रतिक्रियाएँ इमेज डोमेन में अनुवाद, परिक्रमण और पुनःमापदंड के साथ सहसंयोजक होती हैं। इस प्रकार, यदि मापदंड -स्पेस अधिकतम को बिंदु पर माना जाता है, तब मापदंड कारक द्वारा इमेज के पुनः मापदंड - के अनुसार , पुनःमापदंड की गई इमेज में पर मापदंड -स्पेस अधिकतम होता हैं | और (लिंडेबर्ग 1998) ). वास्तव में यह अत्यधिक उपयोगी गुण का तात्पर्य है कि लाप्लासियन ब्लॉब संसूचक के विशिष्ट विषय के अतिरिक्त, मापदंड -सामान्यीकृत लाप्लासियन की स्थानीय मैक्सिमा/मिनिमा का उपयोग अन्य संदर्भों में मापदंड चयन के लिए भी किया जाता है, जैसे कि कोण की खोज लगाना, मापदंड -अनुकूली सुविधा ट्रैकिंग (ब्रेटज़नर) और लिंडेबर्ग 1998) पर होता हैं | मापदंड -अपरिवर्तनीय सुविधा परिवर्तन (लोव 2004) के साथ-साथ इमेज मिलान और वस्तु पहचान के लिए अन्य इमेज डिस्क्रिप्टर होता हैं।

लाप्लासियन ऑपरेटर और अन्य सूक्ष्‍म से मापदंड -स्पेस रूचि बिंदु संसूचक के मापदंड चयन गुणों का विस्तार से विश्लेषण किया गया है (लिंडेबर्ग 2013ए)।[1](लिंडेबर्ग 2013बी, 2015) [2] [3] में यह दिखाया गया है कि अन्य मापदंड -स्पेस रूचि बिंदु संसूचक उपस्थित होते हैं, जैसे कि हेसियन ऑपरेटर का निर्धारक, जिसमे लाप्लासियन ऑपरेटर या इसके अंतर-गॉसियन सन्निकटन से उत्तम प्रदर्शन करता है। इसका उपयोग स्थानीय सिफ्ट-जैसे इमेज वर्णनकर्ताओं का उपयोग करके इमेज-आधारित मिलान के लिए किया जाता हैं।

गॉसियन दृष्टिकोण का अंतर

इस तथ्य से किसी मापदंड स्पेस प्रतिनिधित्व प्रसार समीकरण को संतुष्ट करता है |