थ्रेशोल्डिंग (छवि प्रसंस्करण)

डिजिटल इमेज प्रोसेसिंग में, थ्रेशोल्डिंग छवि विभाजन की सबसे सरल विधि है। ग्रेस्केल छवि से, बाइनरी छवियां बनाने के लिए थ्रेशोल्डिंग का उपयोग किया जा सकता है।

परिभाषा
सबसे सरल थ्रेशोल्डिंग विधियाँ छवि की तीव्रता के अनुसार छवि में प्रत्येक पिक्सेल को काले पिक्सेल से बदल देती हैं $$I_{i,j}$$ एक निश्चित मान से कम है जिसे दहलीज कहा जाता है $$T$$, या एक सफेद पिक्सेल यदि पिक्सेल की तीव्रता उस सीमा से अधिक है। दाईं ओर की उदाहरण छवि में, इसके परिणामस्वरूप गहरा पेड़ पूरी तरह से काला हो जाता है, और चमकदार बर्फ पूरी तरह से सफेद हो जाती है।

स्वचालित थ्रेशोल्डिंग
जबकि कुछ मामलों में, दहलीज $$T$$ उपयोगकर्ता द्वारा मैन्युअल रूप से चुना जा सकता है, ऐसे कई मामले हैं जहां उपयोगकर्ता चाहता है कि सीमा स्वचालित रूप से एल्गोरिदम द्वारा निर्धारित की जाए। उन मामलों में, थ्रेशोल्ड इस अर्थ में सर्वोत्तम थ्रेशोल्ड होना चाहिए कि थ्रेशोल्ड के ऊपर और नीचे के पिक्सेल का विभाजन उन पिक्सेल द्वारा प्रदर्शित वस्तुओं के दो वर्गों के बीच वास्तविक विभाजन के जितना संभव हो सके मेल खाना चाहिए (उदाहरण के लिए, नीचे के पिक्सेल) सीमा को पृष्ठभूमि के अनुरूप होना चाहिए और ऊपर वाले को छवि में रुचि की कुछ वस्तुओं के अनुरूप होना चाहिए)।

कई प्रकार की स्वचालित थ्रेशोल्डिंग विधियाँ मौजूद हैं, सबसे प्रसिद्ध और व्यापक रूप से उपयोग की जाने वाली ओट्सू की विधि है। निम्नलिखित सूची, #Sezgin2004|Sezgin एट अल के कार्यों पर आधारित है। (2004) एल्गोरिदम द्वारा हेरफेर की गई जानकारी के आधार पर थ्रेशोल्डिंग विधियों को व्यापक समूहों में वर्गीकृत किया गया है। हालाँकि ध्यान दें कि ऐसा वर्गीकरण आवश्यक रूप से अस्पष्ट है क्योंकि कुछ विधियाँ कई श्रेणियों में आ सकती हैं (उदाहरण के लिए, ओट्सू की विधि को हिस्टोग्राम-आकार और क्लस्टरिंग एल्गोरिदम दोनों माना जा सकता है)


 * हिस्टोग्राम आकार-आधारित विधियां, जहां, उदाहरण के लिए, चिकने हिस्टोग्राम की चोटियों, घाटियों और वक्रता का विश्लेषण किया जाता है। ध्यान दें कि ये विधियाँ, दूसरों की तुलना में, छवि तीव्रता संभाव्यता वितरण (यानी, हिस्टोग्राम का आकार) के बारे में कुछ निश्चित धारणाएँ बनाती हैं।
 * क्लस्टरिंग-आधारित विधियाँ, जहाँ ग्रे-स्तर के नमूनों को पृष्ठभूमि और अग्रभूमि के रूप में दो भागों में क्लस्टर किया जाता है,
 * एन्ट्रॉपी (सूचना सिद्धांत)-आधारित विधियों के परिणामस्वरूप एल्गोरिदम बनते हैं जो अग्रभूमि और पृष्ठभूमि क्षेत्रों की एन्ट्रॉपी, मूल और बाइनराइज्ड छवि के बीच क्रॉस-एन्ट्रॉपी आदि का उपयोग करते हैं।
 * ऑब्जेक्ट एट्रिब्यूट-आधारित विधियाँ ग्रे-लेवल और बाइनराइज़्ड छवियों के बीच समानता का माप खोजती हैं, जैसे फ़ज़ी आकार समानता, किनारे संयोग, आदि।
 * स्थानिक विधियाँ पिक्सेल के बीच उच्च-क्रम संभाव्यता वितरण और/या सहसंबंध का उपयोग करती हैं।



वैश्विक बनाम स्थानीय सीमा
अधिकांश विधियों में, छवि के सभी पिक्सेल पर समान सीमा लागू होती है। हालाँकि, कुछ मामलों में, पिक्सेल के स्थानीय मूल्य के आधार पर, छवि के विभिन्न हिस्सों पर एक अलग सीमा लागू करना फायदेमंद हो सकता है। विधियों की इस श्रेणी को स्थानीय या अनुकूली थ्रेशोल्डिंग कहा जाता है। वे विशेष रूप से उन मामलों के लिए अनुकूलित होते हैं जहां छवियों में विषम प्रकाश व्यवस्था होती है, जैसे कि दाईं ओर सुडोकू छवि में। उन मामलों में, एक पड़ोस परिभाषित किया जाता है और प्रत्येक पिक्सेल और उसके पड़ोस के लिए एक सीमा की गणना की जाती है। कई वैश्विक थ्रेशोल्डिंग विधियों को स्थानीय तरीके से काम करने के लिए अनुकूलित किया जा सकता है, लेकिन स्थानीय थ्रेशोल्डिंग के लिए विशेष रूप से विकसित की गई विधियां भी हैं, जैसे कि निब्लैक या बर्नसेन एल्गोरिदम।

ImageJ जैसे सॉफ़्टवेयर ग्लोबल और local दोनों, स्वचालित थ्रेशोल्ड विधियों की एक विस्तृत श्रृंखला का प्रस्ताव करते हैं।

मल्टी-बैंड छवियां
रंगीन छवियों को भी थ्रेशोल्ड किया जा सकता है। एक दृष्टिकोण छवि के प्रत्येक आरजीबी रंग मॉडल घटकों के लिए एक अलग सीमा निर्धारित करना है और फिर उन्हें बाइनरी और ऑपरेशन के साथ संयोजित करना है। यह कैमरे के काम करने के तरीके और कंप्यूटर में डेटा कैसे संग्रहीत किया जाता है, को दर्शाता है, लेकिन यह लोगों के रंग पहचानने के तरीके से मेल नहीं खाता है। इसलिए, एचएसएल और एचएसवी रंग मॉडल अधिक बार उपयोग किए जाते हैं; ध्यान दें कि चूंकि रंग एक गोलाकार मात्रा है, इसलिए इसे गोलाकार दहलीज की आवश्यकता होती है। सीएमवाईके रंग मॉडल रंग मॉडल का उपयोग करना भी संभव है।

एकाधिक सीमाएँ
बाइनरी छवि के परिणामस्वरूप एकल सीमा के बजाय, कई बढ़ती हुई सीमाएँ पेश करना भी संभव है $$T_n$$. उस स्थिति में, कार्यान्वयन $$N$$ थ्रेशोल्ड के परिणामस्वरूप एक छवि बनेगी $$N$$ कक्षाएं, जहां तीव्रता के साथ पिक्सेल $$I_{ij}$$ ऐसा है कि $$T_n < I_{ij} < T_{n+1}$$ कक्षा को सौंपा जाएगा $$n$$. अधिकांश बाइनरी स्वचालित थ्रेशोल्डिंग विधियों में मल्टी-थ्रेशोल्डिंग के लिए प्राकृतिक विस्तार होता है।

सीमाएँ
कुछ शर्तों के तहत थ्रेसहोल्डिंग सबसे अच्छा काम करेगी:


 * शोर का निम्न स्तर
 * अंतर-वर्ग विचरण की तुलना में उच्च अंतर-वर्ग विचरण, यानी, एक ही समूह के पिक्सेल की तीव्रता दूसरे समूह के पिक्सेल की तुलना में एक-दूसरे के अधिक करीब होती है,
 * सजातीय प्रकाश व्यवस्था, आदि।

कठिन मामलों में, थ्रेशोल्डिंग संभवतः अपूर्ण होगी और झूठी सकारात्मक और झूठी नकारात्मक के साथ एक द्विआधारी छवि उत्पन्न करेगी।

स्रोत

 *  फाम एन, मॉरिसन ए, श्वॉक जे एट अल। (2007)। सीएमवाईके रंग मॉडल का उपयोग करके इम्यूनोहिस्टोकेमिकल दागों का मात्रात्मक छवि विश्लेषण। निदान पथ। '2:'8.
 *  लिंडा शापिरो|शापिरो, लिंडा जी. और स्टॉकमैन, जॉर्ज सी. (2002)। कंप्यूटर दृष्टि । शागिर्द कक्ष। ISBN 0-13-030796-3
 *  मेहमत सेजिन और बुलेंट संकुर, इमेज थ्रेशोल्डिंग तकनीक और मात्रात्मक प्रदर्शन मूल्यांकन पर सर्वेक्षण, जर्नल ऑफ इलेक्ट्रॉनिक इमेजिंग 13(1), 146-165 (जनवरी 2004)। 

अग्रिम पठन

 * Gonzalez, Rafael C. & Woods, Richard E. (2002). Thresholding. In Digital Image Processing, pp. 595–611. Pearson Education. ISBN 81-7808-629-8
 * M. Luessi, M. Eichmann, G. M. Schuster, and A. K. Katsaggelos, Framework for efficient optimal multilevel image thresholding, Journal of Electronic Imaging, vol. 18, pp. 013004+, 2009.
 * Y.K. Lai, P.L. Rosin, Efficient Circular Thresholding, IEEE Trans. on Image Processing 23(3), pp. 992–1001 (2014).
 * Scott E. Umbaugh (2018). Digital Image Processing and Analysis, pp 93–96. CRC Press. ISBN 978-1-4987-6602-9