गैबोर फिल्टर

छवि प्रसंस्करण में, गैबोर फ़िल्टर, जिसका नाम डेनिस गैबोर के नाम पर रखा गया था, जिन्होंने सबसे पहले इसे 1D फ़िल्टर के रूप में प्रस्तावित किया था। गैबोर फ़िल्टर को सबसे पहले गोस्टा ग्रैनलुंड द्वारा एक संदर्भ दिशा जोड़कर, 2D में सामान्यीकृत किया गया था। गैबोर फ़िल्टर रैखिक फ़िल्टर है, जिसका उपयोग बनावट मानचित्रण विश्लेषण के लिए किया जाता है, जिसका अनिवार्य रूप से अर्थ है कि यह विश्लेषण करता है कि विश्लेषण के बिंदु या क्षेत्र के आसपास स्थानीयकृत क्षेत्र में विशिष्ट दिशाओं में छवि में कोई विशिष्ट आवृत्ति सामग्री है या नहीं है। कई समकालीन दृष्टि वैज्ञानिकों द्वारा गैबोर फिल्टर की आवृत्ति और अभिविन्यास प्रतिनिधित्व को मानव दृश्य प्रणाली के समान होने का माँग किया गया है। उन्हें बनावट प्रतिनिधित्व और भेदभाव के लिए विशेष रूप से उपयुक्त पाया गया है। स्थानिक डोमेन में, 2D गैबोर फ़िल्टर एक गाऊसी कर्नेल फलन है। जो साइनसॉइडल समतल वेव द्वारा संशोधित होता है। (गैबोर परिवर्तन देखें)

कुछ लेखकों का मानना है कि स्तनधारी मस्तिष्क के दृश्य प्रांतस्था में सरल कोशिकाओं को गैबोर फलन द्वारा मॉडल किया जा सकता है। इस प्रकार, गैबोर फिल्टर के साथ छवि विश्लेषण को कुछ लोगों द्वारा मानव दृश्य प्रणाली में धारणा के समान माना जाता है।

परिभाषा
इसकी आवेग प्रतिक्रिया को गॉसियन फलन द्वारा गुणा की गई साइन वेव (2D गैबोर फिल्टर के लिए प्लेन वेव) द्वारा परिभाषित किया गया है।

गुणन-कन्वोल्यूशन प्रॉपर्टी (कन्वोल्यूशन प्रमेय) के कारण, गैबोर फिल्टर की आवेग प्रतिक्रिया का फूरियर रूपांतरण हार्मोनिक फलन (साइनसॉइडल फलन) के फूरियर ट्रांसफॉर्म और गॉसियन फलन के फूरियर ट्रांसफॉर्म का कनवल्शन है। फ़िल्टर में वास्तविक संख्या और काल्पनिक संख्या घटक होता है। जो ओर्थोगोनल दिशाओं का प्रतिनिधित्व करता है। दोनों घटकों को जटिल संख्या में बनाया जा सकता है या व्यक्तिगत रूप से उपयोग किया जा सकता है।

सरल


 * $$g(x,y;\lambda,\theta,\psi,\sigma,\gamma) = \exp\left(-\frac{x'^2+\gamma^2y'^2}{2\sigma^2}\right)\exp\left(i\left(2\pi\frac{x'}{\lambda}+\psi\right)\right)$$

वास्तविक


 * $$g(x,y;\lambda,\theta,\psi,\sigma,\gamma) = \exp\left(-\frac{x'^2+\gamma^2y'^2}{2\sigma^2}\right)\cos\left(2\pi\frac{x'}{\lambda}+\psi\right)$$

काल्पनिक


 * $$g(x,y;\lambda,\theta,\psi,\sigma,\gamma) = \exp\left(-\frac{x'^2+\gamma^2y'^2}{2\sigma^2}\right)\sin\left(2\pi\frac{x'}{\lambda}+\psi\right)$$

जहाँ $$x' = x \cos\theta + y \sin\theta$$ और $$y' = -x \sin\theta + y \cos\theta$$ है।

इस समीकरण में, $$\lambda$$ साइनसॉइडल कारक की तरंग दैर्ध्य का प्रतिनिधित्व करता है, $$\theta$$ गैबोर फलन की समानांतर धारियों के लिए सामान्य के उन्मुखीकरण का प्रतिनिधित्व करता है, $$\psi$$ चरण ऑफसेट है, $$\sigma$$ गॉसियन लिफाफे का सिग्मा/मानक विचलन है और $$\gamma$$ स्थानिक आस्पेक्ट अनुपात है, और गैबोर फलन के समर्थन की अण्डाकारता निर्दिष्ट करता है।

वेवलेट स्पेस
गैबोर फ़िल्टर सीधे गैबोर वेवलेट से संबंधित हैं, क्योंकि उन्हें कई फैलाव और घुमावों के लिए डिज़ाइन किया जा सकता है। चूंकि, सामान्यतः, गैबोर तरंगिकाओं के लिए विस्तार प्रयुक्त नहीं किया जाता है, क्योंकि इसके लिए द्वि-ऑर्थोगोनल तरंगिकाओं की गणना की आवश्यकता होती है, जो बहुत समय लेने वाली हो सकती है। इसलिए, सामान्यतः, विभिन्न पैमानों और घुमावों वाले गैबोर फिल्टर से युक्त फिल्टर बैंक बनाया जाता है। फ़िल्टर संकेत के साथ जुड़ जाते हैं, जिसके परिणामस्वरूप तथाकथित गैबर स्पेस बनता है। यह प्रक्रिया प्राथमिक दृश्य प्रांतस्था में प्रक्रियाओं से निकटता से संबंधित है। जोन्स और पामर ने दिखाया कि जटिल गैबोर फलन का वास्तविक भाग बिल्ली के स्ट्रिएट कॉर्टेक्स में सरल कोशिकाओं में पाए जाने वाले ग्रहणशील क्षेत्र वजन कार्यों के लिए उपयुक्त है।

गैबोर फिल्टर का समय-कारण एनालॉग
अस्थायी संकेतों को संसाधित करते समय, भविष्य के डेटा तक नहीं पहुंचा जा सकता है, जिससे अस्थायी आयाम पर निर्भर वास्तविक समय संकेतों को संसाधित करने के लिए गैबोर फलन का उपयोग करने का प्रयास करने पर समस्याएं उत्पन होती हैं। गैबोर फ़िल्टर का समय-कारण एनालॉग विकसित किया गया है। गैबोर फलन में गॉसियन कर्नेल को समय-कारण और समय-पुनरावर्ती कर्नेल के साथ बदलने पर आधारित, जिसे समय-कारण सीमा कर्नेल कहा जाता है। इस तरह, समय-कारण सीमा कर्नेल के परिणामी जटिल-मूल्य विस्तार के आधार पर समय-आवृत्ति विश्लेषण गैबोर फ़िल्टर के रूप में अस्थायी संकेत के अनिवार्य रूप से समान परिवर्तनों को पकड़ना संभव बनाता है, और जैसा कि हाइजेनबर्ग समूह द्वारा वर्णित किया जा सकता है (अधिक जानकारी के लिए देखें।)।

छवियों से सुविधाओं का निष्कर्षण
विभिन्न आवृत्तियों और अभिविन्यासों के साथ गैबोर फ़िल्टर का सेट किसी छवि से उपयोगी सुविधाएँ निकालने में सहायक हो सकता है। असतत डोमेन में, द्वि-आयामी गैबर फ़िल्टर दिए गए हैं,
 * $$G_c[i,j] = B e^{-\frac{(i^2+j^2)}{2\sigma^2}} \cos(2\pi f(i\cos\theta+j\sin\theta))$$
 * $$G_s[i,j] = C e^{-\frac{(i^2+j^2)}{2\sigma^2}} \sin(2\pi f(i\cos\theta+j\sin\theta))$$

जहां B और C निर्धारित किए जाने वाले सामान्यीकरण कारक हैं।

2D गैबर फिल्टर का छवि प्रसंस्करण में समृद्ध अनुप्रयोग है, विशेष रूप से बनावट विश्लेषण और विभाजन के लिए फीचर निष्कर्षण में समृद्ध अनुप्रयोग है। बनावट में खोजी जा रही आवृत्ति को $$f$$ परिभाषित करता है। $$\theta$$ को भिन्न-भिन्न करके, हम किसी विशेष दिशा में उन्मुख बनावट की तलाश कर सकते हैं। $$\sigma$$ को भिन्न-भिन्न करके, हम विश्लेषण किए जा रहे छवि क्षेत्र के आधार या आकार का समर्थन बदलते हैं।

छवि प्रसंस्करण में 2D गैबोर फिल्टर का अनुप्रयोग
डाक्यूमेंटेशन छवि प्रसंस्करण में, गैबोर सुविधाएँ बहुभाषी डाक्यूमेंटेशन में किसी शब्द की लिपि की पहचान करने के लिए आदर्श हैं। विभिन्न आवृत्तियों और विभिन्न दिशाओं में अभिविन्यास वाले गैबर फ़िल्टर का उपयोग जटिल डाक्यूमेंटेशन छवियों (ग्रे और रंग दोनों) से केवल-पाठ क्षेत्रों को स्थानीयकृत करने और निकालने के लिए किया गया है, क्योंकि पाठ उच्च आवृत्ति घटकों में समृद्ध है, जबकि चित्र प्रकृति में अपेक्षाकृत चिकनी हैं।  इसे चेहरे की अभिव्यक्ति पहचानने के लिए भी प्रयुक्त किया गया है।

पैटर्न विश्लेषण अनुप्रयोगों में गैबोर फिल्टर का भी व्यापक रूप से उपयोग किया गया है। उदाहरण के लिए, इसका उपयोग कशेरुक स्तंभ में छिद्रपूर्ण स्पंजी ट्रैब्युलर हड्डी के अंदर दिशात्मक वितरण का अध्ययन करने के लिए किया गया है। गैबोर स्पेस ऑप्टिकल कैरेक्टर मान्यता, आईरिस पहचान और फिंगरप्रिंट पहचान जैसे इमेज प्रोसेसिंग अनुप्रयोगों में बहुत उपयोगी है। किसी छवि में वस्तुओं के बीच किसी विशिष्ट स्थानिक स्थान के लिए सक्रियता के बीच संबंध बहुत विशिष्ट होते हैं। इसके अतिरिक्त, विरल वस्तु प्रतिनिधित्व बनाने के लिए गैबोर स्पेस से महत्वपूर्ण सक्रियण निकाले जा सकते हैं।

उदाहरण कार्यान्वयन
यह पायथन (प्रोग्रामिंग लैंग्वेज) में उदाहरण कार्यान्वयन है:

छवियों पर कार्यान्वयन के लिए, देखें।

यह एमएटीएलएबी/जीएनयू ऑक्टेव में उदाहरण कार्यान्वयन है:

एमएटीएलएबी में छवियों से गैबोर सुविधा निष्कर्षण के लिए कोड http://www.mathworks.com/matlabcentral/fileexchange/44630 पर पाया जा सकता है।

यह हास्केल (प्रोग्रामिंग लैंग्वेज) में कार्यान्वयन का एक और उदाहरण है:

यह भी देखें

 * गैबोर परिवर्तन
 * गैबोर वेवलेट
 * गैबर परमाणु
 * गैबोर फ़िल्टर लॉग करें

बाहरी संबंध

 * MATLAB code for Gabor filters and Gabor feature extraction
 * 3D Gabor demonstrated with Mathematica
 * python implementation of log-Gabors for still images
 * Gabor filter for image processing and computer vision (demonstration)

अग्रिम पठन

 * Steerable Pyramids:
 * Eero Simoncelli's page on Steerable Pyramids
 * (PDF ) (Code)
 * Steerable Pyramids:
 * Eero Simoncelli's page on Steerable Pyramids
 * (PDF ) (Code)
 * Steerable Pyramids:
 * Eero Simoncelli's page on Steerable Pyramids
 * (PDF ) (Code)