संकुचन क्षेत्र (छवि पुनर्स्थापना): Difference between revisions

Revision as of 10:08, 14 December 2023

संकुचन क्षेत्र एक यादृच्छिक क्षेत्र-आधारित मशीन लर्निंग तकनीक है जिसका उद्देश्य कम कम्प्यूटेशनल ओवरहेड का उपयोग करके उच्च गुणवत्ता वाली छवि पुनर्स्थापना (डीनोइजिंग और डीब्लरिंग) करना है।

विधि

पुनर्स्थापित छवि $x$ का अनुमान नमूना छवियों $S$ के एक सेट पर प्रशिक्षण के बाद एक दूषित अवलोकन $y$ से लगाया गया है।

एक संकुचन (मैपिंग) फ़ंक्शन ${f}_{{\pi }_{i}}\left(v\right)={\sum }_{j=1}^{M}{\pi }_{i,j}\exp \left(-{\frac {\gamma }{2}}{\left(v-{\mu }_{j}\right)}^{2}\right)$ को सीधे रेडियल आधार फ़ंक्शन कर्नेल के रैखिक संयोजन के रूप में तैयार किया गया है, जहां $\gamma$ साझा सटीक पैरामीटर है, $\mu$ (समदूरस्थ) कर्नेल स्थिति को दर्शाता है, और M गाऊसी कर्नेल की संख्या है।

क्योंकि संकुचन फ़ंक्शन को सीधे मॉडल किया गया है, अनुकूलन प्रक्रिया प्रति पुनरावृत्ति एकल द्विघात न्यूनतमकरण तक कम हो जाती है, जिसे सिकुड़न क्षेत्र की भविष्यवाणी के रूप में दर्शाया जाता है ${g}_{\mathrm {\Theta } }\left({\text{x}}\right)={\mathcal {F}}^{-1}\left\lbrack {\frac {{\mathcal {F}}\left(\lambda {K}^{T}y+{\sum }_{i=1}^{N}{F}_{i}^{T}{f}_{{\pi }_{i}}\left({F}_{i}x\right)\right)}{\lambda {\check {K}}^{\text{*}}\circ {\check {K}}+{\sum }_{i=1}^{N}{\check {F}}_{i}^{\text{*}}\circ {\check {F}}_{i}}}\right\rbrack ={\mathrm {\Omega } }^{-1}\eta$ जहां ${\mathcal {F}}$ असतत फूरियर रूपांतरण को दर्शाता है और $F_{x}$ 2D है बिंदु प्रसार फ़ंक्शन फ़िल्टर के साथ कनवल्शन ${\text{f}}\otimes {\text{x}}$ ${\breve {F}}$ एक ऑप्टिकल ट्रांसफर फ़ंक्शन है जिसे ${\text{f}}$ के असतत फूरियर रूपांतरण के रूप में परिभाषित किया गया है, और ${\breve {F}}^{\text{*}}$ ${\breve {F}}$ का जटिल संयुग्म है।

${\hat {x}}_{t}$ के रूप में सीखा जाता है ${\hat {x}}_{t}={g}_{{\mathrm {\Theta } }_{t}}\left({\hat {x}}_{t-1}\right)$ प्रत्येक पुनरावृत्ति के लिए $t$ प्रारंभिक मामले के साथ ${\hat {x}}_{0}=y$ , यह गाऊसी सशर्त यादृच्छिक क्षेत्रों (या संकुचन क्षेत्रों (सीएसएफ) का झरना) का एक झरना बनाता है। हानि-न्यूनीकरण का उपयोग मॉडल मापदंडों को सीखने के लिए किया जाता है ${\mathrm {\Theta } }_{t}={\left\lbrace {\lambda }_{t},{\pi }_{\mathit {ti}},{f}_{\mathit {ti}}\right\rbrace }_{i=1}^{N}$ .

सीखने के उद्देश्य फ़ंक्शन को इस प्रकार परिभाषित किया गया है $J\left({\mathrm {\Theta } }_{t}\right)={\sum }_{s=1}^{S}l\left({\hat {x}}_{t}^{\left(s\right)};{x}_{gt}^{\left(s\right)}\right)$ , कहाँ $l$ वर्गीकरण के लिए एक भिन्न फ़ंक्शन हानि फ़ंक्शन है जिसे प्रशिक्षण डेटा का उपयोग करके लालच से कम किया जाता है ${\left\lbrace {x}_{gt}^{\left(s\right)},{y}^{\left(s\right)},{k}^{\left(s\right)}\right\rbrace }_{s=1}^{S}$ और ${\hat {x}}_{t}^{\left(s\right)}$ .

प्रदर्शन

लेखक द्वारा प्रारंभिक परीक्षणों से पता चलता है कि आर.टी.एफ₅^[1] की तुलना में थोड़ा बेहतर प्रदर्शन प्रदर्शन प्राप्त करता है ${\text{CSF}}_{7\times 7}^{\left\lbrace \mathrm {3,4,5} \right\rbrace }$ , के बाद ${\text{CSF}}_{5\times 5}^{5}$ , ${\text{CSF}}_{7\times 7}^{2}$ , ${\text{CSF}}_{5\times 5}^{\left\lbrace \mathrm {3,4} \right\rbrace }$ , और ब्लॉक-मिलान और 3डी फ़िल्टरिंग।

ब्लॉक-मैचिंग और 3डी फ़िल्टरिंग डीनोइज़िंग गति के बीच में आती है ${\text{CSF}}_{5\times 5}^{4}$ और ${\text{CSF}}_{7\times 7}^{4}$ , आरटीएफ परिमाण का क्रम धीमा है।

लाभ

परिणाम ब्लॉक-मैचिंग और 3डी फ़िल्टरिंग द्वारा प्राप्त परिणामों से तुलनीय हैं (2007 में इसकी स्थापना के बाद से अत्याधुनिक डीनोइज़िंग में संदर्भ)
अन्य उच्च-प्रदर्शन विधियों की तुलना में न्यूनतम रनटाइम (संभवतः एम्बेडेड उपकरणों के भीतर लागू)
समानांतरीकरण योग्य (जैसे: संभावित जीपीयू कार्यान्वयन)
पूर्वानुमेयता: $O(D\log D)$ रनटाइम कहां $D$ पिक्सेल की संख्या है
सीपीयू के साथ भी तेज प्रशिक्षण

कार्यान्वयन

एक संदर्भ कार्यान्वयन MATLAB में लिखा गया है और BSD 2-क्लॉज लाइसेंस के तहत जारी किया गया है: संकुचन-फील्ड्स

यह भी देखें

यादृच्छिक क्षेत्र
असतत फूरियर रूपांतरण
कनवल्शन
शोर में कमी
धुंधलापन

संदर्भ

↑ Jancsary, Jeremy; Nowozin, Sebastian; Sharp, Toby; Rother, Carsten (10 April 2012). Regression Tree Fields – An Efficient, Non-parametric Approach to Image Labeling Problems. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA: IEEE Computer Society. doi:10.1109/CVPR.2012.6247950.

Schmidt, Uwe; Roth, Stefan (2014). Shrinkage Fields for Effective Image Restoration (PDF). Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on. Columbus, OH, USA: IEEE. doi:10.1109/CVPR.2014.349. ISBN 978-1-4799-5118-5.

[1] Jancsary, Jeremy; Nowozin, Sebastian; Sharp, Toby; Rother, Carsten (10 April 2012). Regression Tree Fields – An Efficient, Non-parametric Approach to Image Labeling Problems. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA: IEEE Computer Society. doi:10.1109/CVPR.2012.6247950.

[1]

@@ Line 1: / Line 1: @@
-श्रिंकेज फ़ील्ड एक यादृच्छिक फ़ील्ड-आधारित [[ यंत्र अधिगम ]] तकनीक है जिसका उद्देश्य कम कम्प्यूटेशनल ओवरहेड का उपयोग करके उच्च गुणवत्ता वाली [[छवि बहाली]] ([[निंदा करना]] और [[ धुंधला करना ]]) करना है।
+'''संकुचन क्षेत्र''' एक यादृच्छिक क्षेत्र-आधारित मशीन लर्निंग तकनीक है जिसका उद्देश्य कम कम्प्यूटेशनल ओवरहेड का उपयोग करके उच्च गुणवत्ता वाली छवि पुनर्स्थापना (डीनोइजिंग और डीब्लरिंग) करना है।
 == विधि ==
-पुनर्स्थापित छवि <math>x</math> एक दूषित अवलोकन से भविष्यवाणी की गई है <math>y</math> नमूना छवियों के एक सेट पर प्रशिक्षण के बाद <math>S</math>.
+पुनर्स्थापित छवि <math>x</math> का अनुमान नमूना छवियों <math>S</math> के एक सेट पर प्रशिक्षण के बाद एक दूषित अवलोकन <math>y</math> से लगाया गया है।
-एक सिकुड़न (मैपिंग) फ़ंक्शन <math>{f}_{{\pi }_{i}}\left(v\right)={\sum }_{j=1}^{M}{\pi }_{i,j}\exp \left(-\frac{\gamma }{2}{\left(v-{\mu }_{j}\right)}^{2}\right)</math> इसे सीधे [[रेडियल आधार फ़ंक्शन कर्नेल]] के रैखिक संयोजन के रूप में तैयार किया गया है, जहां <math>\gamma </math> साझा परिशुद्धता पैरामीटर है, <math>\mu </math> (समदूरस्थ) कर्नेल स्थिति को दर्शाता है, और एम गॉसियन कर्नेल की संख्या है।
+एक संकुचन (मैपिंग) फ़ंक्शन <math>{f}_{{\pi }_{i}}\left(v\right)={\sum }_{j=1}^{M}{\pi }_{i,j}\exp \left(-\frac{\gamma }{2}{\left(v-{\mu }_{j}\right)}^{2}\right)</math> को सीधे रेडियल आधार फ़ंक्शन कर्नेल के रैखिक संयोजन के रूप में तैयार किया गया है, जहां <math>\gamma </math> साझा सटीक पैरामीटर है, <math>\mu </math> (समदूरस्थ) कर्नेल स्थिति को दर्शाता है, और M गाऊसी कर्नेल की संख्या है।
-क्योंकि सिकुड़न फ़ंक्शन को सीधे मॉडल किया गया है, अनुकूलन प्रक्रिया प्रति पुनरावृत्ति एकल द्विघात न्यूनतमकरण तक कम हो जाती है, जिसे सिकुड़न क्षेत्र की भविष्यवाणी के रूप में दर्शाया जाता है। <math>{g}_{\mathrm{\Theta }}\left(\text{x}\right)={\mathcal{F}}^{-1}\left\lbrack \frac{\mathcal{F}\left(\lambda {K}^{T}y+{\sum }_{i=1}^{N}{F}_{i}^{T}{f}_{{\pi }_{i}}\left({F}_{i}x\right)\right)}{\lambda {\check{K}}^{\text{*}}\circ \check{K}+{\sum }_{i=1}^{N}{\check{F}}_{i}^{\text{*}}\circ {\check{F}}_{i}}\right\rbrack ={\mathrm{\Omega }}^{-1}\eta </math> कहाँ <math>\mathcal{F}</math> [[असतत फूरियर रूपांतरण]] को दर्शाता है और <math>F_x</math> 2D कनवल्शन है <math>\text{f}\otimes \text{x}</math> [[बिंदु प्रसार फ़ंक्शन]] फ़िल्टर के साथ, <math>\breve{F}</math> एक ऑप्टिकल ट्रांसफर फ़ंक्शन है जिसे असतत फूरियर रूपांतरण के रूप में परिभाषित किया गया है <math>\text{f}</math>, और <math>{\breve{F}}^{\text{*}}</math> का जटिल संयुग्म है <math>\breve{F}</math>.
+क्योंकि संकुचन फ़ंक्शन को सीधे मॉडल किया गया है, अनुकूलन प्रक्रिया प्रति पुनरावृत्ति एकल द्विघात न्यूनतमकरण तक कम हो जाती है, जिसे सिकुड़न क्षेत्र की भविष्यवाणी के रूप में दर्शाया जाता है <math>{g}_{\mathrm{\Theta }}\left(\text{x}\right)={\mathcal{F}}^{-1}\left\lbrack \frac{\mathcal{F}\left(\lambda {K}^{T}y+{\sum }_{i=1}^{N}{F}_{i}^{T}{f}_{{\pi }_{i}}\left({F}_{i}x\right)\right)}{\lambda {\check{K}}^{\text{*}}\circ \check{K}+{\sum }_{i=1}^{N}{\check{F}}_{i}^{\text{*}}\circ {\check{F}}_{i}}\right\rbrack ={\mathrm{\Omega }}^{-1}\eta </math> जहां <math>\mathcal{F}</math> असतत फूरियर रूपांतरण को दर्शाता है और <math>F_x</math> 2D है बिंदु प्रसार फ़ंक्शन फ़िल्टर के साथ कनवल्शन <math>\text{f}\otimes \text{x}</math>  <math>\breve{F}</math> एक ऑप्टिकल ट्रांसफर फ़ंक्शन है जिसे <math>\text{f}</math> के असतत फूरियर रूपांतरण के रूप में परिभाषित किया गया है, और <math>{\breve{F}}^{\text{*}}</math><math>\breve{F}</math> का जटिल संयुग्म है।
-<math>{\hat{x}}_{t}</math> के रूप में सीखा जाता है <math>{\hat{x}}_{t}={g}_{{\mathrm{\Theta }}_{t}}\left({\hat{x}}_{t-1}\right)</math> प्रत्येक पुनरावृत्ति के लिए <math>t</math> प्रारंभिक मामले के साथ <math>{\hat{x}}_{0}=y</math>, यह गाऊसी [[सशर्त यादृच्छिक क्षेत्र]]ों (या सिकुड़न क्षेत्रों (सीएसएफ) का झरना) का एक झरना बनाता है। हानि-न्यूनीकरण का उपयोग मॉडल मापदंडों को सीखने के लिए किया जाता है <math>{\mathrm{\Theta }}_{t}={\left\lbrace {\lambda }_{t},{\pi }_{\mathit{ti}},{f}_{\mathit{ti}}\right\rbrace }_{i=1}^{N}</math>.
+<math>{\hat{x}}_{t}</math> के रूप में सीखा जाता है <math>{\hat{x}}_{t}={g}_{{\mathrm{\Theta }}_{t}}\left({\hat{x}}_{t-1}\right)</math> प्रत्येक पुनरावृत्ति के लिए <math>t</math> प्रारंभिक मामले के साथ <math>{\hat{x}}_{0}=y</math>, यह गाऊसी [[सशर्त यादृच्छिक क्षेत्र]]ों (या संकुचन क्षेत्रों (सीएसएफ) का झरना) का एक झरना बनाता है। हानि-न्यूनीकरण का उपयोग मॉडल मापदंडों को सीखने के लिए किया जाता है <math>{\mathrm{\Theta }}_{t}={\left\lbrace {\lambda }_{t},{\pi }_{\mathit{ti}},{f}_{\mathit{ti}}\right\rbrace }_{i=1}^{N}</math>.
 सीखने के उद्देश्य फ़ंक्शन को इस प्रकार परिभाषित किया गया है <math>J\left({\mathrm{\Theta }}_{t}\right)={\sum }_{s=1}^{S}l\left({\hat{x}}_{t}^{\left(s\right)};{x}_{gt}^{\left(s\right)}\right)</math>, कहाँ <math>l</math> वर्गीकरण के लिए एक भिन्न फ़ंक्शन हानि फ़ंक्शन है जिसे प्रशिक्षण डेटा का उपयोग करके लालच से कम किया जाता है <math>{\left\lbrace {x}_{gt}^{\left(s\right)},{y}^{\left(s\right)},{k}^{\left(s\right)}\right\rbrace }_{s=1}^{S}</math> और <math>{\hat{x}}_{t}^{\left(s\right)}</math>.
@@ Line 27: / Line 28: @@
 == कार्यान्वयन ==
-* एक संदर्भ कार्यान्वयन [[MATLAB]] में लिखा गया है और BSD 2-क्लॉज लाइसेंस के तहत जारी किया गया है: [https://github.com/uschmidt83/shlinkage-fields सिकुड़न-फील्ड्स]
+* एक संदर्भ कार्यान्वयन [[MATLAB]] में लिखा गया है और BSD 2-क्लॉज लाइसेंस के तहत जारी किया गया है: [https://github.com/uschmidt83/shlinkage-fields संकुचन-फील्ड्स]
 == यह भी देखें ==

Anonymous

Search

संकुचन क्षेत्र (छवि पुनर्स्थापना): Difference between revisions

Namespaces

More

Page actions

Revision as of 10:08, 14 December 2023

Contents

विधि

प्रदर्शन

लाभ

कार्यान्वयन

यह भी देखें

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

संकुचन क्षेत्र (छवि पुनर्स्थापना): Difference between revisions

Revision as of 10:08, 14 December 2023

विधि

प्रदर्शन

लाभ

कार्यान्वयन

यह भी देखें

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Categories