कर्नेल रिग्रेशन

आंकड़ों में, कर्नेल प्रतिगमन यादृच्छिक वैरीएबल की नियमबद्ध अपेक्षा का अनुमान लगाने के लिए गैर पैरामीट्रिक तकनीक है। इस प्रकार इसका उद्देश्य यादृच्छिक वैरीएबल X और Y की जोड़ी के बीच गैर-रैखिक संबंध खोजना है।

किसी भी गैरपैरामीट्रिक प्रतिगमन में, एक वैरीएबल $$Y$$ के सापेक्ष एक वैरीएबल $$X$$ की नियमबद्ध अपेक्षा लिखी जा सकती है:


 * $$\operatorname{E}(Y \mid X) = m(X)$$

जहाँ $$m$$ अज्ञात फ़ंक्शन है.

नादारया-वाटसन कर्नेल प्रतिगमन
1964 में नदारया और जेफ्री वॉटसन दोनों ने वेटिंग फ़ंक्शन के रूप में कर्नेल (सांख्यिकी) का उपयोग करके स्थानीय रूप से भारित औसत के रूप में $$m$$ का अनुमान लगाने का प्रस्ताव रखा था।  नादारया-वाटसन अनुमानक है:


 * $$ \widehat{m}_h(x)=\frac{\sum_{i=1}^n K_h(x-x_i) y_i}{\sum_{i=1}^nK_h(x-x_i)}

$$ जहां $$K_h(t) = \frac{1}{h}K\left(\frac{t}{h}\right)$$ एक बैंडविड्थ $$h$$ वाला कर्नेल है जैसे कि $$K(\cdot)$$ कम से कम 1 क्रम का है, अर्थात $$\int_{-\infty}^{\infty}u K(u) du = 0$$

व्युत्पत्ति


\operatorname{E}(Y \mid X=x) = \int y f(y\mid x) \, dy = \int y \frac{f(x,y)}{f(x)} \, dy $$ कर्नेल 'K' के साथ संयुक्त वितरण f(x,y) और f(x) के लिए कर्नेल घनत्व अनुमान का उपयोग करना है,



\hat{f}(x,y) = \frac{1}{n}\sum_{i=1}^n K_h(x-x_i) K_h(y-y_i), $$

\hat{f}(x) = \frac{1}{n} \sum_{i=1}^n K_h(x-x_i), $$ हम पाते हैं



\begin{align} \operatorname{\hat E}(Y \mid X=x) &= \int \frac{y \sum_{i=1}^n K_h(x-x_i) K_h(y-y_i)}{\sum_{j=1}^n K_h(x-x_j)} \,dy,\\[6pt] &= \frac{\sum_{i=1}^n K_h(x-x_i) \int y \, K_h(y-y_i) \,dy}{\sum_{j=1}^n K_h(x-x_j)},\\[6pt] &= \frac{\sum_{i=1}^n K_h(x-x_i) y_i}{\sum_{j=1}^n K_h(x-x_j)}, \end{align} $$ जो नादारया-वाटसन अनुमानक है।

प्रीस्टली-चाओ कर्नेल अनुमानक


\widehat{m}_{PC}(x) = h^{-1} \sum_{i=2}^n (x_i - x_{i-1}) K\left(\frac{x-x_i}{h}\right) y_i $$ जहाँ $$ h $$ बैंडविड्थ (या स्मूथिंग मापदंड) है।

गैसर-मुलर कर्नेल अनुमानक


\widehat{m}_{GM}(x) = h^{-1} \sum_{i=1}^n \left[\int_{s_{i-1}}^{s_i} K\left(\frac{x-u}{h}\right) \, du\right] y_i $$ जहाँ $$s_i = \frac{x_{i-1} + x_i}{2}.$$

उदाहरण
यह उदाहरण कनाडाई क्रॉस-सेक्शन वेतन डेटा पर आधारित है जिसमें सामान्य शिक्षा (ग्रेड 13) वाले पुरुष व्यक्तियों के लिए 1971 की कनाडाई जनगणना सार्वजनिक उपयोग टेप से लिया गया यादृच्छिक नमूना सम्मिलित है। कुल 205 अवलोकन हैं।

दाईं ओर का आंकड़ा स्पर्शोन्मुख परिवर्तनशीलता सीमा के साथ दूसरे क्रम के गॉसियन कर्नेल का उपयोग करके अनुमानित प्रतिगमन फ़ंक्शन को दर्शाता है।

उदाहरण के लिए स्क्रिप्ट
R प्रोग्रामिंग लैंग्वेज के निम्नलिखित कमांड का उपयोग करते हैं अधिकांशतः स्मूथिंग प्रदान करने और ऊपर दिए गए चित्र को बनाने का कार्य इन कमांड को कमांड प्रॉम्प्ट पर कट और पेस्ट के माध्यम से अंकित किया जा सकता है।

संबंधित
डेविड साल्सबर्ग के अनुसार, कर्नेल रिग्रेशन में उपयोग किए जाने वाले एल्गोरिदम स्वतंत्र रूप से विकसित किए गए थे और फजी सिस्टम में उपयोग किए गए थे: इस प्रकार पूर्णतः समान कंप्यूटर एल्गोरिदम के साथ, फ़ज़ी सिस्टम और कर्नेल घनत्व-आधारित रिग्रेशन दूसरे से पूरी तरह से स्वतंत्र रूप से विकसित किए गए प्रतीत होते हैं।

सांख्यिकीय कार्यान्वयन

 * जीएनयू ऑक्टेव गणितीय प्रोग्राम पैकेज
 * जूलिया (प्रोग्रामिंग लैंग्वेज): KernelEstimator.jl
 * मैटलैब: कर्नेल रिग्रेशन, कर्नेल घनत्व अनुमान, हैजर्ड फ़ंक्शन के कर्नेल अनुमान और कई अन्य के कार्यान्वयन के साथ मुफ्त मैटलैब टूलबॉक्स इन पृष्ठों पर उपलब्ध है (यह टूलबॉक्स पुस्तक का भाग है) ).
 * पायथन (प्रोग्रामिंग लैंग्वेज): द  मिश्रित डेटा प्रकारों के लिए वर्ग   उप-पैकेज (अन्य कर्नेल घनत्व से संबंधित वर्ग सम्मिलित हैं), पैकेज  स्किकिट-लर्न के विस्तार के रूप में (अक्षम मेमोरी-वार, केवल छोटे डेटासेट के लिए उपयोगी)
 * आर (प्रोग्रामिंग लैंग्वेज): फ़ंक्शन  एनपी पैकेज कर्नेल रिग्रेशन निष्पादित कर सकता है।
 * Stata: : npregress, kernreg2

यह भी देखें

 * गिरी चिकनी
 * स्थानीय प्रतिगमन

संदर्भ
== अग्रिम पठन                                                                                                                                                                                                                                    == == बाहरी संबंध                                                                                                                                                                                                                                ==
 * Scale-adaptive kernel regression (with मैटलैब software).
 * Tutorial of Kernel regression using spreadsheet (with Microsoft Excel).
 * An online kernel regression demonstration Requires .NET 3.0 or later.
 * Kernel regression with automatic bandwidth selection (with Python)