गैरपैरामीट्रिक प्रतिगमन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(20 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Category of regression analysis}}
{{Short description|Category of regression analysis}}
{{Regression bar}}
{{Regression bar}}
गैरपैरामीट्रिक प्रतिगमन, प्रतिगमन विश्लेषण की श्रेणी होती है जिसमें भविष्यवक्ता को पूर्व निर्धारित रूप से नहीं लिया जाता है किंतु डेटा से प्राप्त जानकारी के अनुसार निर्मित होता है। अर्थात्, भविष्यवक्ताओं और आश्रित चर के मध्य संबंध के लिए कोई पैरामीट्रिक रूप नहीं माना जाता है। गैर-पैरामीट्रिक प्रतिगमन के लिए [[पैरामीट्रिक मॉडल]] पर आधारित प्रतिगमन की तुलना में बड़े नमूना आकार की आवश्यकता होती है क्योंकि डेटा को मॉडल संरचना के साथ-साथ मॉडल के अनुमान को भी प्रदान करना चाहिए।
'''गैरपैरामीट्रिक प्रतिगमन''', प्रतिगमन विश्लेषण की श्रेणी है जिसमें भविष्यवक्ता को पूर्व निर्धारित रूप से नहीं लेता है किंतु डेटा से प्राप्त जानकारी के अनुसार निर्मित होता है। अर्थात्, भविष्यवक्ताओं और आश्रित चर के मध्य संबंध के लिए कोई पैरामीट्रिक रूप नहीं माना जाता है। गैर-पैरामीट्रिक प्रतिगमन के लिए [[पैरामीट्रिक मॉडल]] पर आधारित प्रतिगमन की तुलना में बड़े नमूना आकार की आवश्यकता होती है क्योंकि डेटा को मॉडल संरचना के साथ-साथ मॉडल अनुमान भी प्रदान करना चाहिए।


== परिभाषा ==
== परिभाषा ==
Line 10: Line 10:
जहाँ <math>m(x)</math> कुछ नियतात्मक फलन है। रैखिक प्रतिगमन गैरपैरामीट्रिक प्रतिगमन का प्रतिबंधित स्थिति होती है जहां <math>m(x)</math> को एफ़िन माना जाता है।
जहाँ <math>m(x)</math> कुछ नियतात्मक फलन है। रैखिक प्रतिगमन गैरपैरामीट्रिक प्रतिगमन का प्रतिबंधित स्थिति होती है जहां <math>m(x)</math> को एफ़िन माना जाता है।


कुछ लेखक योगात्मक ध्वनि की थोड़ी शक्तिशाली धारणा का उपयोग करते हैं:
कुछ लेखक योगात्मक ध्वनि की धीमी सशक्त धारणा का उपयोग करते हैं:
:<math>
:<math>
Y = m(X) + U,
Y = m(X) + U,
Line 16: Line 16:
जहां यादृच्छिक चर <math>U</math> 'ध्वनि शब्द' है, जिसका माध्य 0 होता है।
जहां यादृच्छिक चर <math>U</math> 'ध्वनि शब्द' है, जिसका माध्य 0 होता है।


इस धारणा के बिना कि <math>m</math> कार्यों के विशिष्ट पैरामीट्रिक परिवार से संबंधित होती है, <math>m</math> के लिए निष्पक्ष अनुमान प्राप्त करना असंभव होता है, चूंकि अधिकांश अनुमानक उपयुक्त परिस्थितियों में सुसंगत किया जाता हैं।
इस धारणा के बिना कि <math>m</math> कार्यों के विशिष्ट पैरामीट्रिक वर्ग से संबंधित है, <math>m</math> के लिए निष्पक्ष अनुमान प्राप्त करना असंभव होता है, चूंकि अधिकांश अनुमानक उपयुक्त परिस्थितियों में सुसंगत हैं।


== सामान्य प्रयोजन गैरपैरामीट्रिक प्रतिगमन कलन विधि की सूची ==
== सामान्य प्रयोजन गैरपैरामीट्रिक प्रतिगमन कलन विधि की सूची ==
यह प्रतिगमन के लिए गैर-पैरामीट्रिक मॉडल की गैर-विस्तृत सूची होता है।
यह प्रतिगमन के लिए गैर-पैरामीट्रिक मॉडल की गैर-विस्तृत सूची है।


* निकटतम निकटतम , निकटतम-निकटतम इंटरपोलेशन और [[के-निकटतम पड़ोसी एल्गोरिदम|के-निकटतम निकटतम एल्गोरिदम]] देखें
* निकटतम निकटतम , निकटतम-निकटतम इंटरपोलेशन और [[के-निकटतम पड़ोसी एल्गोरिदम|के-निकटतम निकटतम एल्गोरिदम]] देखें
* [[प्रतिगमन वृक्ष]]
* [[प्रतिगमन वृक्ष|प्रतिगमन ट्री]]
* [[कर्नेल प्रतिगमन]]
* [[कर्नेल प्रतिगमन|मूल प्रतिगमन]]
* [[स्थानीय प्रतिगमन]]
* [[स्थानीय प्रतिगमन]]
* [[बहुभिन्नरूपी अनुकूली प्रतिगमन विभाजन]]
* [[बहुभिन्नरूपी अनुकूली प्रतिगमन विभाजन]]
* तख़्ता को चौरसाई करना
* विभाजन को समरेखण
* [[तंत्रिका - तंत्र]] <ref>Statistical and neural network techniques for nonparametric regression by Vladimir Cherkassky, Filip Mulier https://link.springer.com/chapter/10.1007/978-1-4612-2660-4_39</ref>
* [[तंत्रिका - तंत्र]] <ref>Statistical and neural network techniques for nonparametric regression by Vladimir Cherkassky, Filip Mulier https://link.springer.com/chapter/10.1007/978-1-4612-2660-4_39</ref>


Line 32: Line 32:
== उदाहरण ==
== उदाहरण ==


=== गाऊसी प्रक्रिया प्रतिगमन या क्रिगिंग ===
=== गॉसियन प्रक्रिया प्रतिगमन या क्रिगिंग ===
{{Main|गाऊसी प्रक्रिया प्रतिगमन}}
{{Main|गॉसियन प्रक्रिया प्रतिगमन}}
गाऊसी प्रक्रिया प्रतिगमन में, जिसे क्रिगिंग के रूप में भी जाना जाता है, प्रतिगमन वक्र के लिए गाऊसी पूर्व माना जाता है। त्रुटियों को [[बहुभिन्नरूपी सामान्य वितरण]] माना जाता है और प्रतिगमन वक्र का अनुमान इसके पश्च विधि से लगाया जाता है। गॉसियन पूर्व अज्ञात हाइपरपैरामीटर पर निर्भर हो सकता है, जिसका अनुमान सामान्यतः अनुभवजन्य बेज़ के माध्यम से लगाया जाता है।


हाइपरपैरामीटर सामान्यतः पूर्व सहप्रसरण कर्नेल निर्दिष्ट किया करते हैं। यदि कर्नेल को डेटा से गैर-पैरामीट्रिक रूप से भी अनुमान लगाया जाना चाहिए, तब महत्वपूर्ण फ़िल्टर का उपयोग किया जा सकता है।
गॉसियन प्रक्रिया प्रतिगमन में, जिसे क्रिगिंग के रूप में भी जाना जाता है, प्रतिगमन वक्र के लिए गॉसियन को पूर्व माना जाता है। त्रुटियों को [[बहुभिन्नरूपी सामान्य वितरण]] माना जाता है और प्रतिगमन वक्र का अनुमान इसके पश्च विधा से लगाया जाता है। गॉसियन पूर्व अज्ञात हाइपरपैरामीटर पर निर्भर हो सकता है, जिसका अनुमान सामान्यतः अनुभवजन्य बेज़ के माध्यम से लगाया जाता है।


[[स्प्लिन को चौरसाई करना]] की व्याख्या गॉसियन प्रक्रिया प्रतिगमन के पश्च विधि के रूप में की जाती है।
हाइपरपैरामीटर सामान्यतः पूर्व सहप्रसरण मूल निर्दिष्ट करते हैं। यदि मूल को डेटा से गैर-पैरामीट्रिक रूप से भी अनुमान लगाया जाना चाहिए, तब महत्वपूर्ण निस्पंदन का उपयोग किया जा सकता है।


=== कर्नेल प्रतिगमन ===
[[स्प्लिन को चौरसाई करना|समरेखण विभाजन]] की व्याख्या गॉसियन प्रक्रिया प्रतिगमन के पश्च विधा के रूप में की जाती है।
{{Main|कर्नेल प्रतिगमन}}
[[File:NonparRegrGaussianKernel.png|thumb| गॉसियन कर्नेल स्मूथ का उपयोग करके गैर-पैरामीट्रिक प्रतिगमन के साथ छोटे डेटा समुच्चय (काले बिंदु) पर फिट होने वाले वक्र (लाल रेखा) का उदाहरण बताया जाता है। गुलाबी छायांकित क्षेत्र x के दिए गए मान के लिए y का अनुमान प्राप्त करने के लिए क्रियान्वित कर्नेल फलन को दर्शाता जाता है। कर्नेल फलन लक्ष्य बिंदु के लिए अनुमान तैयार करने में प्रत्येक डेटा बिंदु को दिए गए वजन को परिभाषित करता है।]]कर्नेल प्रतिगमन डेटा बिंदुओं के स्थानों को [[कर्नेल फ़ंक्शन|कर्नेल फलन]] के साथ जोड़कर डेटा बिंदुओं के सीमित समुच्चय से निरंतर निर्भर चर का अनुमान लगाता है - लगभग बोलते हुए, कर्नेल फलन निर्दिष्ट किया करता है कि डेटा बिंदुओं के प्रभाव को "धुंधला" कैसे किया जाए जिससे उनके मान हो सकें आस-पास के स्थानों के लिए मूल्य की पूर्वकथन करने के लिए उपयोग किया जाता है।


=== प्रतिगमन पेड़ ===
=== मूल प्रतिगमन ===
{{Main|मूल प्रतिगमन}}
[[File:NonparRegrGaussianKernel.png|thumb| गॉसियन मूल स्मूथ का उपयोग करके गैर-पैरामीट्रिक प्रतिगमन के साथ छोटे डेटा समुच्चय (काले बिंदु) पर फिट होने वाले वक्र (लाल रेखा) का उदाहरण । गुलाबी छायांकित क्षेत्र एक्स के दिए गए मान के लिए वाई का अनुमान प्राप्त करने के लिए क्रियान्वित मूल फलन को दर्शाया जाता है। मूल फलन लक्ष्य बिंदु के लिए अनुमान तैयार करने में प्रत्येक डेटा बिंदु को दिए गए वजन को परिभाषित करता है।]]मूल प्रतिगमन डेटा बिंदुओं के स्थानों को [[कर्नेल फ़ंक्शन|मूल फलन]] के साथ जोड़कर डेटा बिंदुओं के सीमित समुच्चय से निरंतर निर्भर चर का अनुमान लगाता है - लगभग बोलते हुए, मूल फलन निर्दिष्ट करता है कि डेटा बिंदुओं के प्रभाव को "धुंधला" कैसे किया जाए जिससे उनके मान हो सकें आस-पास के स्थानों के लिए मूल्य की भविष्यवाणी करने के लिए उपयोग किया जाता है।
 
=== प्रतिगमन ट्रीस ===
{{Main|निर्णय वृक्ष सीखना}}
{{Main|निर्णय वृक्ष सीखना}}


निर्णय वृक्ष शिक्षण एल्गोरिदम को डेटा से निर्भर चर की पूर्वकथन करना सीखने के लिए क्रियान्वित किया जा सकता है।<ref name="bfos">{{Cite book
निर्णय ट्री शिक्षण एल्गोरिदम को डेटा से निर्भर चर की पूर्वकथन करना सीखने के लिए क्रियान्वित किया जा सकता है।<ref name="bfos">{{Cite book
|last=Breiman
|last=Breiman
|first=Leo
|first=Leo
Line 56: Line 57:
|location=Monterey, CA
|location=Monterey, CA
|isbn=978-0-412-04841-8
|isbn=978-0-412-04841-8
}}</ref> यद्यपि मूल वर्गीकरण और प्रतिगमन वृक्ष (कार्ट) सूत्रीकरण केवल अविभाज्य डेटा की पूर्वकथन करने के लिए क्रियान्वित किया गया था, ढांचे का उपयोग समय श्रृंखला सहित बहुभिन्नरूपी डेटा की पूर्वकथन करने के लिए किया जा सकता है।<ref>{{Cite journal
}}</ref> यद्यपि मूल वर्गीकरण और प्रतिगमन ट्री (कार्ट) सूत्रीकरण केवल अविभाज्य डेटा की भविष्यवाणी करने के लिए क्रियान्वित किया गया था, रुपरेखा का उपयोग समय श्रृंखला सहित बहुभिन्नरूपी डेटा की भविष्यवाणी करने के लिए किया जा सकता है।<ref>{{Cite journal
  | last = Segal
  | last = Segal
  | first = M.R.
  | first = M.R.
Line 97: Line 98:


{{statistics}}
{{statistics}}
[[Category: गैरपैरामीट्रिक प्रतिगमन| गैरपैरामीट्रिक प्रतिगमन]]


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Collapse templates]]
[[Category:Commons category link from Wikidata]]
[[Category:Created On 07/07/2023]]
[[Category:Created On 07/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia metatemplates]]
[[Category:गैरपैरामीट्रिक प्रतिगमन| गैरपैरामीट्रिक प्रतिगमन]]

Latest revision as of 21:35, 15 July 2023

गैरपैरामीट्रिक प्रतिगमन, प्रतिगमन विश्लेषण की श्रेणी है जिसमें भविष्यवक्ता को पूर्व निर्धारित रूप से नहीं लेता है किंतु डेटा से प्राप्त जानकारी के अनुसार निर्मित होता है। अर्थात्, भविष्यवक्ताओं और आश्रित चर के मध्य संबंध के लिए कोई पैरामीट्रिक रूप नहीं माना जाता है। गैर-पैरामीट्रिक प्रतिगमन के लिए पैरामीट्रिक मॉडल पर आधारित प्रतिगमन की तुलना में बड़े नमूना आकार की आवश्यकता होती है क्योंकि डेटा को मॉडल संरचना के साथ-साथ मॉडल अनुमान भी प्रदान करना चाहिए।

परिभाषा

गैरपैरामीट्रिक प्रतिगमन में, हमारे पास यादृच्छिक चर और हैं और निम्नलिखित संबंध मानते हैं:

जहाँ कुछ नियतात्मक फलन है। रैखिक प्रतिगमन गैरपैरामीट्रिक प्रतिगमन का प्रतिबंधित स्थिति होती है जहां को एफ़िन माना जाता है।

कुछ लेखक योगात्मक ध्वनि की धीमी सशक्त धारणा का उपयोग करते हैं:

जहां यादृच्छिक चर 'ध्वनि शब्द' है, जिसका माध्य 0 होता है।

इस धारणा के बिना कि कार्यों के विशिष्ट पैरामीट्रिक वर्ग से संबंधित है, के लिए निष्पक्ष अनुमान प्राप्त करना असंभव होता है, चूंकि अधिकांश अनुमानक उपयुक्त परिस्थितियों में सुसंगत हैं।

सामान्य प्रयोजन गैरपैरामीट्रिक प्रतिगमन कलन विधि की सूची

यह प्रतिगमन के लिए गैर-पैरामीट्रिक मॉडल की गैर-विस्तृत सूची है।


उदाहरण

गॉसियन प्रक्रिया प्रतिगमन या क्रिगिंग

गॉसियन प्रक्रिया प्रतिगमन में, जिसे क्रिगिंग के रूप में भी जाना जाता है, प्रतिगमन वक्र के लिए गॉसियन को पूर्व माना जाता है। त्रुटियों को बहुभिन्नरूपी सामान्य वितरण माना जाता है और प्रतिगमन वक्र का अनुमान इसके पश्च विधा से लगाया जाता है। गॉसियन पूर्व अज्ञात हाइपरपैरामीटर पर निर्भर हो सकता है, जिसका अनुमान सामान्यतः अनुभवजन्य बेज़ के माध्यम से लगाया जाता है।

हाइपरपैरामीटर सामान्यतः पूर्व सहप्रसरण मूल निर्दिष्ट करते हैं। यदि मूल को डेटा से गैर-पैरामीट्रिक रूप से भी अनुमान लगाया जाना चाहिए, तब महत्वपूर्ण निस्पंदन का उपयोग किया जा सकता है।

समरेखण विभाजन की व्याख्या गॉसियन प्रक्रिया प्रतिगमन के पश्च विधा के रूप में की जाती है।

मूल प्रतिगमन

गॉसियन मूल स्मूथ का उपयोग करके गैर-पैरामीट्रिक प्रतिगमन के साथ छोटे डेटा समुच्चय (काले बिंदु) पर फिट होने वाले वक्र (लाल रेखा) का उदाहरण । गुलाबी छायांकित क्षेत्र एक्स के दिए गए मान के लिए वाई का अनुमान प्राप्त करने के लिए क्रियान्वित मूल फलन को दर्शाया जाता है। मूल फलन लक्ष्य बिंदु के लिए अनुमान तैयार करने में प्रत्येक डेटा बिंदु को दिए गए वजन को परिभाषित करता है।

मूल प्रतिगमन डेटा बिंदुओं के स्थानों को मूल फलन के साथ जोड़कर डेटा बिंदुओं के सीमित समुच्चय से निरंतर निर्भर चर का अनुमान लगाता है - लगभग बोलते हुए, मूल फलन निर्दिष्ट करता है कि डेटा बिंदुओं के प्रभाव को "धुंधला" कैसे किया जाए जिससे उनके मान हो सकें आस-पास के स्थानों के लिए मूल्य की भविष्यवाणी करने के लिए उपयोग किया जाता है।

प्रतिगमन ट्रीस

निर्णय ट्री शिक्षण एल्गोरिदम को डेटा से निर्भर चर की पूर्वकथन करना सीखने के लिए क्रियान्वित किया जा सकता है।[2] यद्यपि मूल वर्गीकरण और प्रतिगमन ट्री (कार्ट) सूत्रीकरण केवल अविभाज्य डेटा की भविष्यवाणी करने के लिए क्रियान्वित किया गया था, रुपरेखा का उपयोग समय श्रृंखला सहित बहुभिन्नरूपी डेटा की भविष्यवाणी करने के लिए किया जा सकता है।[3]


यह भी देखें

संदर्भ

  1. Statistical and neural network techniques for nonparametric regression by Vladimir Cherkassky, Filip Mulier https://link.springer.com/chapter/10.1007/978-1-4612-2660-4_39
  2. Breiman, Leo; Friedman, J. H.; Olshen, R. A.; Stone, C. J. (1984). Classification and regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software. ISBN 978-0-412-04841-8.
  3. Segal, M.R. (1992). "Tree-structured methods for longitudinal data". Journal of the American Statistical Association. American Statistical Association, Taylor & Francis. 87 (418): 407–418. doi:10.2307/2290271. JSTOR 2290271.


अग्रिम पठन


बाहरी संबंध