न्यूनतम-कोण प्रतिगमन

आंकड़ों में, न्यूनतम-कोण प्रतिगमन (एलएआरएस) उच्च-आयामी डेटा के लिए रैखिक प्रतिगमन प्रतिरूप को अनुरूप करने के लिए एक कलन विधि है, जिसे ब्रैडली एफ्रॉन, ट्रेवर हेस्टी, इयान जॉनस्टोन (गणितज्ञ) और रॉबर्ट तिबशिरानी द्वारा विकसित किया गया है। मान लीजिए कि हम अपेक्षा करते हैं कि एक प्रतिक्रिया चर संभावित सहसंयोजकों के उपवर्ग के रैखिक संयोजन द्वारा निर्धारित किया जाएगा। फिर एलएआरएस कलन विधि अनुमान लगाने का एक साधन प्रदान करता है कि किन चरों को सम्मिलित किया जाए, साथ ही उनके गुणांक भी।

एक परिणाम देने के स्थान पर, एलएआरएस समाधान में पैरामीटर सदिश के L1 मानदंड के प्रत्येक मान के लिए समाधान को दर्शाने वाला एक वक्र होता है। कलन विधि फॉरवर्ड स्टेप चरणबद्ध प्रतिगमन के समान है, लेकिन प्रत्येक चरण में चर को सम्मिलित करने के स्थान पर, अनुमानित मापदंडों को अवशिष्ट के साथ प्रत्येक के सहसंबंध के समकोणीय दिशा में बढ़ाया जाता है।

लाभ और हानि
एलएआरएस पद्धति के लाभ हैं: एलएआरएस पद्धति के नुकसानों में सम्मिलित हैं:
 * 1) यह कम्प्यूटेशनल रूप से फॉरवर्ड चयन जितना ही तीव्र है।
 * 2) यह एक पूर्ण टुकड़ा-वार रैखिक समाधान पथ तैयार करता है, जो क्रॉस-वैलिडेशन (सांख्यिकी) क्रॉस-वैलिडेशन या प्रतिरूप को ट्यून करने के समान प्रयासों में उपयोगी है।
 * 3) यदि दो चर प्रतिक्रिया के साथ लगभग समान रूप से सहसंबद्ध हैं, तो उनके गुणांक लगभग समान दर से बढ़ने चाहिए। इस प्रकार कलन विधि अंतर्ज्ञान की अपेक्षा के अनुरूप व्यवहार करता है, और अधिक स्थिर भी है।
 * 4) समान परिणाम देने वाली अन्य विधियों, जैसे लैस्सो (सांख्यिकी) और फॉरवर्ड स्टेजवाइज रिग्रेशन के लिए कुशल कलन विधि तैयार करने के लिए इसे आसानी से संशोधित किया जाता है।
 * 5) यह उन संदर्भों में प्रभावी है जहां पी ≫ एन (यानी, जब भविष्यवक्ताओं की संख्या पी अंक की संख्या से काफी अधिक है)
 * 1) आश्रित चर में किसी भी मात्रा में लड़ाई और उच्च आयामी बहुसंरेखता स्वतंत्र चर के साथ, यह स्तिथि का कोई कारण नहीं है कि चयनित चर में वास्तविक अंतर्निहित कारण चर होने की उच्च संभावना होगी। यह समस्या एलएआरएस के लिए अद्वितीय नहीं है, क्योंकि यह परिवर्तनीय चयन दृष्टिकोण के साथ एक सामान्य समस्या है जो अंतर्निहित नियतात्मक घटकों को ढूंढना चाहती है। फिर भी, क्योंकि एलएआरएस अवशेषों की पुनरावृत्तीय साजोसामान पर आधारित है, यह लड़ाई के प्रभावों के प्रति विशेष रूप से संवेदनशील प्रतीत होता है। इस समस्या पर वीज़बर्ग द्वारा एफ्रॉन एट अल के चर्चा अनुभाग (2004) एनल्स ऑफ स्टैटिस्टिक्स लेख में विस्तार से चर्चा की गई है। वीज़बर्ग मूल रूप से एलएआरएस को मान्य करने के लिए उपयोग किए गए डेटा के पुन: विश्लेषण के आधार पर एक अनुभवजन्य उदाहरण प्रदान करता है कि चर चयन में अत्यधिक सहसंबद्ध चर के साथ समस्याएं प्रतीत होती हैं।
 * 2) चूंकि वास्तविक दुनिया में लगभग सभी उच्च आयामी डेटा संयोग से कम से कम कुछ चर में कुछ हद तक संरेखता प्रदर्शित करेंगे, एलएआरएस में सहसंबद्ध चर के साथ जो समस्या है, वह इसके अनुप्रयोग को उच्च आयामी डेटा तक सीमित कर सकती है।

कलन विधि
न्यूनतम-कोण प्रतिगमन कलन विधि के मूल चरण हैं:
 * सभी गुणांकों से प्रारंभ करें $$\beta$$ शून्य के बराबर.
 * भविष्यवक्ता खोजें $$x_j$$ के साथ सर्वाधिक सहसंबद्ध $$y$$ है
 * गुणांक बढ़ाएँ  के साथ इसके सहसंबंध के संकेत की दिशा में   है अवशेष ले लो  जिस तरह से साथ। रुकें जब कोई अन्य वक्ता  के साथ उतना ही सहसंबंध है $$r$$ जैसा  है। $$y$$$$r = y - \hat{y}$$$$x_k$$$$\beta_j$$
 * बढ़ोतरी ($$\beta_j$$, $$\beta_k$$) उनके संयुक्त न्यूनतम वर्ग दिशा में, किसी अन्य भविष्यवक्ता तक $$x_m$$ अवशिष्ट के साथ उतना ही सहसम्बन्ध $$r$$ है।
 * बढ़ोतरी ($$\beta_j$$, $$\beta_k$$, $$\beta_m$$) उनके संयुक्त न्यूनतम वर्ग दिशा में, किसी अन्य भविष्यवक्ता तक $$x_n$$ अवशिष्ट के साथ उतना ही सहसम्बन्ध है $$r$$।
 * तब तक जारी रखें जब तक: सभी भविष्यवक्ता प्रतिरूप में न आ जाएं।

सॉफ्टवेयर कार्यान्वयन
कम से कम कोण प्रतिगमन आर (भाषा) में एलएआरएस पैकेज के माध्यम से, पायथन (भाषा) में प्रक्रिया के साथ कार्यान्वित किया जाता है। पैकेज, और एसएएस (सॉफ्टवेयर) में के माध्यम से गलमसेलेक्ट

यह भी देखें

 * उच्च-आयामी आँकड़े
 * लैस्सो (सांख्यिकी)
 * प्रतिगमन विश्लेषण
 * प्रतिरूप चयन