बहुपद प्रतिगमन
| एक श्रृंखला का हिस्सा |
| प्रतिगमन विश्लेषण |
|---|
| मॉडल |
| अनुमान |
| पार्श्वभूमि |
|
|
बहुपद प्रतिगमन, सांख्यिकी में, प्रतिगमन विश्लेषण का रूप है जिसमें स्वतंत्र चर x और आश्रित चर y के बीच संबंध को x में nवीं कोटि बहुपद के रूप में तैयार किया जाता है। बहुपद प्रतिगमन x के मान और y की संगत सशर्त माध्य, E(y |x) के बीच अरैखिक संबंध के अनुरूप है। यद्यपि बहुपद प्रतिगमन आंकड़े के लिए अरैखिक मॉडल के अनुरूप है, सांख्यिकीय अनुमान समस्या के रूप में यह रैखिक है, इस अर्थ में कि प्रतिगमन फलन E(y | x) आंकड़े से अनुमानित अज्ञात मापदंड में रैखिक है। इस कारण से, बहुपद प्रतिगमन को एकाधिक रैखिक प्रतिगमन का विशेष मामला माना जाता है।
आधारभूत चर के बहुपद विस्तार से उत्पन्न "व्याख्यात्मक (स्वतंत्र)" चर को उच्च-कोटि शब्दों के रूप में जाना जाता है। ऐसे चर का उपयोग सांख्यिकीय वर्गीकरण समायोजन में भी किया जाता है।[1]
इतिहास
बहुपद प्रतिगमन मॉडल सामान्यतः न्यूनतम वर्ग की विधि का उपयोग के अनुरूप होते हैं। न्यूनतम-वर्ग विधि अनुमानक के पूर्वाग्रह के विचरण को कम करती है| गॉस-मार्कोव प्रमेय की शर्तों के अनुसार, न्यूनतम-वर्ग विधि गुणांक के निष्पक्ष अनुमानकों के विचरण को कम करती है। न्यूनतम-वर्ग विधि 1805 में एड्रियन मैरी लीजेंड्रे द्वारा और 1809 में गॉस द्वारा प्रकाशित की गई थी। बहुपद प्रतिगमन के लिए प्रयोग का पहला डिज़ाइन 1815 में इष्टतम डिज़ाइन जोसेफ़ डियाज़ गेर्गोन के पेपर में दिखाई दिया था।[2][3] बीसवीं सदी में, बहुपद प्रतिगमन ने डिजाइन और अनुमान के मुद्दों पर अधिक जोर देने के साथ, प्रतिगमन विश्लेषण के विकास में एक महत्वपूर्ण भूमिका निभाई थी।[4] हाल ही में, बहुपद मॉडल के उपयोग को अन्य तरीकों से पूरक किया गया है, गैर-बहुपद मॉडल में कुछ वर्गों की समस्याओं के लिए फायदे हैं।
परिभाषा और उदाहरण
प्रतिगमन विश्लेषण का लक्ष्य स्वतंत्र चर (या स्वतंत्र चर के सदिश) x के मान के संदर्भ में आश्रित चर y के अपेक्षित मान को मॉडल करना है। सरल रैखिक प्रतिगमन में, मॉडल
का उपयोग किया जाता है, जहां ε अदिश (गणित) चर x पर प्रतिबंधित माध्य शून्य के साथ अप्राप्य यादृच्छिक त्रुटि है। इस मॉडल में, x के मान में प्रत्येक इकाई वृद्धि के लिए, y की सशर्त अपेक्षा β1 इकाइयाँ से बढ़ जाती है।
कई समायोजन में, ऐसा रैखिक संबंध कायम नहीं रह सकता है। उदाहरण के लिए, यदि हम रासायनिक संश्लेषण की उत्पन्न को उस तापमान के संदर्भ में मॉडलिंग कर रहे हैं जिस पर संश्लेषण होता है, तो हम पा सकते हैं कि तापमान में प्रत्येक इकाई वृद्धि के लिए मात्रा में वृद्धि से उत्पन्न में सुधार होता है। इस मामले में, हम विधि का द्विघात मॉडल प्रस्तावित कर सकते हैं
इस मॉडल में, जब तापमान x से x + 1 इकाई तक बढ़ाया जाता है, तो अपेक्षित उत्पन्न में परिवर्तन होता है। (इसे इस समीकरण में x को x+1 से प्रतिस्थापित करके और x+1 में समीकरण से x में समीकरण घटाकर देखा जा सकता है।) x में अनंत परिवर्तन के लिए, y पर प्रभाव x के संबंध में कुल व्युत्पन्न द्वारा दिया जाता है। : तथ्य यह है कि उत्पन्न में परिवर्तन x पर निर्भर करता है, जो x और y के बीच संबंध को अरेखीय बनाता है, भले ही मॉडल अनुमानित मापदंडों में रैखिक हो।
सामान्य तौर पर, हम y के अपेक्षित मान को nवीं कोटि बहुपद के रूप में मॉडल कर सकते हैं, जिससे सामान्य बहुपद प्रतिगमन मॉडल प्राप्त होता है
ये मॉडल आसानी से अनुमान सिद्धांत के दृष्टिकोण से सभी रैखिक हैं, क्योंकि प्रतिगमन फलन अज्ञात मापदंड β0, β1, ...के संदर्भ में रैखिक है इसलिए, न्यूनतम वर्ग विश्लेषण के लिए, बहुपद प्रतिगमन की संगणनात्मक और अनुमानित समस्याओं को रैखिक प्रतिगमन की तकनीकों का उपयोग करके पूरी तरह से संबोधित किया जा सकता है। यह एकाधिक प्रतिगमन मॉडल में विशिष्ट स्वतंत्र चर के रूप में x, x2, ..का उपचार करके किया जाता है।
आव्यूह विधि और अनुमानों की गणना
बहुपद प्रतिगमन मॉडल
डिज़ाइन आव्यूह प्रतिक्रिया सदिश , मापदंड सदिश , और सदिश यादृच्छिक त्रुटियो के संदर्भ में आव्यूह रूप में व्यक्त किया जा सकता है। i-वीं पंक्ति और i-वें आंकड़े नमूने के लिए x और y मान सम्मिलित होंगे। तब मॉडल को रैखिक समीकरणों क प्रणाली के रूप में लिखा जा सकता है: