भारित न्यूनतम वर्ग

भारित न्यूनतम वर्ग (डब्ल्यूएलएस), जिसे भारित रैखिक प्रतिगमन के रूप में भी जाना जाता है, सामान्य न्यूनतम वर्गों और रैखिक प्रतिगमन का सामान्यीकरण है जिसमें अवलोकनों के असमान विचरण (विषमलैंगिकता) का ज्ञान प्रतिगमन में शामिल किया जाता है। डब्लूएलएस भी सामान्यीकृत न्यूनतम वर्ग की विशेषज्ञता है, जब त्रुटियों के सहप्रसरण आव्युह की समस्त संवृत विकर्ण प्रविष्टियां शून्य होती हैं।

सूत्रीकरण
किसी डेटा बिंदु पर आदर्श की उपयुक्त को उसके अवशिष्ट $$ r_i $$, के माध्यम से मापा जाता है, जिसे आश्रित चर के मापीय मान, $$ y_i $$ और आदर्श के माध्यम से अनुमानित मान , $$f(x_i, \boldsymbol\beta)$$: के मध्य अंतर के रूप में परिभाषित किया गया है। $$r_i(\boldsymbol\beta) = y_i - f(x_i, \boldsymbol\beta).$$ यदि त्रुटियाँ असंबंधित हैं और उनमें समान भिन्नता है, तो फलन $$S(\boldsymbol\beta) = \sum_i r_i(\boldsymbol\beta)^2,$$ $$\boldsymbol\hat\beta$$ पर इस प्रकार न्यूनतम किया जाता है कि $$\frac{\partial S}{\partial\beta_j}(\hat\boldsymbol\beta) = 0$$ है

गॉस-मार्कोव प्रमेय से पता चलता है कि, जब ऐसा होता है, तो $$\hat{\boldsymbol{\beta}}$$ सर्वोत्तम रैखिक निष्पक्ष अनुमानक (सर्वोत्तम लीनियर निष्पक्ष अनुमानक) है।

गॉस-मार्कोव प्रमेय से पता चलता है कि, जब ऐसा है, $$\hat{\boldsymbol{\beta}}$$ सर्वोत्तम रैखिक निष्पक्ष अनुमानक (सर्वोत्तम लीनियर निष्पक्ष अनुमानक) है। हालाँकि, यदि माप असंबंधित हैं लेकिन अलग-अलग अनिश्चितताएँ हैं, तो एक संशोधित दृष्टिकोण अपनाया जा सकता है। अलेक्जेंडर ऐटकेन ने दिखाया कि जब वर्ग अवशिष्टों का भारित योग न्यूनतम किया जाता है, तो 1 नीला होता है यदि प्रत्येक वजन माप के विचरण के व्युत्क्रम के अनुरूप होता है, $$\begin{align} S &= \sum_{i=1}^n W_{ii}{r_i}^2, & W_{ii} &= \frac{1}{{\sigma_i}^2} \end{align}$$ वर्गों के इस योग के रूप मे क्रमिक समीकरण हैं $$-2\sum_i W_{ii}\frac{\partial f(x_i, \boldsymbol{\beta})}{\partial\beta_j} r_i = 0,\quad j = 1, \ldots, m$$ जो, एक रैखिक न्यूनतम वर्ग प्रणाली में संशोधित सामान्य समीकरण देते हैं, $$\sum_{i=1}^n \sum_{k=1}^m X_{ij}W_{ii}X_{ik}\hat{\beta}_k = \sum_{i=1}^n X_{ij}W_{ii}y_i,\quad j = 1, \ldots, m\,.$$

जब अवलोकन संबंधी त्रुटियां असंबंधित होती हैं और भार मैट्रिक्स, W=Ω−1, विकर्ण होता है, तो इन्हें इस प्रकार लिखा जा सकता है$$\mathbf{\left(X^\textsf{T} WX\right)\hat{\boldsymbol{\beta}} = X^\textsf{T}Wy}.$$यदि त्रुटियों को सहसंबद्ध किया जाता है तो परिणामी अनुमानक नीला होता है यदि भार मैट्रिक्स अवलोकनों के विचरण-सहप्रसरण आव्युह के व्युत्क्रम के सामान्य है।

जब त्रुटियां असंबंधित होती हैं, तो भार आव्युह को $$w_{ii} = \sqrt{W_{ii}}$$. के रूप में कारक करने के रूप मे गणना को सहज बनाना सुविधाजनक होता है। तत्पश्चात सामान्य समीकरणों को सामान्य न्यूनतम वर्गों के समान रूप में लिखा जा सकता है:$$\mathbf{\left(X'^\textsf{T}X'\right)\hat{\boldsymbol{\beta}} = X'^\textsf{T}y'}\,$$

जिस स्थान पर हम निम्नलिखित चिह्नित आव्युह और सदिश को परिभाषित करते हैं: $$\begin{align} \mathbf{X'} &= \operatorname{diag}\left(\mathbf{w}\right) \mathbf{X},\\ \mathbf{y'} &= \operatorname{diag}\left(\mathbf{w}\right) \mathbf{y} = \mathbf{y} \oslash \mathbf{\sigma}. \end{align}$$ यह एक प्रकार का श्वेतक परिवर्तन है; अंतिम अभिव्यक्ति में प्रविष्टि सतर्कता विभाजन शामिल है।

अ-रेखीय न्यूनतम वर्ग प्रणालियों के रूप मे एक समान तर्क से ज्ञात होता है कि सामान्य समीकरणों को निम्नानुसार संशोधित किया जाना चाहिए। $$\mathbf{\left(J^\textsf{T}WJ\right)\, \boldsymbol\Delta\beta = J^\textsf{T}W\, \boldsymbol\Delta y}.\,$$ ध्यान दें कि अनुभवजन्य परीक्षणों के रूप मे, उपयुक्त W निश्चित रूप से ज्ञात नहीं है और इसका अनुमान लगाया जाना चाहिए। इसके रूप मे व्यवहार्य सामान्यीकृत न्यूनतम वर्ग (एफजीएलएस) तकनीकों का उपयोग किया जा सकता है, इस मामले में यह विकर्ण सहप्रसरण आव्युह के रूप मे विशिष्ट है, जिससे व्यवहार्य भारित न्यूनतम वर्ग मे समाधान प्राप्त होता है।

यदि अवलोकनों की अनिश्चितता बाह्य स्रोतों से ज्ञात नहीं है तो दिए गए अवलोकनों से भार का अनुमान लगाया जा सकता है। उदाहरण के रूप मे बाह्य प्रभाव की अभिज्ञान करने के रूप मे यह उपयोगी हो सकता है। डेटा सेट से बाह्य प्रभाव निष्काषित कर जाने के पश्चात् भार को एक पर पुनः स्थापित किया जाना चाहिए।

प्रेरणा
कुछ मामलों में टिप्पणियों को महत्व प्रस्तुत जा सकता है - उदाहरण के रूप मे, वे समान रूप से विश्वसनीय नहीं हो सकते हैं। इस मामले में, कोई भी वर्गों के भारित योग को कम कर सकता है: $$ \underset{\boldsymbol\beta}{\operatorname{arg\ min}}\, \sum_{i=1}^{n} w_i \left|y_i - \sum_{j=1}^{m} X_{ij}\beta_j\right|^2 = \underset{\boldsymbol\beta}{\operatorname{arg\ min}}\, \left\|W^\frac{1}{2}\left(\mathbf{y} - X\boldsymbol\beta\right)\right\|^2. $$ जिस स्थान पर wi> 0 वें अवलोकन का भार है, और W ऐसे भारों का विकर्ण आव्युह है।

आदर्श रूप से, भार माप के विचरण के गुणात्मक व्युत्क्रम के समकक्ष होना चाहिए। (इसका तात्पर्य यह है कि अवलोकन असंबद्ध हैं। यदि अवलोकन सहसंबद्ध हैं, तो अभिव्यक्ति $S = \sum_k \sum_j r_k W_{kj} r_j\,$ लागू होता है. इस मामले में भार आव्युह आदर्श रूप से अवलोकनों के विचरण-सहप्रसरण आव्युह के व्युत्क्रम के समकक्ष होना चाहिए)।

सामान्य समीकरण तब हैं: $$\left(X^\textsf{T} W X\right)\hat{\boldsymbol{\beta}} = X^\textsf{T} W \mathbf{y}.$$ इस पद्धति का उपयोग पुनरावृत्तीय रूप से पुनर्भारित न्यूनतम वर्गों में किया जाता है।

पैरामीटर त्रुटियां और सहसंबंध
अनुमानित पैरामीटर मान प्रेक्षित मानों के रैखिक संयोजन हैं $$\hat{\boldsymbol{\beta}} = (X^\textsf{T} W X)^{-1} X^\textsf{T} W \mathbf{y}. $$ इसलिए, पैरामीटर अनुमानों के अनुमानित विचरण-सहप्रसरण आव्युह के रूप मे अभिव्यक्ति टिप्पणियों में त्रुटियों से त्रुटि प्रसार के माध्यम से प्राप्त की जा सकती है। मान लें कि प्रेक्षणों के रूप मे प्रसरण-सहप्रसरण आव्युह को M के माध्यम से और अनुमानित मापदंडों को Mβ के माध्यम से निरूपित किया जाता हैβ।

तब $$M^\beta = \left(X^\textsf{T} W X\right)^{-1} X^\textsf{T} W M W^\textsf{T} X \left(X^\textsf{T} W^\textsf{T} X\right)^{-1}.$$ जब $W = M^{−1}$, तो यह सहज हो जाता है $$M^\beta = \left(X^\textsf{T} W X\right)^{-1}.$$ जब इकाई भार का उपयोग किया जाता है ($W = I$, अभिज्ञान आव्युह), यह निहित है कि प्रयोगात्मक त्रुटियां असंबद्ध हैं और समस्त समान हैं: $M = σ^{2}I$, जिस स्थान पर $σ^{2}$ अवलोकन का प्राथमिक विचरण है। किसी भी स्थिति में, σ2 का अनुमान कम ची-वर्ग $$\chi^2_\nu$$ के माध्यम से लगाया जाता है $$\begin{align} M^\beta &= \chi^2_\nu\left(X^\textsf{T} W X\right)^{-1}, \\ \chi^2_\nu &= S/\nu, \end{align}$$ जिस स्थान पर S भारित उद्देश्य फलन का न्यूनतम मान है: $$S = r^\textsf{T} W r = \left\|W^\frac{1}{2}\left(\mathbf{y} - X\hat{\boldsymbol\beta}\right)\right\|^2.$$ प्रत्येक, $$\nu = n - m$$, स्वतंत्रता की उपाधि (सांख्यिकी) की संख्या है; सहसंबंधित टिप्पणियों के मामले में सामान्यीकरण के रूप मे स्वतंत्रता (सांख्यिकी) की प्रभावी उपाधि देखें।

समस्त मामलों में, पैरामीटर अनुमान $$\hat\beta_i$$ का विचरण $$M^\beta_{ii}$$ के माध्यम से प्रस्तुत गया है और पैरामीटर अनुमान $$\hat\beta_i$$ और $$\hat\beta_j$$ के मध्य सहप्रसरण $$M^\beta_{ij}$$ के माध्यम से प्रस्तुत गया है।

मानक विचलन विचरण $$\sigma_i = \sqrt{M^\beta_{ii}}$$ का वर्गमूल है, और सहसंबंध गुणांक $$\rho_{ij} = M^\beta_{ij}/(\sigma_i \sigma_j)$$ के माध्यम से प्रस्तुत गया है। ये त्रुटि अनुमान माप में मात्र यादृच्छिक त्रुटियों को दर्शाते हैं। मापदंडों में वास्तविक अनिश्चितता व्यवस्थित त्रुटियों की उपस्थिति के कारण दीर्घतर है, जिसे परिभाषा के अनुसार निर्धारित नहीं किया जा सकता है। ध्यान दें कि भले ही अवलोकन असंबंधित हो सकते हैं, पैरामीटर आमतौर पर पियर्सन परिणाम महत्व सहसंबंध गुणांक(पीपीएमसीसी) होते हैं।

पैरामीटर विश्वास्यता सीमाएँ
यह अक्सर किसी ठोस सबूत के अभाव में, लेकिन अक्सर केंद्रीय सीमा प्रमेय के लिए स्वीकृत माना जाता है - सामान्य वितरण वृत्तांत और अनुप्रयोग देखें - कि प्रत्येक अवलोकन पर त्रुटि शून्य और मानक विचलन $$\sigma$$ के मध्य सामान्य वितरण से संबंधित है। उस धारणा के अनुसार एकल अदिष्ट पैरामीटर अनुमान के लिए इसकी अनुमानित मानक त्रुटि $$se_{\beta}$$ (सामान्य न्यूनतम वर्ग) के संदर्भ में निम्नलिखित संभावनाएं प्राप्त की जा सकती हैं:
 * 68% कि अंतराल $$\hat\beta \pm se_\beta$$ वास्तविक गुणांक मान को समाहित करता है।
 * 95% कि अंतराल $$\hat\beta \pm 2se_\beta$$ वास्तविक गुणांक मान को समाहित करता है।
 * 99% कि अंतराल $$\hat\beta \pm 2.5se_\beta$$ वास्तविक गुणांक मान को समाहित करता है।

जब n >> m हो तो यह धारणा अनुचित नहीं है। यदि प्रयोगात्मक त्रुटियों को सामान्य रूप से वितरित किया जाता है तो पैरामीटर n-m उपाधि की स्वतंत्रता (सांख्यिकी) के साथ एक विद्यार्थी के टी-वितरण से संबंधित होंगे। जब n ≫ m विद्यार्थी का टी-वितरण सामान्य वितरण का अनुमान लगाता है। हालाँकि, ध्यान दें कि ये विश्वास्यता सीमाएँ व्यवस्थित त्रुटि को ध्यान में नहीं रख सकती हैं। साथ ही, पैरामीटर त्रुटियों को मात्र महत्वपूर्ण अंक तक उद्धृत किया जाना चाहिए, क्योंकि वे नमूनाकरण त्रुटि के अधीन हैं।

जब अवलोकनों की संख्या अपेक्षाकृत कम होती है, तो प्रायोगिक त्रुटियों के वितरण के विषय में किसी भी धारणा का ध्यान दिए बिना, चेबीचेव की असमानता का उपयोग संभावनाओं की उच्चतर परिबंध के लिए किया जा सकता है: अधिकतम संभावनाएँ कि पैरामीटर 1, 2, या 3 मानक विचलन से अधिक होगा इसकी अपेक्षा से दूर मान क्रमशः 100%, 25% और 11% हैं।

अवशिष्ट मान और सहसंबंध
सांख्यिकी में त्रुटियाँ एवं अवशिष्ट किसके के माध्यम से किये गये प्रेक्षणों से सम्बन्धित हैं: $$\mathbf{\hat r} = \mathbf{y} - X \hat{\boldsymbol{\beta}} = \mathbf{y} - H \mathbf{y} = (I - H) \mathbf{y},$$ जिस स्थान पर H निष्क्रिय आव्युह है जिसे हैट आव्युह के रूप में जाना जाता है: $$H = X \left(X^\textsf{T} W X\right)^{-1} X^\textsf{T} W,$$ और I अभिज्ञान आव्युह है। अवशिष्ट Mr का प्रसरण-सहप्रसरण आव्युह के माध्यम से प्रस्तुत करा गया है: $$M^\mathbf{r} = (I - H) M (I - H)^\textsf{T}.$$ इस प्रकार अवलोकन न होने पर भी अवशिष्ट सहसंबद्ध होते हैं:

जब $$W = M^{-1}$$, $$M^\mathbf{r} = (I - H) M.$$ जब भी आदर्श फलन में स्थिर पद होता है तो भारित अवशिष्ट मानों का योग शून्य के समकक्ष होता है। अवशिष्टों के लिए अभिव्यक्ति को X$T$ W$T$ से बाएँ ओर से गुणा करें: $$X^\textsf{T} W \hat{\mathbf r} = X^\textsf{T} W \mathbf{y} - X^\textsf{T} W X \hat{\boldsymbol{\beta}} = X^\textsf{T} W \mathbf{y} - \left(X^{\rm T}W X\right) \left(X^\textsf{T} W X\right)^{-1} X^\textsf{T} W \mathbf{y} = \mathbf{0}.$$ उदाहरण के रूप मे, मान लें कि आदर्श का प्रथम पद स्थिरांक है ताकि समस्त i के लिए $$X_{i1} = 1$$ है। उस स्थिति में यह उसका अनुसरण करता है $$\sum_i^m X_{i1} W_i\hat r_i = \sum_i^m W_i \hat r_i = 0.$$ इस प्रकार, उपरोक्त प्रेरक उदाहरण में, यह तथ्य कि अवशिष्ट मानों का योग शून्य के समकक्ष है, यह आकस्मिक नहीं है, बल्कि आदर्श में स्थिर पद, α की उपस्थिति का परिणाम है।

यदि प्रयोगात्मक त्रुटि सामान्य वितरण का अनुसरण करती है, तो, अवशिष्टों और अवलोकनों के मध्य रैखिक संबंध के कारण, अवशिष्टों को भी ऐसा ही होना चाहिए, लेकिन चूँकि अवलोकन समस्त संभावित अवलोकनों की जनसंख्या का एक नमूना मात्र हैं, इसलिए अवशिष्ट एक विद्यार्थी के टी-वितरण से संबंधित होने चाहिए। जब कोई विशेष अवशिष्ट अत्यधिक उच्चतर प्रतीत होता है तो विद्यार्थीकृत अवशिष्ट किसी बाह्य के रूप मे सांख्यिकीय परीक्षण करने में उपयोगी होते हैं।

यह भी देखें

 * न्यूनतम वर्गों को पुनरावृत्त रूप से पुनः भारित किया गया
 * विषमलैंगिकता-संगत मानक त्रुटियाँ
 * भारित माध्य