वर्गों का अवशिष्ट योग

आँकड़ों में वर्गों के अवशिष्ट योग (आरएसएस) को वर्ग अवशेषों के योग (एसएसआर) या त्रुटियों के वर्ग अनुमान के योग (एसएसई) के रूप में भी जाना जाता है। जो अवशिष्टों के वर्गों (अंकगणित) का योग (डेटा के वास्तविक अनुभवजन्य मानो से अनुमानित विचलन) है। यह डेटा और एक अनुमान आदर्श जैसे कि रैखिक प्रतिगमन के मध्य विसंगति का माप है। लघु आरएसएस डेटा के लिए आदर्श के उपयुक्त होने का संकेत देता है। इसका उपयोग पैरामीटर चयन और आदर्श चयन में इष्टतमता मानदंड के रूप में किया जाता है। सामान्यतः वर्गों का कुल योग = वर्गों का स्पष्ट योग + वर्गों का अवशिष्ट योग है। बहुभिन्नरूपी साधारण न्यूनतम वर्ग (ओएलएस) स्थिति में इसके प्रमाण के लिए सामान्य साधारण न्यूनतम वर्ग आदर्श में वर्गों का स्पष्ट विभाजन देखें।

एक व्याख्यात्मक परिवर्तनीय
एकल व्याख्यात्मक परिवर्तनीय वाले आदर्श में आरएसएस इस प्रकार दिया गया है:
 * $$\operatorname{RSS} = \sum_{i=1}^n (y_i - f(x_i))^2 $$

जिस स्थान पर yi पूर्वानुमानित किए जाने वाले परिवर्तनीय का ith मान है, xi व्याख्यात्मक परिवर्तनीय का ith मान है और $$f(x_i)$$ yi का अनुमानित मान है (जिसे $$\hat{y_i}$$ भी कहा जाता है)। एक मानक रैखिक सरल प्रतिगमन आदर्श में, $$y_i = \alpha + \beta x_i+\varepsilon_i\,$$, जिस स्थान पर α और β गुणांक हैं, y और x क्रमशः प्रतिगमन और प्रतिगामी हैं, और ε त्रुटि पद है। अवशिष्टों के वर्गों का योग $$\widehat{\varepsilon\,}_i$$ के वर्गों का योग है। अर्थात


 * $$\operatorname{RSS} = \sum_{i=1}^n (\widehat{\varepsilon\,}_i)^2 = \sum_{i=1}^n (y_i - (\widehat{\alpha\,} + \widehat{\beta\,} x_i))^2 $$

जिस स्थान पर $$\widehat{\alpha\,}$$ स्थिर पद $$\alpha$$ का अनुमानित मान है और $$\widehat{\beta\,}$$ प्रवणता गुणांक $$\beta$$ का अनुमानित मान है।

ओएलएस वर्गों के अवशिष्ट योग के लिए आव्युह अभिव्यक्ति
$n$ अवलोकनों और $k$ व्याख्याकारों के मध्य सामान्य प्रतिगमन आदर्श जिसमें से प्रथम स्थिर इकाई सदिश है, जिसका गुणांक प्रतिगमन अवरोधन है


 * $$ y = X \beta + e$$

जिस स्थान पर $y$ निर्भर परिवर्तनीय अवलोकनों का n × 1 सदिश है, जो n × k आव्युह का प्रत्येक स्तंभ है, $X$ एवं k व्याख्याकारों में से एक पर अवलोकनों का सदिश है, $$\beta $$ वास्तविक गुणांकों का एक k × 1 सदिश है, और $e$ वास्तविक अंतर्निहित त्रुटियों का n× 1 सदिश है। $$\beta$$ के लिए सामान्य न्यूनतम वर्ग अनुमानक है


 * $$ X \hat \beta = y \iff$$
 * $$ X^\operatorname{T} X \hat \beta = X^\operatorname{T} y \iff$$
 * $$ \hat \beta = (X^\operatorname{T} X)^{-1}X^\operatorname{T} y.$$

अवशिष्ट सदिश $$\hat e = y - X \hat \beta = y - X (X^\operatorname{T} X)^{-1}X^\operatorname{T} y$$ तो वर्गों का शेष योग है:


 * $$\operatorname{RSS} = \hat e ^\operatorname{T} \hat e = \| \hat e \|^2 $$,

(अवशेषों के सदिश मानक के वर्ग के सामान्तर) पूर्णतः


 * $$\operatorname{RSS} = y^\operatorname{T} y - y^\operatorname{T} X(X^\operatorname{T} X)^{-1} X^\operatorname{T} y = y^\operatorname{T} [I - X(X^\operatorname{T} X)^{-1} X^\operatorname{T}] y = y^\operatorname{T} [I - H] y$$,

जिस स्थान पर $H$ हैट आव्युह है, या रैखिक प्रतिगमन में प्रक्षेपण आव्युह है।

पियर्सन के परिणाम-समय सहसंबंध के मध्य संबंध
न्यूनतम-वर्ग प्रतिगमन रेखा के माध्यम से प्रस्तुत करी गई है:


 * $$y=ax+b$$,

जिस स्थान पर $$b=\bar{y}-a\bar{x}$$ और $$a=\frac{S_{xy}}{S_{xx}}$$, जिस स्थान पर $$S_{xy}=\sum_{i=1}^n(\bar{x}-x_i)(\bar{y}-y_i)$$ और $$S_{xx}=\sum_{i=1}^n(\bar{x}-x_i)^2.$$

इसलिए



\begin{align} \operatorname{RSS} & = \sum_{i=1}^n (y_i - f(x_i))^2= \sum_{i=1}^n (y_i - (ax_i+b))^2= \sum_{i=1}^n (y_i - ax_i-\bar{y} + a\bar{x})^2 \\[5pt] & = \sum_{i=1}^n (a(\bar{x}-x_i)-(\bar{y}-y_i))^2=a^2S_{xx}-2aS_{xy}+S_{yy}=S_{yy}-aS_{xy}=S_{yy} \left(1-\frac{S_{xy}^2}{S_{xx} S_{yy}} \right) \end{align} $$ जिस स्थान पर $$S_{yy}=\sum_{i=1}^n (\bar{y}-y_i)^2 .$$

पियर्सन परिणाम सहसंबंध गुणांक $$r=\frac{S_{xy}}{\sqrt{S_{xx}S_{yy}}}; $$ के माध्यम से दिया गया है इसलिए $$\operatorname{RSS}=S_{yy}(1-r^2). $$।

यह भी देखें

 * अकाइक सूचना मानदंड-न्यूनतम वर्गों के मध्य तुलना
 * ची-वर्ग वितरण-अनुप्रयोग
 * स्वाधीनता की उपाधि (सांख्यिकी)-वर्गों का योग और स्वाधीनता की उपाधि
 * आंकड़ों में त्रुटियाँ एवं अवशिष्ट
 * वर्गों के योग का अभाव
 * मध्य वर्ग-फल त्रुटि
 * कमतर ची-स्क्वेर्ड आँकड़ा, स्वाधीनता की उपाधि के अनुसार आरएसएस
 * वर्ग विचलन
 * वर्गों का योग (सांख्यिकी)