वर्गों का अवशिष्ट योग

आँकड़ों में वर्गों के अवशिष्ट योग (आरएसएस) को वर्ग अवशेषों के योग (एसएसआर) या त्रुटियों के वर्ग अनुमान के योग (एसएसई) के रूप में भी जाना जाता है। जो अवशिष्टों के वर्गों (अंकगणित) का योग है (डेटा के वास्तविक अनुभवजन्य मानो से अनुमानित विचलन)। यह डेटा और एक अनुमान आदर्श  जैसे कि रैखिक प्रतिगमन के मध्य विसंगति का एक माप है। एक लघु आरएसएस डेटा के लिए आदर्श  के उपयुक्त होने का संकेत देता है। इसका उपयोग पैरामीटर चयन और आदर्श  चयन में इष्टतमता मानदंड  के रूप में किया जाता है।

सामान्यतः, वर्गों का कुल योग = वर्गों का स्पष्ट योग + वर्गों का अवशिष्ट योग है। बहुभिन्नरूपी साधारण न्यूनतम वर्ग (ओएलएस) स्थिति में इसके प्रमाण के लिए, सामान्य साधारण न्यूनतम वर्ग आदर्श में वर्गों का स्पष्ट विभाजन देखें।

एक व्याख्यात्मक परिवर्तनीय
एकल व्याख्यात्मक परिवर्तनीय वाले आदर्श में, आरएसएस इस प्रकार दिया गया है:
 * $$\operatorname{RSS} = \sum_{i=1}^n (y_i - f(x_i))^2 $$

जिस स्थान पर  yi  पूर्वानुमानित किए जाने वाले परिवर्तनीय का ith मान है  xi  व्याख्यात्मक  परिवर्तनीय का ith मान है और  $$f(x_i)$$ yi का अनुमानित मान है (जिसे  $$\hat{y_i}$$ भी कहा जाता है)। एक मानक रैखिक सरल प्रतिगमन आदर्श  में, $$y_i = \alpha + \beta x_i+\varepsilon_i\,$$, जिस स्थान पर  α और β गुणांक हैं, y और x क्रमशः प्रतिगमन और प्रतिगामी हैं, और ε त्रुटि पद है। अवशिष्टों के वर्गों का योग $$\widehat{\varepsilon\,}_i$$ के वर्गों का योग है। अर्थात


 * $$\operatorname{RSS} = \sum_{i=1}^n (\widehat{\varepsilon\,}_i)^2 = \sum_{i=1}^n (y_i - (\widehat{\alpha\,} + \widehat{\beta\,} x_i))^2 $$

जिस स्थान पर  $$\widehat{\alpha\,}$$ स्थिर पद  $$\alpha$$ का अनुमानित मान है और  $$\widehat{\beta\,}$$ प्रवणता गुणांक  $$\beta$$ का अनुमानित मान है।

ओएलएस वर्गों के अवशिष्ट योग के लिए आव्युह अभिव्यक्ति
सामान्य प्रतिगमन आदर्श के साथ $n$ अवलोकन और $k$ व्याख्याकार, जिनमें से पहला एक स्थिर इकाई सदिश है जिसका गुणांक प्रतिगमन अवरोधन है


 * $$ y = X \beta + e$$

कहाँ $y$ निर्भर परिवर्तनीय अवलोकनों का एक n × 1 सदिश है, जो n × k आव्युह का प्रत्येक स्तंभ है $X$ k व्याख्याकारों में से एक पर अवलोकनों का एक सदिश है, $$\beta $$ वास्तविक गुणांकों का एक k × 1 सदिश है, और $e$ वास्तविक अंतर्निहित त्रुटियों का एक n× 1 सदिश है। के लिए सामान्य न्यूनतम वर्ग अनुमानक $$\beta$$ है


 * $$ X \hat \beta = y \iff$$
 * $$ X^\operatorname{T} X \hat \beta = X^\operatorname{T} y \iff$$
 * $$ \hat \beta = (X^\operatorname{T} X)^{-1}X^\operatorname{T} y.$$

अवशिष्ट सदिश $$\hat e = y - X \hat \beta = y - X (X^\operatorname{T} X)^{-1}X^\operatorname{T} y$$; तब वर्गों का शेष योग है:


 * $$\operatorname{RSS} = \hat e ^\operatorname{T} \hat e = \| \hat e \|^2 $$,

(अवशेषों के सदिश मानदंड के वर्ग के सामान्तर)। पूरे में:


 * $$\operatorname{RSS} = y^\operatorname{T} y - y^\operatorname{T} X(X^\operatorname{T} X)^{-1} X^\operatorname{T} y = y^\operatorname{T} [I - X(X^\operatorname{T} X)^{-1} X^\operatorname{T}] y = y^\operatorname{T} [I - H] y$$,

कहाँ $H$ टोपी आव्युह, या रैखिक प्रतिगमन में प्रक्षेपण आव्युह है।

पियर्सन के उत्पाद-क्षण सहसंबंध के साथ संबंध
न्यूनतम वर्ग|न्यूनतम-वर्ग प्रतिगमन रेखा द्वारा दी गई है


 * $$y=ax+b$$,

कहाँ $$b=\bar{y}-a\bar{x}$$ और $$a=\frac{S_{xy}}{S_{xx}}$$, कहाँ $$S_{xy}=\sum_{i=1}^n(\bar{x}-x_i)(\bar{y}-y_i)$$ और $$S_{xx}=\sum_{i=1}^n(\bar{x}-x_i)^2.$$ इसलिए,



\begin{align} \operatorname{RSS} & = \sum_{i=1}^n (y_i - f(x_i))^2= \sum_{i=1}^n (y_i - (ax_i+b))^2= \sum_{i=1}^n (y_i - ax_i-\bar{y} + a\bar{x})^2 \\[5pt] & = \sum_{i=1}^n (a(\bar{x}-x_i)-(\bar{y}-y_i))^2=a^2S_{xx}-2aS_{xy}+S_{yy}=S_{yy}-aS_{xy}=S_{yy} \left(1-\frac{S_{xy}^2}{S_{xx} S_{yy}} \right) \end{align} $$ कहाँ $$S_{yy}=\sum_{i=1}^n (\bar{y}-y_i)^2 .$$ पियर्सन सहसंबंध गुणांक|पियर्सन उत्पाद-क्षण सहसंबंध द्वारा दिया गया है $$r=\frac{S_{xy}}{\sqrt{S_{xx}S_{yy}}}; $$ इसलिए, $$\operatorname{RSS}=S_{yy}(1-r^2). $$

यह भी देखें

 * अकैके सूचना मानदंड#न्यूनतम वर्गों के साथ तुलना
 * ची-वर्ग वितरण#अनुप्रयोग
 * स्वतंत्रता की डिग्री (सांख्यिकी)#वर्गों का योग और स्वतंत्रता की डिग्री
 * आंकड़ों में त्रुटियाँ और अवशेष
 * वर्गों के योग का अभाव
 * कारणचुकता त्रुटि
 * कम ची-स्क्वेर्ड आँकड़ा, स्वतंत्रता की डिग्री के अनुसार आरएसएस
 * वर्ग विचलन
 * वर्गों का योग (सांख्यिकी)