डेमिंग प्रतिगमन

आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एक त्रुटि-इन-चर मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा खोजने का प्रयास करता है। यह सरल रेखीय प्रतिगमन से अलग है जिसमें यह x- और y-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए खाता है। यह कुल न्यूनतम वर्गों का एक विशेष मामला है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देता है।

डेमिंग प्रतिगमन एक एरर-इन-वैरिएबल मॉडल के अधिकतम संभावना अनुमान के बराबर है जिसमें दो वेरिएबल्स के लिए त्रुटियों को स्वतंत्र और सामान्य वितरण माना जाता है, और उनके प्रसरण का अनुपात, जिसे δ के रूप में जाना जाता है, जाना जाता है. व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; हालाँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई हिसाब नहीं रखती है।

साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। क्लिनिकल केमिस्ट्री में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग रिग्रेशन प्रदान करते हैं।

मॉडल मूल रूप से द्वारा पेश किया गया था जिन्होंने मामले पर विचार किया δ = 1, और फिर अधिक सामान्य रूप से  मनमाने δ के साथ। हालाँकि, उनके विचारों को 50 से अधिक वर्षों तक काफी हद तक किसी का ध्यान नहीं गया, जब तक कि उन्हें  और बाद में और भी प्रचारित किया. बाद की किताब नैदानिक ​​रसायन विज्ञान  और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग रिग्रेशन भी करार दिया गया।

विशिष्टता
मान लें कि उपलब्ध डेटा (yi, एक्सi) वास्तविक मानों के अवलोकनों को मापा जाता है (yi*, एक्सi*), जो प्रतिगमन रेखा पर स्थित हैं:
 * $$\begin{align}

y_i &= y^*_i + \varepsilon_i, \\ x_i &= x^*_i + \eta_i, \end{align}$$ जहां त्रुटियां ε और η स्वतंत्र हैं और उनके भिन्नताओं का अनुपात ज्ञात माना जाता है:
 * $$ \delta = \frac{\sigma_\varepsilon^2}{\sigma_\eta^2}. $$

व्यवहार में, के भिन्न $$x$$ और $$y$$ पैरामीटर अक्सर अज्ञात होते हैं, जो अनुमान को जटिल बनाता है $$ \delta $$. ध्यान दें कि जब माप पद्धति के लिए $$x$$ और $$y$$ समान है, ये प्रसरण समान होने की संभावना है, इसलिए $$ \delta = 1 $$ इस मामले के लिए।

हम सर्वोत्तम फिट की रेखा खोजना चाहते हैं
 * $$y^* = \beta_0 + \beta_1 x^*,$$

जैसे कि मॉडल के वर्गित अवशेषों का भारित योग कम से कम हो:
 * $$SSR = \sum_{i=1}^n\bigg(\frac{\varepsilon_i^2}{\sigma_\varepsilon^2} + \frac{\eta_i^2}{\sigma_\eta^2}\bigg) = \frac{1}{\sigma_\varepsilon^2} \sum_{i=1}^n\Big((y_i-\beta_0-\beta_1x^*_i)^2 + \delta(x_i-x^*_i)^2\Big) \ \to\ \min_{\beta_0,\beta_1,x_1^*,\ldots,x_n^*} SSR$$

देखना पूर्ण व्युत्पत्ति के लिए।

समाधान
समाधान को दूसरी डिग्री के नमूना क्षणों के रूप में व्यक्त किया जा सकता है। यानी, हम पहले निम्नलिखित मात्राओं की गणना करते हैं (सभी योग i = 1 से n तक जाते हैं):
 * $$\begin{align}

& \overline{x} = \frac{1}{n}\sum x_i, \quad \overline{y} = \frac{1}{n}\sum y_i, \\ & s_{xx} = \tfrac{1}{n}\sum (x_i-\overline{x})^2, \\ & s_{xy} = \tfrac{1}{n}\sum (x_i-\overline{x})(y_i-\overline{y}), \\ & s_{yy} = \tfrac{1}{n}\sum (y_i-\overline{y})^2. \end{align}$$ अंत में, मॉडल के मापदंडों का न्यूनतम-वर्ग अनुमान होगा
 * $$\begin{align}

& \hat\beta_1 = \frac{s_{yy}-\delta s_{xx} + \sqrt{(s_{yy}-\delta s_{xx})^2 + 4\delta s_{xy}^2}}{2s_{xy}}, \\ & \hat\beta_0 = \overline{y} - \hat\beta_1\overline{x}, \\ & \hat{x}_i^* = x_i + \frac{\hat\beta_1}{\hat\beta_1^2+\delta}(y_i-\hat\beta_0-\hat\beta_1x_i). \end{align}$$

ऑर्थोगोनल प्रतिगमन
समान त्रुटि प्रसरण के मामले में, अर्थात कब $$\delta=1$$, डेमिंग रिग्रेशन ऑर्थोगोनल रिग्रेशन बन जाता है: यह एक बिंदु से एक रेखा तक वर्ग दूरी के योग को कम करता है। इस मामले में, प्रत्येक अवलोकन को बिंदु z के रूप में निरूपित करेंj जटिल विमान में (यानी, बिंदु (xj, औरj) को z के रूप में लिखा जाता हैj = एक्सj + गंधj जहां मैं काल्पनिक इकाई है)। जेड के रूप में निरूपित करें केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित), जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:


 * यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की एक रेखा है।
 * यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से सदिश के समानांतर है $$\sqrt{Z}$$.

1913 में कूलिज द्वारा ऑर्थोगोनल रिग्रेशन लाइन का त्रिकोणमिति प्रतिनिधित्व दिया गया था।

आवेदन
तीन रेखा (ज्यामिति) के मामले में | समतल में गैर-संरेख बिंदु, इन बिंदुओं वाले त्रिकोण को इसके शीर्ष (ज्यामिति) के रूप में एक अद्वितीय स्टाइनर इनलिप्स होता है जो त्रिभुज के किनारों पर उनके मध्य बिंदुओं पर स्पर्शरेखा होता है। दीर्घवृत्त # दीर्घवृत्त के तत्व तीन शीर्षों के लिए ऑर्थोगोनल प्रतिगमन रेखा पर आते हैं। दो रिपोर्टर सिंथेटिक जैविक सर्किट के देखे गए व्यवहार के लिए डेमिंग प्रतिगमन लागू करने पर एक जैविक कोशिका के आंतरिक सेलुलर शोर की मात्रा निर्धारित की जा सकती है।

यह भी देखें

 * लाइन फिटिंग

संदर्भ

 * Notes


 * Bibliography