डेमिंग प्रतिगमन

आंकड़ों में, डेमिंग प्रतिगमन, डब्ल्यू एडवर्ड्स डेमिंग के नाम पर, एरर-इन-वैरिएबल मॉडल है जो दो-आयामी डेटासेट के लिए सर्वोत्तम फिट की रेखा ढूंढने का प्रयास करता है। यह सरल रेखीय प्रतिगमन से भिन्न है जिसमें यह x- और y-अक्ष दोनों पर टिप्पणियों में आंकड़ों में त्रुटियों और अवशिष्टों के लिए लेखा है। यह कुल न्यूनतम वर्गों की विशेष स्थिति है, जो भविष्यवक्ताओं की किसी भी संख्या और अधिक जटिल त्रुटि संरचना की अनुमति देती है।

डेमिंग प्रतिगमन एरर-इन-वैरिएबल मॉडल के अधिकतम संभावना अनुमान के बराबर है जिसमें दो चर के लिए त्रुटियों को स्वतंत्र और सामान्य रूप से वितरित माना जाता है, और उनके प्रसरण का अनुपात, जिसे δ के रूप में निरुपित किया जाता है। व्यवहार में, इस अनुपात का अनुमान संबंधित डेटा-स्रोतों से लगाया जा सकता है; चूँकि, इस अनुपात का अनुमान लगाने में संभावित त्रुटियों के लिए प्रतिगमन प्रक्रिया कोई ध्यान नहीं देती है।

साधारण रेखीय प्रतिगमन की तुलना में डेमिंग प्रतिगमन की गणना करना थोड़ा अधिक कठिन है। नैदानिक रसायन में उपयोग किए जाने वाले अधिकांश सांख्यिकीय सॉफ़्टवेयर पैकेज डेमिंग प्रतिगमन प्रदान करते हैं।

मॉडल मूल रूप से द्वारा प्रस्तुत किया गया था, जिन्होंने स्थिति δ = 1 पर विचार किया, और फिर अधिक सामान्य रूप से  द्वारा इच्छानुसार δ के साथ प्रस्तुत किया गया था। चूँकि, उनके विचार 50 से अधिक वर्षों तक बड़े पैमाने पर किसी के ध्यान नहीं रहे, जब तक कि उन्हें  द्वारा पुनर्जीवित नहीं किया गया और बाद में  द्वारा और भी अधिक प्रचारित किया गया। बाद की पुस्तक नैदानिक ​​रसायन विज्ञान और संबंधित क्षेत्रों में इतनी लोकप्रिय हो गई कि इस पद्धति को उन क्षेत्रों में डेमिंग प्रतिगमन भी कहा जाने लगा था।

विशिष्टता
मान लें कि उपलब्ध डेटा (yi, xi) "वास्तविक" मानों (yi*, xi*) के मापित अवलोकन हैं, जो प्रतिगमन रेखा पर स्थित हैं:
 * $$\begin{align}

y_i &= y^*_i + \varepsilon_i, \\ x_i &= x^*_i + \eta_i, \end{align}$$ जहां त्रुटियां ε और η स्वतंत्र हैं और उनके भिन्नताओं का अनुपात ज्ञात माना जाता है:
 * $$ \delta = \frac{\sigma_\varepsilon^2}{\sigma_\eta^2}. $$

व्यवहार में, अनुपात के भिन्न $$x$$ और $$y$$ पैरामीटर अधिकांशतः अज्ञात होते हैं, जो $$ \delta $$ के अनुमान को जटिल बनाता है। ध्यान दें कि जब माप पद्धति के लिए $$x$$ और $$y$$ समान है, इन भिन्नताओं के बराबर होने की संभावना है, इसलिए $$ \delta = 1 $$ इस स्थिति के लिए,

हम "सर्वोत्तम फिट" की रेखा ढूँढना चाहते हैं:
 * $$y^* = \beta_0 + \beta_1 x^*,$$

जैसे कि मॉडल के वर्गित अवशेषों का भारित योग कम से कम हो:
 * $$SSR = \sum_{i=1}^n\bigg(\frac{\varepsilon_i^2}{\sigma_\varepsilon^2} + \frac{\eta_i^2}{\sigma_\eta^2}\bigg) = \frac{1}{\sigma_\varepsilon^2} \sum_{i=1}^n\Big((y_i-\beta_0-\beta_1x^*_i)^2 + \delta(x_i-x^*_i)^2\Big) \ \to\ \min_{\beta_0,\beta_1,x_1^*,\ldots,x_n^*} SSR$$

पूर्ण व्युत्पत्ति के लिए देखें।

समाधान
समाधान को दूसरी डिग्री के नमूना क्षणों के रूप में व्यक्त किया जा सकता है। अर्थात्, हम पहले निम्नलिखित मात्राओं की गणना करते हैं (सभी राशियाँ i = 1 से n तक जाते हैं):
 * $$\begin{align}

& \overline{x} = \frac{1}{n}\sum x_i, \quad \overline{y} = \frac{1}{n}\sum y_i, \\ & s_{xx} = \tfrac{1}{n}\sum (x_i-\overline{x})^2, \\ & s_{xy} = \tfrac{1}{n}\sum (x_i-\overline{x})(y_i-\overline{y}), \\ & s_{yy} = \tfrac{1}{n}\sum (y_i-\overline{y})^2. \end{align}$$ अंत में, मॉडल के मापदंडों का न्यूनतम-वर्ग अनुमान होगा:
 * $$\begin{align}

& \hat\beta_1 = \frac{s_{yy}-\delta s_{xx} + \sqrt{(s_{yy}-\delta s_{xx})^2 + 4\delta s_{xy}^2}}{2s_{xy}}, \\ & \hat\beta_0 = \overline{y} - \hat\beta_1\overline{x}, \\ & \hat{x}_i^* = x_i + \frac{\hat\beta_1}{\hat\beta_1^2+\delta}(y_i-\hat\beta_0-\hat\beta_1x_i). \end{align}$$

ऑर्थोगोनल प्रतिगमन
समान त्रुटि प्रसरण की स्थिति में, अर्थात जब $$\delta=1$$, डेमिंग प्रतिगमन ऑर्थोगोनल प्रतिगमन बन जाता है: यह डेटा बिंदुओं से प्रतिगमन रेखा तक वर्ग लंबवत दूरी के योग को कम करता है। इस स्थिति में, प्रत्येक अवलोकन को जटिल विमान में बिंदु zj के रूप में निरूपित करें (अर्थात्, बिंदु (xj, और yj) को zj = xj + iyj के रूप में लिखा जाता है, जहां i काल्पनिक इकाई है)। केंद्र से डेटा बिंदुओं के वर्ग अंतर का योग (जटिल निर्देशांक में भी चिह्नित) Z के रूप में निरूपित करें, जो कि बिंदु है जिसका क्षैतिज और ऊर्ध्वाधर स्थान डेटा बिंदुओं के औसत हैं। तब:


 * यदि Z = 0, तो केन्द्रक के माध्यम से प्रत्येक रेखा सर्वश्रेष्ठ ऑर्थोगोनल फिट की रेखा है।
 * यदि Z ≠ 0, ओर्थोगोनल प्रतिगमन रेखा केन्द्रक के माध्यम से जाती है और मूल से $$\sqrt{Z}$$ सदिश के समानांतर है।

1913 में कूलिज द्वारा ऑर्थोगोनल प्रतिगमन रेखा का त्रिकोणमिति प्रतिनिधित्व दिया गया था।

अनुप्रयोग
समतल में गैर-संरेख बिंदुओं की स्थिति में, इन बिंदुओं वाले त्रिभुज के शीर्षों के रूप में अद्वितीय स्टाइनर इनलिप्स होता है जो त्रिभुज की भुजाओं को उनके मध्यबिंदुओं पर स्पर्श करता है। इस दीर्घवृत्त की प्रमुख धुरी तीन शीर्षों के लिए ओर्थोगोनल प्रतिगमन रेखा पर पड़ती है। दो रिपोर्टर सिंथेटिक जैविक परिपथ के देखे गए व्यवहार के लिए डेमिंग प्रतिगमन प्रयुक्त करने पर जैविक सेल के आंतरिक कोशिकीय रव की मात्रा निर्धारित की जा सकती है।

यह भी देखें

 * लाइन फिटिंग

संदर्भ

 * Notes


 * Bibliography