मूल-माध्य-वर्ग विचलन

मूल-माध्य-वर्ग विचलन (आरएमएसडी) या मूल-माध्य-वर्ग त्रुटि (आरएमएसई) मॉडल या अनुमानक द्वारा अनुमानित मूल्यों (नमूना या जनसंख्या मूल्यों) और देखे गए मूल्यों के बीच अंतर का अक्सर उपयोग किया जाने वाला माप है। आरएमएसडी अनुमानित मूल्यों और देखे गए मूल्यों या इन अंतरों के द्विघात माध्य के बीच अंतर के दूसरे नमूना क्षण के वर्गमूल का प्रतिनिधित्व करता है। इन सांख्यिकीय विचलन को आंकड़ों में त्रुटियां और अवशेष कहा जाता है, जब गणना डेटा नमूने पर की जाती है जिसका उपयोग अनुमान के लिए किया गया था और जब नमूने से बाहर गणना की जाती है तो इन्हें त्रुटियां (या भविष्यवाणी त्रुटियां) कहा जाता है। आरएमएसडी विभिन्न डेटा बिंदुओं के लिए भविष्यवाणियों में त्रुटियों के परिमाण को पूर्वानुमानित शक्ति के ही माप में एकत्रित करने का कार्य करता है। आरएमएसडी किसी विशेष डेटासेट के लिए विभिन्न मॉडलों की पूर्वानुमान त्रुटियों की तुलना करने के लिए सटीकता और परिशुद्धता का माप है, न कि डेटासेट के बीच, क्योंकि यह स्केल-निर्भर है। आरएमएसडी हमेशा गैर-नकारात्मक होता है, और 0 का मान (व्यवहार में लगभग कभी हासिल नहीं किया गया) डेटा के लिए एकदम फिट होने का संकेत देगा। सामान्य तौर पर, कम आरएमएसडी उच्चतर से बेहतर होता है। हालाँकि, विभिन्न प्रकार के डेटा की तुलना अमान्य होगी क्योंकि माप उपयोग की गई संख्याओं के पैमाने पर निर्भर है।

आरएमएसडी वर्ग त्रुटियों के औसत का वर्गमूल है। आरएमएसडी पर प्रत्येक त्रुटि का प्रभाव वर्ग त्रुटि के आकार के समानुपाती होता है; इस प्रकार बड़ी त्रुटियों का आरएमएसडी पर असंगत रूप से बड़ा प्रभाव पड़ता है। नतीजतन, आरएमएसडी आउटलेर्स के प्रति संवेदनशील है।

सूत्र
एक अनुमानक का आरएमएसडी $$\hat{\theta}$$ अनुमानित पैरामीटर के संबंध में $$\theta$$ माध्य वर्ग त्रुटि के वर्गमूल के रूप में परिभाषित किया गया है:


 * $$\operatorname{RMSD}(\hat{\theta}) = \sqrt{\operatorname{MSE}(\hat{\theta})} = \sqrt{\operatorname{E}((\hat{\theta}-\theta)^2)}.$$

एक निष्पक्ष अनुमानक के लिए, आरएमएसडी विचरण का वर्गमूल है, जिसे मानक विचलन के रूप में जाना जाता है।

अनुमानित मूल्यों का आरएमएसडी $$\hat y_t$$ प्रतिगमन विश्लेषण के समय टी के लिए|प्रतिगमन के आश्रित चर $$y_t,$$ टी समय पर देखे गए चर के साथ, टी अलग-अलग भविष्यवाणियों के लिए विचलन के वर्गों के माध्य के वर्गमूल के रूप में गणना की जाती है:


 * $$\operatorname{RMSD}=\sqrt{\frac{\sum_{t=1}^T (\hat y_t - y_t)^2}{T}}.$$

(क्रास सेक्शनल डाटा पर प्रतिगमन के लिए, सबस्क्रिप्ट t को i द्वारा प्रतिस्थापित किया जाता है और T को n द्वारा प्रतिस्थापित किया जाता है।)

कुछ विषयों में, आरएमएसडी का उपयोग दो चीजों के बीच अंतर की तुलना करने के लिए किया जाता है जो भिन्न हो सकते हैं, जिनमें से किसी को भी मानक के रूप में स्वीकार नहीं किया जाता है। उदाहरण के लिए, दो समय श्रृंखलाओं के बीच औसत अंतर को मापते समय $$x_{1,t}$$ और $$x_{2,t}$$, सूत्र बन जाता है
 * $$\operatorname{RMSD}= \sqrt{\frac{\sum_{t=1}^T (x_{1,t} - x_{2,t})^2}{T}}.$$

सामान्यीकरण
आरएमएसडी को सामान्य करने से विभिन्न पैमानों वाले डेटासेट या मॉडल के बीच तुलना की सुविधा मिलती है। यद्यपि साहित्य में सामान्यीकरण का कोई सुसंगत साधन नहीं है, सामान्य विकल्प मापे गए डेटा का माध्य या सीमा (अधिकतम मान शून्य से न्यूनतम मान के रूप में परिभाषित) हैं:
 * $$\mathrm{NRMSD} = \frac{\mathrm{RMSD}}{y_\max -y_\min}$$ या $$ \mathrm{NRMSD} = \frac {\mathrm{RMSD}}{\bar y} $$.

इस मान को आमतौर पर सामान्यीकृत मूल-माध्य-वर्ग विचलन या त्रुटि (एनआरएमएसडी या एनआरएमएसई) के रूप में जाना जाता है, और अक्सर इसे प्रतिशत के रूप में व्यक्त किया जाता है, जहां कम मान कम अवशिष्ट विचरण का संकेत देते हैं। इसे भिन्नता गुणांक या 'प्रतिशत आरएमएस' भी कहा जाता है। कई मामलों में, विशेष रूप से छोटे नमूनों के लिए, नमूना सीमा नमूने के आकार से प्रभावित होने की संभावना है जो तुलना में बाधा उत्पन्न करेगी।

आरएमएसडी को अधिक उपयोगी तुलना उपाय बनाने की अन्य संभावित विधि आरएमएसडी को अन्तःचतुर्थक श्रेणी द्वारा विभाजित करना है। आरएमएसडी को आईक्यूआर के साथ विभाजित करते समय सामान्यीकृत मूल्य लक्ष्य चर में चरम मूल्यों के लिए कम संवेदनशील हो जाता है।


 * $$\mathrm{RMSDIQR} = \frac{\mathrm{RMSD}}{IQR}$$ कहाँ $$IQR = Q_3 - Q_1$$

साथ $$Q_1 = \text{CDF}^{-1}(0.25)$$ और $$Q_3 = \text{CDF}^{-1}(0.75) ,$$ जहां सी.डी.एफ−1मात्रात्मक फलन है।

माप के औसत मूल्य द्वारा सामान्यीकरण करते समय, अस्पष्टता से बचने के लिए आरएमएसडी, सीवी (आरएमएसडी) की भिन्नता के गुणांक शब्द का उपयोग किया जा सकता है। यह मानक विचलन की जगह लेने वाले आरएमएसडी के साथ भिन्नता के गुणांक के अनुरूप है।


 * $$ \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .$$

माध्य पूर्ण त्रुटि
कुछ शोधकर्ताओं ने मूल माध्य वर्ग विचलन के बजाय माध्य निरपेक्ष त्रुटि (एमएई) के उपयोग की सिफारिश की है। आरएमएसडी की तुलना में व्याख्यात्मकता में एमएई को लाभ है। एमएई त्रुटियों के निरपेक्ष मूल्यों का औसत है। वर्ग त्रुटियों के औसत के वर्गमूल की तुलना में एमएई को समझना मौलिक रूप से आसान है। इसके अलावा, प्रत्येक त्रुटि त्रुटि के पूर्ण मूल्य के सीधे अनुपात में एमएई को प्रभावित करती है, जो आरएमएसडी के मामले में नहीं है।

अनुप्रयोग

 * मौसम विज्ञान में, यह देखना कि गणित का मॉडल वायुमंडल के व्यवहार की कितनी प्रभावी भविष्यवाणी करता है।
 * जैव सूचना विज्ञान में, परमाणु स्थितियों का मूल-माध्य-वर्ग विचलन प्रोटीन संरचनात्मक संरेखण प्रोटीन के परमाणुओं के बीच औसत दूरी का माप है।
 * ड्रग डिजाइन#संरचना-आधारित में, आरएमएसडी लिगैंड गठनात्मक समावयवता के क्रिस्टल संरचना और डॉकिंग (आण्विक) भविष्यवाणी के बीच अंतर का माप है।
 * अर्थशास्त्र में, आरएमएसडी का उपयोग यह निर्धारित करने के लिए किया जाता है कि कोई आर्थिक मॉडल आर्थिक संकेतकों पर फिट बैठता है या नहीं। कुछ विशेषज्ञों ने तर्क दिया है कि आरएमएसडी रिलेटिव एब्सोल्यूट एरर की तुलना में कम विश्वसनीय है।
 * प्रायोगिक मनोविज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि व्यवहार के गणितीय या कम्प्यूटेशनल मॉडल अनुभवजन्य रूप से देखे गए व्यवहार को कितनी अच्छी तरह समझाते हैं।
 * गिस में, आरएमएसडी उपाय है जिसका उपयोग स्थानिक विश्लेषण और रिमोट सेंसिंग की सटीकता का आकलन करने के लिए किया जाता है।
 * हाइड्रोज्योलोजी में, आरएमएसडी और एनआरएमएसडी का उपयोग भूजल मॉडल के अंशांकन का मूल्यांकन करने के लिए किया जाता है।
 * इमेजिंग विज्ञान में, आरएमएसडी चरम सिग्नल-टू-शोर अनुपात का हिस्सा है, उपाय जिसका उपयोग यह आकलन करने के लिए किया जाता है कि किसी छवि को फिर से बनाने की विधि मूल छवि के सापेक्ष कितना अच्छा प्रदर्शन करती है।
 * कम्प्यूटेशनल तंत्रिका विज्ञान में, आरएमएसडी का उपयोग यह आकलन करने के लिए किया जाता है कि कोई सिस्टम किसी दिए गए मॉडल को कितनी अच्छी तरह सीखता है।
 * प्रोटीन परमाणु चुंबकीय अनुनाद स्पेक्ट्रोस्कोपी में, आरएमएसडी का उपयोग संरचनाओं के प्राप्त बंडल की गुणवत्ता का अनुमान लगाने के लिए उपाय के रूप में किया जाता है।
 * नेटफ्लिक्स पुरस्कार के लिए प्रस्तुतियों का मूल्यांकन परीक्षण डेटासेट के अज्ञात वास्तविक मूल्यों से आरएमएसडी का उपयोग करके किया गया था।
 * इमारतों की ऊर्जा खपत के अनुकरण में, आरएमएसई और सीवी (आरएमएसई) का उपयोग भवन के प्रदर्शन को मापने के लिए मॉडल को कैलिब्रेट करने के लिए किया जाता है।
 * एक्स - रे क्रिस्टलोग्राफी में, आरएमएसडी (और आरएमएसजेड) का उपयोग आणविक आंतरिक निर्देशांक के विचलन को मापने के लिए किया जाता है जो कि पुस्तकालय मूल्यों से विचलित होता है।
 * नियंत्रण सिद्धांत में, आरएमएसई का उपयोग राज्य पर्यवेक्षक के प्रदर्शन का मूल्यांकन करने के लिए गुणवत्ता उपाय के रूप में किया जाता है।
 * द्रव गतिशीलता में, सामान्यीकृत मूल-माध्य-वर्ग विचलन (एनआरएमएसडी), भिन्नता का गुणांक (सीवी), और प्रतिशत आरएमएस का उपयोग प्रवाह व्यवहार की एकरूपता जैसे वेग प्रोफ़ाइल, तापमान वितरण, या गैस प्रजाति एकाग्रता को मापने के लिए किया जाता है। प्रवाह और थर्मल उपकरण और प्रक्रियाओं के डिजाइन को अनुकूलित करने के लिए मूल्य की तुलना उद्योग मानकों से की जाती है।

यह भी देखें

 * वर्गमूल औसत का वर्ग
 * मतलब पूर्ण त्रुटि
 * औसत निरपेक्ष विचलन
 * माध्य हस्ताक्षरित विचलन
 * माध्य वर्ग विचलन
 * वर्ग विचलन
 * आंकड़ों में त्रुटियाँ और अवशेष
 * गुणांक का परिवर्तन