औसत पूर्ण विचलन

एक डेटा सेट का औसत निरपेक्ष विचलन (AAD) एक केंद्रीय प्रवृत्ति से निरपेक्ष मूल्य विचलन (सांख्यिकी) का औसत है। यह सांख्यिकीय फैलाव या परिवर्तनशीलता का सारांश आँकड़े है। सामान्य रूप में, केंद्रीय बिंदु एक अंकगणितीय माध्य, माध्यिका, मोड (सांख्यिकी) या केंद्रीय प्रवृत्ति के किसी अन्य माप का परिणाम या दिए गए डेटा सेट से संबंधित कोई संदर्भ मान हो सकता है। AAD में माध्य निरपेक्ष विचलन और मध्य निरपेक्ष विचलन (दोनों संक्षिप्त रूप से MAD) शामिल हैं।

फैलाव के उपाय
पूर्ण विचलन के संदर्भ में सांख्यिकीय फैलाव के कई उपायों को परिभाषित किया गया है। शब्द औसत निरपेक्ष विचलन विशिष्ट रूप से सांख्यिकीय फैलाव के एक उपाय की पहचान नहीं करता है, क्योंकि ऐसे कई उपाय हैं जिनका उपयोग निरपेक्ष विचलन को मापने के लिए किया जा सकता है, और केंद्रीय प्रवृत्ति के कई उपाय हैं जिनका उपयोग भी किया जा सकता है। इस प्रकार, पूर्ण विचलन की विशिष्ट पहचान के लिए विचलन के माप और केंद्रीय प्रवृत्ति के माप दोनों को निर्दिष्ट करना आवश्यक है। दुर्भाग्य से, सांख्यिकीय साहित्य ने अभी तक एक मानक संकेतन को नहीं अपनाया है, क्योंकि माध्य के चारों ओर #माध्य निरपेक्ष विचलन और माध्यिका के चारों ओर #मध्य निरपेक्ष विचलन दोनों को साहित्य में उनके प्रारंभिक एमएडी द्वारा निरूपित किया गया है, जिससे भ्रम पैदा हो सकता है, क्योंकि सामान्य तौर पर, उनके मूल्य एक दूसरे से काफी भिन्न हो सकते हैं।

औसत केंद्रीय बिंदु के चारों ओर पूर्ण विचलन
सेट का औसत पूर्ण विचलन {x1, एक्स2, ..., एक्सn} है $$\frac{1}{n} \sum_{i=1}^n |x_i-m(X)|.$$ केंद्रीय प्रवृत्ति के माप का विकल्प, $$m(X)$$, माध्य विचलन के मान पर एक उल्लेखनीय प्रभाव पड़ता है। उदाहरण के लिए, डेटा सेट {2, 2, 3, 4, 14} के लिए:

माध्य के चारों ओर पूर्ण विचलन
माध्य निरपेक्ष विचलन (MAD), जिसे माध्य विचलन या कभी-कभी औसत निरपेक्ष विचलन भी कहा जाता है, डेटा के माध्य के आस-पास डेटा के निरपेक्ष विचलन का माध्य है: माध्य से औसत (पूर्ण) दूरी। औसत निरपेक्ष विचलन या तो इस उपयोग को संदर्भित कर सकता है, या किसी निर्दिष्ट केंद्रीय बिंदु (ऊपर देखें) के संबंध में सामान्य रूप में।

एमएडी को मानक विचलन के स्थान पर उपयोग करने का प्रस्ताव दिया गया है क्योंकि यह वास्तविक जीवन से बेहतर मेल खाता है। क्योंकि एमएडी मानक विचलन की तुलना में परिवर्तनशीलता का एक सरल उपाय है, यह विद्यालयी शिक्षण में उपयोगी हो सकता है। इस पद्धति की पूर्वानुमान सटीकता औसत चुकता त्रुटि (MSE) विधि से बहुत निकटता से संबंधित है जो कि पूर्वानुमानों की औसत चुकता त्रुटि है। हालांकि ये विधियां बहुत निकट से संबंधित हैं, एमएडी का अधिक सामान्य रूप से उपयोग किया जाता है क्योंकि यह गणना करना आसान है (वर्गीकरण की आवश्यकता से बचने के लिए) और समझने में आसान। सामान्य बंटन के लिए माध्य से मानक विचलन का औसत पूर्ण विचलन का अनुपात होता है $ \sqrt{2/\pi} = 0.79788456\ldots$. इस प्रकार यदि एक्स अपेक्षित मूल्य 0 के साथ सामान्य रूप से वितरित यादृच्छिक चर है, तो गीरी (1935) देखें: $$ w=\frac{ E|X| }{ \sqrt{E(X^2)} } = \sqrt{\frac{2}{\pi}}. $$ दूसरे शब्दों में, एक सामान्य बंटन के लिए, माध्य निरपेक्ष विचलन मानक विचलन का लगभग 0.8 गुना होता है। हालांकि, इन-सैंपल माप किसी दिए गए गाऊसी नमूने के लिए माध्य औसत विचलन/मानक विचलन के अनुपात के मूल्यों को निम्नलिखित सीमा के साथ वितरित करते हैं: $$ w_n \in [0,1] $$, छोटे n के लिए पूर्वाग्रह के साथ। माध्य से औसत पूर्ण विचलन मानक विचलन से कम या उसके बराबर है; इसे सिद्ध करने का एक तरीका जेन्सेन की असमानता पर निर्भर करता है।

$$

माध्यिका के चारों ओर पूर्ण विचलन
माध्यिका वह बिंदु है जिसके बारे में माध्य विचलन न्यूनतम किया जाता है। एमएडी माध्यिका अपने माध्यिका के चारों ओर एक यादृच्छिक चर के पैमाने का प्रत्यक्ष माप प्रदान करती है $$D_\text{med} = E |X-\text{median}| $$ यह स्केल पैरामीटर का अधिकतम संभावना अनुमानक है $$b$$ लाप्लास वितरण का।

चूंकि माध्य औसत पूर्ण दूरी को कम करता है, हमारे पास है $$D_\text{med} \le D_\text{mean}$$. माध्यिका से औसत निरपेक्ष विचलन माध्य से औसत निरपेक्ष विचलन से कम या उसके बराबर होता है। वास्तव में, माध्यिका से औसत निरपेक्ष विचलन हमेशा किसी अन्य निश्चित संख्या से औसत निरपेक्ष विचलन से कम या उसके बराबर होता है।

सामान्य फैलाव समारोह का उपयोग करके, हबीब (2011) ने एमएडी को माध्यिका के रूप में परिभाषित किया $$D_\text{med} = E |X-\text{median}| = 2\operatorname{Cov}(X,I_O) $$ जहां सूचक समारोह है $$\mathbf{I}_O := \begin{cases} 1 &\text{if } x > \text{median}, \\ 0 &\text{otherwise}. \end{cases} $$ यह प्रतिनिधित्व एमएडी औसत सहसंबंध गुणांक प्राप्त करने की अनुमति देता है।

एक केंद्रीय बिंदु के चारों ओर औसत पूर्ण विचलन
जबकि सैद्धांतिक रूप से औसत पूर्ण विचलन के लिए माध्य या किसी अन्य केंद्रीय बिंदु को केंद्रीय बिंदु के रूप में लिया जा सकता है, इसके बजाय अक्सर माध्य मान लिया जाता है।

माध्यिका के चारों ओर माध्यिका निरपेक्ष विचलन
माध्यिका निरपेक्ष विचलन (MAD भी) माध्यिका से निरपेक्ष विचलन का माध्यिका है। यह पैमाने का एक मजबूत उपाय है।

उदाहरण के लिए {2, 2, 3, 4, 14}: 3 माध्यिका है, इसलिए माध्यिका से निरपेक्ष विचलन {1, 1, 0, 1, 11} हैं ({0, 1, 1, 1 के रूप में पुनर्क्रमित), 11}) 1 की माध्यिका के साथ, इस मामले में बाहरी 14 के मान से अप्रभावित है, इसलिए औसत पूर्ण विचलन 1 है।

एक सममित वितरण के लिए, औसत पूर्ण विचलन अंतर-चतुर्थक श्रेणी के आधे के बराबर है।

अधिकतम पूर्ण विचलन
एक मनमाना बिंदु के चारों ओर अधिकतम पूर्ण विचलन उस बिंदु से एक नमूने के पूर्ण विचलन का अधिकतम है। जबकि केंद्रीय प्रवृत्ति का सख्ती से माप नहीं है, ऊपर के रूप में औसत पूर्ण विचलन के लिए सूत्र का उपयोग करके अधिकतम पूर्ण विचलन पाया जा सकता है $$m(X)=\max(X)$$, कहाँ $$\max(X)$$ अधिकतम नमूना है।

न्यूनीकरण
पूर्ण विचलन से प्राप्त सांख्यिकीय फैलाव के उपाय केंद्रीय प्रवृत्ति के विभिन्न उपायों को फैलाव को कम करने के रूप में दर्शाते हैं: मध्यिका केंद्रीय प्रवृत्ति का माप है जो पूर्ण विचलन से सबसे अधिक जुड़ा हुआ है। कुछ स्थान मापदंडों की तुलना इस प्रकार की जा सकती है:
 * एल2 मानदंड|एल2 मानक आँकड़े: माध्य माध्य वर्ग त्रुटि को कम करता है
 * एल1 मानदंड|एल1 मानक आँकड़े: माध्यिका औसत पूर्ण विचलन को न्यूनतम करती है,
 * समान मानदंड | एल∞ मानक आँकड़े: मध्य-श्रेणी अधिकतम निरपेक्ष विचलन को न्यूनतम करती है
 * छंटनी की वर्दी मानदंड | एल∞ आदर्श आँकड़े: उदाहरण के लिए, मिडहिंज (पहले और तीसरे चतुर्थक का औसत) जो पूरे वितरण के औसत पूर्ण विचलन को कम करता है, ऊपर और नीचे 25% के बाद वितरण के अधिकतम पूर्ण विचलन को भी कम करता है कटौती करना।

अनुमान
एक नमूने का औसत निरपेक्ष विचलन जनसंख्या के औसत निरपेक्ष विचलन का एक पक्षपाती अनुमानक है। निष्पक्ष अनुमानक होने के लिए पूर्ण विचलन के लिए, सभी नमूना पूर्ण विचलनों का अपेक्षित मान (औसत) जनसंख्या पूर्ण विचलन के बराबर होना चाहिए। हालाँकि, ऐसा नहीं है। जनसंख्या 1,2,3 के लिए माध्यिका के बारे में जनसंख्या निरपेक्ष विचलन और माध्य के बारे में जनसंख्या निरपेक्ष विचलन दोनों 2/3 हैं। आकार 3 के माध्य के बारे में सभी नमूना निरपेक्ष विचलन का औसत जो जनसंख्या से खींचा जा सकता है, 44/81 है, जबकि माध्यिका के बारे में सभी नमूना निरपेक्ष विचलन का औसत 4/9 है। इसलिए, पूर्ण विचलन एक पक्षपाती अनुमानक है।

हालाँकि, यह तर्क माध्य-निष्पक्षता की धारणा पर आधारित है। स्थान के प्रत्येक माप में निष्पक्षता का अपना रूप होता है (पक्षपातपूर्ण अनुमानक पर प्रविष्टि देखें)। यहाँ निष्पक्षता का प्रासंगिक रूप माध्यिका निष्पक्षता है।

यह भी देखें
* विचलन (सांख्यिकी)
 * औसत पूर्ण विचलन
 * चुकता विचलन
 * सबसे कम पूर्ण विचलन
 * त्रुटियाँ
 * मतलब पूर्ण त्रुटि
 * औसत पूर्ण प्रतिशत त्रुटि
 * संभावित त्रुटि
 * मतलब पूर्ण अंतर
 * औसत संशोधित मूल्य

बाहरी संबंध

 * Advantages of the mean absolute deviation