न्यूनतम-विचरण निष्पक्ष अनुमानक

आँकड़ों में न्यूनतम विचरण निष्पक्ष अनुमानक (UMVUE) या समान रूप से यदि कहा जाए तो न्यूनतम-विचरण निष्पक्ष अनुमानक (UMVUE) उस अनुमानक का पूर्वाग्रह है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम विचरण होते हैं।

व्यावहारिक आँकड़ों की समस्याओं के लिए UMVUE का निर्धारण करना महत्वपूर्ण है यदि उनमें से कोई इसमें सम्मिलित किया जाता है, क्योंकि कम-से-कम इष्टतम प्रक्रियाओं को स्वाभाविक रूप से कुछ समय के लिए निरस्त किया जा सकता हैं तथा अन्य चीजें इसके समान होती हैं। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास प्रचलित हुआ है।

जबकि निष्पक्षता की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक समुच्चयिंग्स में अच्छे परिणाम मिलते हैं - UMVUE को विश्लेषण की विस्तृत श्रृंखला के लिए प्राकृतिक प्रारंभिक बिंदु बनाया जाता हैं - इस प्रकार लक्षित विनिर्देश किसी समस्या के लिए उत्तम प्रदर्शन कर सकता है, इस प्रकार, UMVUE सदैव सबसे अच्छी तरह से इसके विराम बिंदु को नहीं उपयोग करता हैं।

परिभाषा
इसके अनुमान पर विचार करें तो प्राप्त होने वाले $$g(\theta)$$ डेटा के आधार पर $$X_1, X_2, \ldots, X_n$$ आई.आई.डी. घनत्व वाले समूह के किसी सदस्य से $$ p_\theta, \theta \in \Omega$$, जहाँ $$\Omega$$ पैरामीटर स्थान है। निष्पक्ष अनुमानक $$\delta(X_1, X_2, \ldots, X_n)$$ का $$ g(\theta) $$ UMVUE है यदि $$ \forall \theta \in \Omega$$,


 * $$ \operatorname{var}(\delta(X_1, X_2, \ldots, X_n)) \leq \operatorname{var}(\tilde{\delta}(X_1, X_2, \ldots, X_n)) $$

किसी अन्य निष्पक्ष अनुमानक के लिए $$ \tilde{\delta}. $$ यदि निष्पक्ष अनुमानक $$ g(\theta) $$ में सम्मिलित होता है, तो यह प्रमाणित कर सकता है कि अनिवार्य रूप से अद्वितीय UMVUE है। राव ब्लैकवेल प्रमेय का उपयोग करके किसी को भी यह प्रमाणित कर सकता है कि UMVUE का निर्धारण केवल उस विशेष समूह के लिए पूर्ण आँकड़ों के आधार पर पर्याप्त आँकड़ा खोजने की स्थिति प्रदर्शित होती है इस प्रकार $$p_\theta, \theta \in \Omega $$ की स्थिति के आधार पर किसी भी निष्पक्ष अनुमानक को अनुकूलित किया जाता हैं।

इसके अतिरिक्त, लेहमन-शेफ़े प्रमेय द्वारा, निष्पक्ष अनुमानक जो पूर्ण, पर्याप्त आँकड़ों का कार्य है, UMVUE अनुमानक है।

इस प्रकार औपचारिक रूप से मान लीजिए $$\delta(X_1, X_2, \ldots, X_n)$$ के लिए निष्पक्ष $$g(\theta)$$ है, ओर $$T$$ घनत्व के समूह के लिए पूर्ण पर्याप्त आँकड़ा है। तब


 * $$ \eta(X_1, X_2, \ldots, X_n) = \operatorname{E}(\delta(X_1, X_2, \ldots, X_n)\mid T)\,$$

के लिए UMVUE का मान $$g(\theta). $$ से प्रकट होता है, इस प्रकार बायेसियन सांख्यिकी एनालॉग बेयस अनुमानक को प्रकट करता है, इस प्रकार विशेष रूप से न्यूनतम औसत वर्ग त्रुटि (एमएमएसई) के साथ इसका मान उपयोग किया जाता हैं।

अनुमानक चयन
कुशल अनुमानक के सम्मिलित होने की आवश्यकता नहीं होती हैं, लेकिन यदि यह सम्मिलित पाया जाता है और निष्पक्ष रहता है इस स्थिति में यह UMVUE के रूप में उपयोग होता है। चूंकि अनुमानक δ का माध्य त्रुटि (एमएसई) से प्रदर्शित की जाती है जो इस प्रकार है-


 * $$ \operatorname{MSE}(\delta) = \operatorname{var}(\delta) +[ \operatorname{bias}(\delta)]^2 \ $$

UMVUE निष्पक्ष अनुमानकर्ताओं के बीच एमएसई को कम करता है। कुछ स्थितियों में पक्षपाती आकलनकर्ताओं का एमएसई का मान कम होता है क्योंकि उनके पास किसी भी निष्पक्ष अनुमानक की तुलना में प्रसरण कम होता है, इसके लिए अनुमानक पूर्वाग्रह को देख सकते हैं।

उदाहरण
डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर $$\mathbb{R} $$ घनत्व के साथ विचार करते हैं।


 * $$ p_\theta(x) = \frac{ \theta e^{-x} }{(1 + e^{-x})^{\theta + 1} } $$

और हम इसका यूएमवीयू अनुमानक खोजना चाहते हैं


 * $$ g(\theta) = \frac 1 {\theta^2} $$

पहले हम पहचानते हैं कि घनत्व को इस प्रकार लिखा जा सकता है


 * $$ \frac{ e^{-x} } { 1 + e^{-x} } \exp( -\theta \log(1 + e^{-x}) + \log(\theta)) $$

जो पर्याप्त आँकड़ों वाला घातीय समूह $$T = \log(1 + e^{-x})$$ है, इस प्रकार वास्तव में यह पूर्ण रैंक घातीय समूह है, और इसलिए $$ T $$ पूर्ण रूप से पर्याप्त माना जाता है। इस प्रकार घातीय समूह को देखा जा सकता हैं।

इस प्रकार व्युत्पत्ति के लिए यह मान इस प्रकार प्रकट किया जाता हैं।


 * $$ \operatorname{E}(T) = \frac 1 \theta,\quad \operatorname{var}(T) = \frac 1 {\theta^2} $$

इसलिए,


 * $$ \operatorname{E}(T^2) = \frac 2 {\theta^2} $$

यहाँ हम UMVUE प्राप्त करने के लिए लेहमन-शेफ़े प्रमेय का उपयोग करते हैं

स्पष्ट रूप से $$ \delta(X) = \frac{T^2} 2 $$ निष्पक्ष रूप से प्रकट होता है और $$T = \log(1 + e^{-x})$$ पूर्ण रूप से पर्याप्त रहता हैं, इस प्रकार यूएमवीयू आकलनकर्ता है


 * $$ \eta(X) = \operatorname{E}(\delta(X) \mid T) = \operatorname{E} \left( \left. \frac{T^2} 2 \,\right|\, T \right) = \frac{T^2} 2 = \frac{\log(1 + e^{-X})^2} 2 $$

यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य यूएमवीयू होगा, जैसा कि लेहमन-शेफ़े प्रमेय में बताया गया है।

अन्य उदाहरण

 * अज्ञात माध्य और विचरण के साथ सामान्य वितरण के लिए, प्रमाण माध्य और (निष्पक्ष) प्रमाण विचरण जनसंख्या माध्य और जनसंख्या विचरण के लिए UMVUE हैं।
 * चूंकि, जनसंख्या मानक विचलन के लिए प्रमाण मानक विचलन निष्पक्ष नहीं है - मानक विचलन का निष्पक्ष अनुमान देख सकते हैं।
 * इसके अतिरिक्त, अन्य वितरणों के लिए प्रमाण माध्य और प्रमाण विचरण सामान्य UMVUE में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ समान वितरण (निरंतर) के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए UMVUE है।
 * यदि अज्ञात ऊपरी बाउंड एन के साथ समुच्चय {1, 2, ..., N} पर असतत समान वितरण से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए UMVUE है
 * $$\frac{k+1}{k} m - 1,$$
 * जहाँ m प्रमाण अधिकतम है। यह प्रमाण अधिकतम का स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो पर्याप्त और पूर्ण आंकड़ा है। इस प्रकार विवरण के लिए जर्मन टैंक समस्या को देख सकते हैं।

यह भी देखें

 * क्रैमर-राव बाउंड
 * सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक (नीला)
 * पूर्वाग्रह-विचरण प्रमेय
 * लेहमन-शेफ़े प्रमेय
 * यू-सांख्यिकीय

बायेसियन एनालॉग

 * बेयस अनुमानक
 * न्यूनतम औसत वर्ग त्रुटि (एमएमएसई)