न्यूनतम-विचरण निष्पक्ष अनुमानक: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Unbiased statistical estimator minimizing variance}}आँकड़ों में न्यूनतम | {{Short description|Unbiased statistical estimator minimizing variance}}आँकड़ों में '''न्यूनतम विचरण निष्पक्ष अनुमानक''' (एमवीयूई) या समान रूप से यदि कहा जाए तो न्यूनतम-विचरण निष्पक्ष अनुमानक (यूएमवीयूई) उस [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम विचरण होते हैं। | ||
व्यावहारिक आँकड़ों की समस्याओं के लिए | व्यावहारिक आँकड़ों की समस्याओं के लिए एमवीयूई का निर्धारण करना महत्वपूर्ण है यदि उनमें से कोई इसमें सम्मिलित किया जाता है, क्योंकि कम-से-कम इष्टतम प्रक्रियाओं को स्वाभाविक रूप से कुछ समय के लिए निरस्त किया जा सकता हैं तथा अन्य चीजें इसके समान होती हैं। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास प्रचलित हुआ है। | ||
जबकि [[निष्पक्षता]] की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक | जबकि [[निष्पक्षता]] की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक समुच्चयिंग्स में अच्छे परिणाम मिलते हैं - एमवीयूई को विश्लेषण की विस्तृत श्रृंखला के लिए प्राकृतिक प्रारंभिक बिंदु बनाया जाता हैं - इस प्रकार लक्षित विनिर्देश किसी समस्या के लिए उत्तम प्रदर्शन कर सकता है, इस प्रकार, एमवीयूई सदैव सबसे अच्छी तरह से इसके विराम बिंदु को नहीं उपयोग करता हैं। | ||
== परिभाषा == | == परिभाषा == | ||
इसके अनुमान पर विचार करें तो प्राप्त होने वाले <math>g(\theta)</math> डेटा के आधार पर <math>X_1, X_2, \ldots, X_n</math> आई.आई.डी. घनत्व वाले समूह के किसी सदस्य से <math> p_\theta, \theta \in \Omega</math>, जहाँ <math>\Omega</math> पैरामीटर स्थान है। निष्पक्ष अनुमानक <math>\delta(X_1, X_2, \ldots, X_n)</math> का <math> g(\theta) </math> Uएमवीयूई है यदि <math> \forall \theta \in \Omega</math>, | |||
:<math> \operatorname{var}(\delta(X_1, X_2, \ldots, X_n)) \leq \operatorname{var}(\tilde{\delta}(X_1, X_2, \ldots, X_n)) </math> | :<math> \operatorname{var}(\delta(X_1, X_2, \ldots, X_n)) \leq \operatorname{var}(\tilde{\delta}(X_1, X_2, \ldots, X_n)) </math> | ||
किसी अन्य निष्पक्ष अनुमानक के लिए <math> \tilde{\delta}. </math> | किसी अन्य निष्पक्ष अनुमानक के लिए <math> \tilde{\delta}. </math> यदि निष्पक्ष अनुमानक <math> g(\theta) </math> में सम्मिलित होता है, तो यह प्रमाणित कर सकता है कि अनिवार्य रूप से अद्वितीय एमवीयूई है।<ref>{{Cite book|title=U-statistics : theory and practice|last=Lee, A. J., 1946-|date=1990|publisher=M. Dekker|isbn=0824782534|location=New York|oclc=21523971}}</ref> राव ब्लैकवेल प्रमेय का उपयोग करके किसी को भी यह प्रमाणित कर सकता है कि एमवीयूई का निर्धारण केवल उस विशेष समूह के लिए पूर्ण आँकड़ों के आधार पर [[पर्याप्त आँकड़ा]] खोजने की स्थिति प्रदर्शित होती है इस प्रकार <math>p_\theta, \theta \in \Omega </math> की स्थिति के आधार पर किसी भी निष्पक्ष अनुमानक को अनुकूलित किया जाता हैं। | ||
यदि निष्पक्ष अनुमानक <math> g(\theta) </math> | |||
इसके | इसके अतिरिक्त, लेहमन-शेफ़े प्रमेय द्वारा, निष्पक्ष अनुमानक जो पूर्ण, पर्याप्त आँकड़ों का कार्य है, यूएमवीयूई अनुमानक है। | ||
औपचारिक रूप से | इस प्रकार औपचारिक रूप से मान लीजिए <math>\delta(X_1, X_2, \ldots, X_n)</math> के लिए निष्पक्ष <math>g(\theta)</math> है, ओर <math>T</math> घनत्व के समूह के लिए पूर्ण पर्याप्त आँकड़ा है। तब | ||
:<math> \eta(X_1, X_2, \ldots, X_n) = \operatorname{E}(\delta(X_1, X_2, \ldots, X_n)\mid T)\,</math> | :<math> \eta(X_1, X_2, \ldots, X_n) = \operatorname{E}(\delta(X_1, X_2, \ldots, X_n)\mid T)\,</math> | ||
के लिए एमवीयूई | के लिए एमवीयूई का मान <math>g(\theta). </math> से प्रकट होता है, इस प्रकार [[बायेसियन सांख्यिकी]] एनालॉग [[बेयस अनुमानक]] को प्रकट करता है, इस प्रकार विशेष रूप से [[न्यूनतम औसत वर्ग त्रुटि]] (एमएमएसई) के साथ इसका मान उपयोग किया जाता हैं। | ||
[[बायेसियन सांख्यिकी]] एनालॉग [[बेयस अनुमानक]] है, विशेष रूप से [[न्यूनतम औसत वर्ग त्रुटि]] (एमएमएसई) के | |||
== अनुमानक चयन == | == अनुमानक चयन == | ||
[[कुशल अनुमानक]] के सम्मिलित होने की आवश्यकता नहीं होती हैं, लेकिन यदि यह सम्मिलित पाया जाता है और निष्पक्ष रहता है इस स्थिति में यह एमवीयूई के रूप में उपयोग होता है। चूंकि अनुमानक δ का माध्य त्रुटि (एमएसई) से प्रदर्शित की जाती है जो इस प्रकार है- | |||
यह एमवीयूई है। चूंकि अनुमानक δ का माध्य | |||
:<math> \operatorname{MSE}(\delta) = \operatorname{var}(\delta) +[ \operatorname{bias}(\delta)]^2 \ </math> | :<math> \operatorname{MSE}(\delta) = \operatorname{var}(\delta) +[ \operatorname{bias}(\delta)]^2 \ </math> | ||
एमवीयूई निष्पक्ष अनुमानकर्ताओं के बीच एमएसई को कम करता है। कुछ | एमवीयूई निष्पक्ष अनुमानकर्ताओं के बीच एमएसई को कम करता है। कुछ स्थितियों में पक्षपाती आकलनकर्ताओं का एमएसई का मान कम होता है क्योंकि उनके पास किसी भी निष्पक्ष अनुमानक की तुलना में प्रसरण कम होता है, इसके लिए [[अनुमानक पूर्वाग्रह]] को देख सकते हैं। | ||
== उदाहरण == | == उदाहरण == | ||
डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर | डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर <math>\mathbb{R} </math> घनत्व के साथ विचार करते हैं। | ||
:<math> p_\theta(x) = \frac{ \theta e^{-x} }{(1 + e^{-x})^{\theta + 1} } </math> | :<math> p_\theta(x) = \frac{ \theta e^{-x} }{(1 + e^{-x})^{\theta + 1} } </math> | ||
और हम इसका | और हम इसका यूएमवीयू अनुमानक खोजना चाहते हैं | ||
:<math> g(\theta) = \frac 1 {\theta^2} </math> | :<math> g(\theta) = \frac 1 {\theta^2} </math> | ||
Line 37: | Line 34: | ||
:<math> \frac{ e^{-x} } { 1 + e^{-x} } \exp( -\theta \log(1 + e^{-x}) + \log(\theta)) </math> | :<math> \frac{ e^{-x} } { 1 + e^{-x} } \exp( -\theta \log(1 + e^{-x}) + \log(\theta)) </math> | ||
जो पर्याप्त आँकड़ों वाला घातीय | जो पर्याप्त आँकड़ों वाला घातीय समूह <math>T = \log(1 + e^{-x})</math> है, इस प्रकार वास्तव में यह पूर्ण रैंक घातीय समूह है, और इसलिए <math> T </math> पूर्ण रूप से पर्याप्त माना जाता है। इस प्रकार [[घातीय परिवार|घातीय समूह]] को देखा जा सकता हैं। | ||
इस प्रकार व्युत्पत्ति के लिए यह मान इस प्रकार प्रकट किया जाता हैं। | |||
: <math> \operatorname{E}(T) = \frac 1 \theta,\quad \operatorname{var}(T) = \frac 1 {\theta^2} </math> | : <math> \operatorname{E}(T) = \frac 1 \theta,\quad \operatorname{var}(T) = \frac 1 {\theta^2} </math> | ||
Line 44: | Line 42: | ||
:<math> \operatorname{E}(T^2) = \frac 2 {\theta^2} </math> | :<math> \operatorname{E}(T^2) = \frac 2 {\theta^2} </math> | ||
यहाँ हम | यहाँ हम एमवीयूई प्राप्त करने के लिए लेहमन-शेफ़े प्रमेय का उपयोग करते हैं | ||
स्पष्ट रूप से <math> \delta(X) = \frac{T^2} 2 </math> निष्पक्ष है और <math>T = \log(1 + e^{-x})</math> पूर्ण पर्याप्त | स्पष्ट रूप से <math> \delta(X) = \frac{T^2} 2 </math> निष्पक्ष रूप से प्रकट होता है और <math>T = \log(1 + e^{-x})</math> पूर्ण रूप से पर्याप्त रहता हैं, इस प्रकार यूएमवीयू आकलनकर्ता है | ||
:<math> \eta(X) = \operatorname{E}(\delta(X) \mid T) = \operatorname{E} \left( \left. \frac{T^2} 2 \,\right|\, T \right) = \frac{T^2} 2 = \frac{\log(1 + e^{-X})^2} 2 </math> | :<math> \eta(X) = \operatorname{E}(\delta(X) \mid T) = \operatorname{E} \left( \left. \frac{T^2} 2 \,\right|\, T \right) = \frac{T^2} 2 = \frac{\log(1 + e^{-X})^2} 2 </math> | ||
यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य | यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य यूएमवीयू होगा, जैसा कि लेहमन-शेफ़े प्रमेय में बताया गया है। | ||
== अन्य उदाहरण == | == अन्य उदाहरण == | ||
* अज्ञात माध्य और | * अज्ञात माध्य और विचरण के साथ सामान्य वितरण के लिए, [[नमूना माध्य|प्रमाण माध्य]] और (निष्पक्ष) प्रमाण विचरण जनसंख्या माध्य और जनसंख्या विचरण के लिए एमवीयूई हैं। | ||
*: | *: चूंकि, जनसंख्या मानक विचलन के लिए [[नमूना मानक विचलन|प्रमाण मानक विचलन]] निष्पक्ष नहीं है - [[मानक विचलन का निष्पक्ष अनुमान]] देख सकते हैं। | ||
*: इसके | *: इसके अतिरिक्त, अन्य वितरणों के लिए प्रमाण माध्य और प्रमाण विचरण सामान्य एमवीयूई में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ [[समान वितरण (निरंतर)]] के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए एमवीयूई है। | ||
* यदि अज्ञात ऊपरी बाउंड एन के साथ | * यदि अज्ञात ऊपरी बाउंड एन के साथ समुच्चय {1, 2, ..., N} पर [[असतत समान वितरण]] से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए एमवीयूई है | ||
:: <math>\frac{k+1}{k} m - 1,</math> | :: <math>\frac{k+1}{k} m - 1,</math> | ||
:जहाँ m [[नमूना अधिकतम]] है। यह | :जहाँ m [[नमूना अधिकतम|प्रमाण अधिकतम]] है। यह प्रमाण अधिकतम का स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो पर्याप्त और पूर्ण आंकड़ा है। इस प्रकार विवरण के लिए [[जर्मन टैंक समस्या]] को देख सकते हैं। | ||
== यह भी देखें == | == यह भी देखें == | ||
* क्रैमर-राव बाउंड | * क्रैमर-राव बाउंड | ||
* [[सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक]] (नीला) | * [[सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक]] (नीला) | ||
* पूर्वाग्रह-विचरण | * पूर्वाग्रह-विचरण प्रमेय | ||
* लेहमन-शेफ़े प्रमेय | * लेहमन-शेफ़े प्रमेय | ||
* [[यू-सांख्यिकीय]] | * [[यू-सांख्यिकीय]] |
Revision as of 20:45, 30 March 2023
आँकड़ों में न्यूनतम विचरण निष्पक्ष अनुमानक (एमवीयूई) या समान रूप से यदि कहा जाए तो न्यूनतम-विचरण निष्पक्ष अनुमानक (यूएमवीयूई) उस अनुमानक का पूर्वाग्रह है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम विचरण होते हैं।
व्यावहारिक आँकड़ों की समस्याओं के लिए एमवीयूई का निर्धारण करना महत्वपूर्ण है यदि उनमें से कोई इसमें सम्मिलित किया जाता है, क्योंकि कम-से-कम इष्टतम प्रक्रियाओं को स्वाभाविक रूप से कुछ समय के लिए निरस्त किया जा सकता हैं तथा अन्य चीजें इसके समान होती हैं। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास प्रचलित हुआ है।
जबकि निष्पक्षता की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक समुच्चयिंग्स में अच्छे परिणाम मिलते हैं - एमवीयूई को विश्लेषण की विस्तृत श्रृंखला के लिए प्राकृतिक प्रारंभिक बिंदु बनाया जाता हैं - इस प्रकार लक्षित विनिर्देश किसी समस्या के लिए उत्तम प्रदर्शन कर सकता है, इस प्रकार, एमवीयूई सदैव सबसे अच्छी तरह से इसके विराम बिंदु को नहीं उपयोग करता हैं।
परिभाषा
इसके अनुमान पर विचार करें तो प्राप्त होने वाले डेटा के आधार पर आई.आई.डी. घनत्व वाले समूह के किसी सदस्य से , जहाँ पैरामीटर स्थान है। निष्पक्ष अनुमानक का Uएमवीयूई है यदि ,
किसी अन्य निष्पक्ष अनुमानक के लिए यदि निष्पक्ष अनुमानक में सम्मिलित होता है, तो यह प्रमाणित कर सकता है कि अनिवार्य रूप से अद्वितीय एमवीयूई है।[1] राव ब्लैकवेल प्रमेय का उपयोग करके किसी को भी यह प्रमाणित कर सकता है कि एमवीयूई का निर्धारण केवल उस विशेष समूह के लिए पूर्ण आँकड़ों के आधार पर पर्याप्त आँकड़ा खोजने की स्थिति प्रदर्शित होती है इस प्रकार की स्थिति के आधार पर किसी भी निष्पक्ष अनुमानक को अनुकूलित किया जाता हैं।
इसके अतिरिक्त, लेहमन-शेफ़े प्रमेय द्वारा, निष्पक्ष अनुमानक जो पूर्ण, पर्याप्त आँकड़ों का कार्य है, यूएमवीयूई अनुमानक है।
इस प्रकार औपचारिक रूप से मान लीजिए के लिए निष्पक्ष है, ओर घनत्व के समूह के लिए पूर्ण पर्याप्त आँकड़ा है। तब
के लिए एमवीयूई का मान से प्रकट होता है, इस प्रकार बायेसियन सांख्यिकी एनालॉग बेयस अनुमानक को प्रकट करता है, इस प्रकार विशेष रूप से न्यूनतम औसत वर्ग त्रुटि (एमएमएसई) के साथ इसका मान उपयोग किया जाता हैं।
अनुमानक चयन
कुशल अनुमानक के सम्मिलित होने की आवश्यकता नहीं होती हैं, लेकिन यदि यह सम्मिलित पाया जाता है और निष्पक्ष रहता है इस स्थिति में यह एमवीयूई के रूप में उपयोग होता है। चूंकि अनुमानक δ का माध्य त्रुटि (एमएसई) से प्रदर्शित की जाती है जो इस प्रकार है-
एमवीयूई निष्पक्ष अनुमानकर्ताओं के बीच एमएसई को कम करता है। कुछ स्थितियों में पक्षपाती आकलनकर्ताओं का एमएसई का मान कम होता है क्योंकि उनके पास किसी भी निष्पक्ष अनुमानक की तुलना में प्रसरण कम होता है, इसके लिए अनुमानक पूर्वाग्रह को देख सकते हैं।
उदाहरण
डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर घनत्व के साथ विचार करते हैं।
और हम इसका यूएमवीयू अनुमानक खोजना चाहते हैं
पहले हम पहचानते हैं कि घनत्व को इस प्रकार लिखा जा सकता है
जो पर्याप्त आँकड़ों वाला घातीय समूह है, इस प्रकार वास्तव में यह पूर्ण रैंक घातीय समूह है, और इसलिए पूर्ण रूप से पर्याप्त माना जाता है। इस प्रकार घातीय समूह को देखा जा सकता हैं।
इस प्रकार व्युत्पत्ति के लिए यह मान इस प्रकार प्रकट किया जाता हैं।
इसलिए,
यहाँ हम एमवीयूई प्राप्त करने के लिए लेहमन-शेफ़े प्रमेय का उपयोग करते हैं
स्पष्ट रूप से निष्पक्ष रूप से प्रकट होता है और पूर्ण रूप से पर्याप्त रहता हैं, इस प्रकार यूएमवीयू आकलनकर्ता है
यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य यूएमवीयू होगा, जैसा कि लेहमन-शेफ़े प्रमेय में बताया गया है।
अन्य उदाहरण
- अज्ञात माध्य और विचरण के साथ सामान्य वितरण के लिए, प्रमाण माध्य और (निष्पक्ष) प्रमाण विचरण जनसंख्या माध्य और जनसंख्या विचरण के लिए एमवीयूई हैं।
- चूंकि, जनसंख्या मानक विचलन के लिए प्रमाण मानक विचलन निष्पक्ष नहीं है - मानक विचलन का निष्पक्ष अनुमान देख सकते हैं।
- इसके अतिरिक्त, अन्य वितरणों के लिए प्रमाण माध्य और प्रमाण विचरण सामान्य एमवीयूई में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ समान वितरण (निरंतर) के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए एमवीयूई है।
- यदि अज्ञात ऊपरी बाउंड एन के साथ समुच्चय {1, 2, ..., N} पर असतत समान वितरण से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए एमवीयूई है
- जहाँ m प्रमाण अधिकतम है। यह प्रमाण अधिकतम का स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो पर्याप्त और पूर्ण आंकड़ा है। इस प्रकार विवरण के लिए जर्मन टैंक समस्या को देख सकते हैं।
यह भी देखें
- क्रैमर-राव बाउंड
- सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक (नीला)
- पूर्वाग्रह-विचरण प्रमेय
- लेहमन-शेफ़े प्रमेय
- यू-सांख्यिकीय
बायेसियन एनालॉग
- बेयस अनुमानक
- न्यूनतम औसत वर्ग त्रुटि (एमएमएसई)
संदर्भ
- Keener, Robert W. (2006). Statistical Theory: Notes for a Course in Theoretical Statistics. Springer. pp. 47–48, 57–58.
- Voinov V. G., Nikulin M.S. (1993). Unbiased estimators and their applications, Vol.1: Univariate case. Kluwer Academic Publishers. pp. 521p.