न्यूनतम-विचरण निष्पक्ष अनुमानक: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Unbiased statistical estimator minimizing variance}}{{Refimprove|date=November 2009}}आँकड़ों में एक न्यूनतम-भिन...")
 
No edit summary
Line 1: Line 1:
{{Short description|Unbiased statistical estimator minimizing variance}}{{Refimprove|date=November 2009}}आँकड़ों में एक न्यूनतम-भिन्नता निष्पक्ष अनुमानक (एमवीयूई) या समान रूप से न्यूनतम-भिन्नता निष्पक्ष अनुमानक (यूएमवीयूई) [[एक अनुमानक का पूर्वाग्रह]] है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम भिन्नता है।
{{Short description|Unbiased statistical estimator minimizing variance}}आँकड़ों में न्यूनतम-भिन्नता निष्पक्ष अनुमानक (एमवीयूई) या समान रूप से न्यूनतम-भिन्नता निष्पक्ष अनुमानक (यूएमवीयूई) [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम भिन्नता है।


व्यावहारिक आँकड़ों की समस्याओं के लिए, एमवीयूई का निर्धारण करना महत्वपूर्ण है यदि कोई मौजूद है, क्योंकि कम-से-इष्टतम प्रक्रियाओं को स्वाभाविक रूप से टाला जाएगा, अन्य चीजें समान होंगी। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास हुआ है।
व्यावहारिक आँकड़ों की समस्याओं के लिए, एमवीयूई का निर्धारण करना महत्वपूर्ण है यदि कोई मौजूद है, क्योंकि कम-से-इष्टतम प्रक्रियाओं को स्वाभाविक रूप से टाला जाएगा, अन्य चीजें समान होंगी। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास हुआ है।


जबकि [[निष्पक्षता]] की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक सेटिंग्स में अच्छे परिणाम मिलते हैं - MVUE को विश्लेषण की एक विस्तृत श्रृंखला के लिए एक प्राकृतिक प्रारंभिक बिंदु बनाते हैं - एक लक्षित विनिर्देश किसी समस्या के लिए बेहतर प्रदर्शन कर सकता है; इस प्रकार, एमवीयूई हमेशा सबसे अच्छा रोक बिंदु नहीं होता है।
जबकि [[निष्पक्षता]] की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक सेटिंग्स में अच्छे परिणाम मिलते हैं - MVUE को विश्लेषण की विस्तृत श्रृंखला के लिए प्राकृतिक प्रारंभिक बिंदु बनाते हैं - लक्षित विनिर्देश किसी समस्या के लिए बेहतर प्रदर्शन कर सकता है; इस प्रकार, एमवीयूई हमेशा सबसे अच्छा रोक बिंदु नहीं होता है।


== परिभाषा ==
== परिभाषा ==
के अनुमान पर विचार करें <math>g(\theta)</math> डेटा के आधार पर <math>X_1, X_2, \ldots, X_n</math> आई.आई.डी. घनत्व वाले परिवार के किसी सदस्य से <math> p_\theta, \theta \in \Omega</math>, कहाँ <math>\Omega</math> पैरामीटर स्थान है। एक निष्पक्ष अनुमानक <math>\delta(X_1, X_2, \ldots, X_n)</math> का <math> g(\theta) </math> UMVUE है अगर <math> \forall \theta \in \Omega</math>,
के अनुमान पर विचार करें <math>g(\theta)</math> डेटा के आधार पर <math>X_1, X_2, \ldots, X_n</math> आई.आई.डी. घनत्व वाले परिवार के किसी सदस्य से <math> p_\theta, \theta \in \Omega</math>, कहाँ <math>\Omega</math> पैरामीटर स्थान है। निष्पक्ष अनुमानक <math>\delta(X_1, X_2, \ldots, X_n)</math> का <math> g(\theta) </math> UMVUE है अगर <math> \forall \theta \in \Omega</math>,


:<math> \operatorname{var}(\delta(X_1, X_2, \ldots, X_n)) \leq \operatorname{var}(\tilde{\delta}(X_1, X_2, \ldots, X_n)) </math>
:<math> \operatorname{var}(\delta(X_1, X_2, \ldots, X_n)) \leq \operatorname{var}(\tilde{\delta}(X_1, X_2, \ldots, X_n)) </math>
किसी अन्य निष्पक्ष अनुमानक के लिए <math> \tilde{\delta}. </math>
किसी अन्य निष्पक्ष अनुमानक के लिए <math> \tilde{\delta}. </math>
यदि एक निष्पक्ष अनुमानक <math> g(\theta) </math> मौजूद है, तो कोई यह साबित कर सकता है कि अनिवार्य रूप से अद्वितीय एमवीयूई है।<ref>{{Cite book|title=U-statistics : theory and practice|last=Lee, A. J., 1946-|date=1990|publisher=M. Dekker|isbn=0824782534|location=New York|oclc=21523971}}</ref> राव-ब्लैकवेल प्रमेय का उपयोग करके कोई यह भी साबित कर सकता है कि एमवीयूई का निर्धारण केवल परिवार के लिए एक पूर्ण आँकड़ा [[पर्याप्त आँकड़ा]] खोजने का मामला है <math>p_\theta, \theta \in \Omega </math> और उस पर किसी भी निष्पक्ष अनुमानक को अनुकूलित करना।
यदि निष्पक्ष अनुमानक <math> g(\theta) </math> मौजूद है, तो कोई यह साबित कर सकता है कि अनिवार्य रूप से अद्वितीय एमवीयूई है।<ref>{{Cite book|title=U-statistics : theory and practice|last=Lee, A. J., 1946-|date=1990|publisher=M. Dekker|isbn=0824782534|location=New York|oclc=21523971}}</ref> राव-ब्लैकवेल प्रमेय का उपयोग करके कोई यह भी साबित कर सकता है कि एमवीयूई का निर्धारण केवल परिवार के लिए पूर्ण आँकड़ा [[पर्याप्त आँकड़ा]] खोजने का मामला है <math>p_\theta, \theta \in \Omega </math> और उस पर किसी भी निष्पक्ष अनुमानक को अनुकूलित करना।


इसके अलावा, लेहमन-शेफ़े प्रमेय द्वारा, एक निष्पक्ष अनुमानक जो एक पूर्ण, पर्याप्त आँकड़ों का एक कार्य है, यूएमवीयूई अनुमानक है।
इसके अलावा, लेहमन-शेफ़े प्रमेय द्वारा, निष्पक्ष अनुमानक जो पूर्ण, पर्याप्त आँकड़ों का कार्य है, यूएमवीयूई अनुमानक है।


औपचारिक रूप से रखो, मान लीजिए <math>\delta(X_1, X_2, \ldots, X_n)</math> के लिए निष्पक्ष है <math>g(\theta)</math>, ओर वो <math>T</math> घनत्व के परिवार के लिए एक पूर्ण पर्याप्त आँकड़ा है। तब
औपचारिक रूप से रखो, मान लीजिए <math>\delta(X_1, X_2, \ldots, X_n)</math> के लिए निष्पक्ष है <math>g(\theta)</math>, ओर वो <math>T</math> घनत्व के परिवार के लिए पूर्ण पर्याप्त आँकड़ा है। तब


:<math> \eta(X_1, X_2, \ldots, X_n) = \operatorname{E}(\delta(X_1, X_2, \ldots, X_n)\mid T)\,</math>
:<math> \eta(X_1, X_2, \ldots, X_n) = \operatorname{E}(\delta(X_1, X_2, \ldots, X_n)\mid T)\,</math>
के लिए एमवीयूई है <math>g(\theta). </math>
के लिए एमवीयूई है <math>g(\theta). </math>
[[बायेसियन सांख्यिकी]] एनालॉग एक [[बेयस अनुमानक]] है, विशेष रूप से [[न्यूनतम औसत वर्ग त्रुटि]] (एमएमएसई) के साथ।
[[बायेसियन सांख्यिकी]] एनालॉग [[बेयस अनुमानक]] है, विशेष रूप से [[न्यूनतम औसत वर्ग त्रुटि]] (एमएमएसई) के साथ।


== अनुमानक चयन ==
== अनुमानक चयन ==
एक [[कुशल अनुमानक]] के मौजूद होने की आवश्यकता नहीं है, लेकिन यदि यह मौजूद है और यदि यह निष्पक्ष है,
एक [[कुशल अनुमानक]] के मौजूद होने की आवश्यकता नहीं है, लेकिन यदि यह मौजूद है और यदि यह निष्पक्ष है,
यह एमवीयूई है। चूंकि एक अनुमानक δ का माध्य चुकता त्रुटि (MSE) है
यह एमवीयूई है। चूंकि अनुमानक δ का माध्य चुकता त्रुटि (MSE) है


:<math> \operatorname{MSE}(\delta) = \operatorname{var}(\delta) +[ \operatorname{bias}(\delta)]^2 \ </math>
:<math> \operatorname{MSE}(\delta) = \operatorname{var}(\delta) +[ \operatorname{bias}(\delta)]^2 \ </math>
Line 28: Line 28:


== उदाहरण ==
== उदाहरण ==
डेटा को एक पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर विचार करें <math>\mathbb{R} </math> घनत्व के साथ
डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर विचार करें <math>\mathbb{R} </math> घनत्व के साथ


:<math> p_\theta(x) = \frac{ \theta e^{-x} }{(1 + e^{-x})^{\theta + 1} } </math>
:<math> p_\theta(x) = \frac{ \theta e^{-x} }{(1 + e^{-x})^{\theta + 1} } </math>
Line 37: Line 37:


:<math> \frac{ e^{-x} } { 1 + e^{-x} } \exp( -\theta \log(1 + e^{-x}) + \log(\theta)) </math>
:<math> \frac{ e^{-x} } { 1 + e^{-x} } \exp( -\theta \log(1 + e^{-x}) + \log(\theta)) </math>
जो पर्याप्त आँकड़ों वाला एक घातीय परिवार है <math>T = \log(1 + e^{-x})</math>. वास्तव में यह एक पूर्ण रैंक घातीय परिवार है, और इसलिए <math> T </math> पूर्ण पर्याप्त है। [[घातीय परिवार]] देखें
जो पर्याप्त आँकड़ों वाला घातीय परिवार है <math>T = \log(1 + e^{-x})</math>. वास्तव में यह पूर्ण रैंक घातीय परिवार है, और इसलिए <math> T </math> पूर्ण पर्याप्त है। [[घातीय परिवार]] देखें
एक व्युत्पत्ति के लिए जो दिखाता है
एक व्युत्पत्ति के लिए जो दिखाता है


Line 49: Line 49:


:<math> \eta(X) = \operatorname{E}(\delta(X) \mid T) = \operatorname{E} \left( \left. \frac{T^2} 2 \,\right|\, T \right) = \frac{T^2} 2 = \frac{\log(1 + e^{-X})^2} 2 </math>
:<math> \eta(X) = \operatorname{E}(\delta(X) \mid T) = \operatorname{E} \left( \left. \frac{T^2} 2 \,\right|\, T \right) = \frac{T^2} 2 = \frac{\log(1 + e^{-X})^2} 2 </math>
यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का एक निष्पक्ष कार्य UMVU होगा, जैसा कि लेहमन-शेफ़े प्रमेय कहता है।
यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य UMVU होगा, जैसा कि लेहमन-शेफ़े प्रमेय कहता है।


== अन्य उदाहरण ==
== अन्य उदाहरण ==
* अज्ञात माध्य और भिन्नता के साथ सामान्य वितरण के लिए, [[नमूना माध्य]] और (निष्पक्ष) नमूना भिन्नता जनसंख्या माध्य और जनसंख्या भिन्नता के लिए एमवीयूई हैं।
* अज्ञात माध्य और भिन्नता के साथ सामान्य वितरण के लिए, [[नमूना माध्य]] और (निष्पक्ष) नमूना भिन्नता जनसंख्या माध्य और जनसंख्या भिन्नता के लिए एमवीयूई हैं।
*: हालांकि, जनसंख्या मानक विचलन के लिए [[नमूना मानक विचलन]] निष्पक्ष नहीं है - [[मानक विचलन का निष्पक्ष अनुमान]] देखें।
*: हालांकि, जनसंख्या मानक विचलन के लिए [[नमूना मानक विचलन]] निष्पक्ष नहीं है - [[मानक विचलन का निष्पक्ष अनुमान]] देखें।
*: इसके अलावा, अन्य वितरणों के लिए नमूना माध्य और नमूना भिन्नता सामान्य एमवीयूई में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ एक [[समान वितरण (निरंतर)]] के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए एमवीयूई है।
*: इसके अलावा, अन्य वितरणों के लिए नमूना माध्य और नमूना भिन्नता सामान्य एमवीयूई में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ [[समान वितरण (निरंतर)]] के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए एमवीयूई है।
* यदि अज्ञात ऊपरी बाउंड एन के साथ सेट {1, 2, ..., N} पर [[असतत समान वितरण]] से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए MVUE है
* यदि अज्ञात ऊपरी बाउंड एन के साथ सेट {1, 2, ..., N} पर [[असतत समान वितरण]] से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए MVUE है
:: <math>\frac{k+1}{k} m - 1,</math>
:: <math>\frac{k+1}{k} m - 1,</math>
:जहाँ m [[नमूना अधिकतम]] है। यह नमूना अधिकतम का एक स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो एक पर्याप्त और पूर्ण आंकड़ा है। विवरण के लिए [[जर्मन टैंक समस्या]] देखें।
:जहाँ m [[नमूना अधिकतम]] है। यह नमूना अधिकतम का स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो पर्याप्त और पूर्ण आंकड़ा है। विवरण के लिए [[जर्मन टैंक समस्या]] देखें।


== यह भी देखें ==
== यह भी देखें ==
Line 86: Line 86:
   | date = 1993  
   | date = 1993  
   | pages = 521p }}
   | pages = 521p }}
{{Statistics|inference|collapsed}}
[[Category: क़ीमत लगानेवाला]]  
[[Category: क़ीमत लगानेवाला]]  



Revision as of 22:06, 29 March 2023

आँकड़ों में न्यूनतम-भिन्नता निष्पक्ष अनुमानक (एमवीयूई) या समान रूप से न्यूनतम-भिन्नता निष्पक्ष अनुमानक (यूएमवीयूई) अनुमानक का पूर्वाग्रह है जिसमें पैरामीटर के सभी संभावित मूल्यों के लिए किसी भी अन्य निष्पक्ष अनुमानक की तुलना में कम भिन्नता है।

व्यावहारिक आँकड़ों की समस्याओं के लिए, एमवीयूई का निर्धारण करना महत्वपूर्ण है यदि कोई मौजूद है, क्योंकि कम-से-इष्टतम प्रक्रियाओं को स्वाभाविक रूप से टाला जाएगा, अन्य चीजें समान होंगी। इससे इष्टतम अनुमान की समस्या से संबंधित सांख्यिकीय सिद्धांत का पर्याप्त विकास हुआ है।

जबकि निष्पक्षता की बाधा को कम से कम विचरण की वांछनीयता मीट्रिक के साथ जोड़कर अधिकांश व्यावहारिक सेटिंग्स में अच्छे परिणाम मिलते हैं - MVUE को विश्लेषण की विस्तृत श्रृंखला के लिए प्राकृतिक प्रारंभिक बिंदु बनाते हैं - लक्षित विनिर्देश किसी समस्या के लिए बेहतर प्रदर्शन कर सकता है; इस प्रकार, एमवीयूई हमेशा सबसे अच्छा रोक बिंदु नहीं होता है।

परिभाषा

के अनुमान पर विचार करें डेटा के आधार पर आई.आई.डी. घनत्व वाले परिवार के किसी सदस्य से , कहाँ पैरामीटर स्थान है। निष्पक्ष अनुमानक का UMVUE है अगर ,

किसी अन्य निष्पक्ष अनुमानक के लिए यदि निष्पक्ष अनुमानक मौजूद है, तो कोई यह साबित कर सकता है कि अनिवार्य रूप से अद्वितीय एमवीयूई है।[1] राव-ब्लैकवेल प्रमेय का उपयोग करके कोई यह भी साबित कर सकता है कि एमवीयूई का निर्धारण केवल परिवार के लिए पूर्ण आँकड़ा पर्याप्त आँकड़ा खोजने का मामला है और उस पर किसी भी निष्पक्ष अनुमानक को अनुकूलित करना।

इसके अलावा, लेहमन-शेफ़े प्रमेय द्वारा, निष्पक्ष अनुमानक जो पूर्ण, पर्याप्त आँकड़ों का कार्य है, यूएमवीयूई अनुमानक है।

औपचारिक रूप से रखो, मान लीजिए के लिए निष्पक्ष है , ओर वो घनत्व के परिवार के लिए पूर्ण पर्याप्त आँकड़ा है। तब

के लिए एमवीयूई है बायेसियन सांख्यिकी एनालॉग बेयस अनुमानक है, विशेष रूप से न्यूनतम औसत वर्ग त्रुटि (एमएमएसई) के साथ।

अनुमानक चयन

एक कुशल अनुमानक के मौजूद होने की आवश्यकता नहीं है, लेकिन यदि यह मौजूद है और यदि यह निष्पक्ष है, यह एमवीयूई है। चूंकि अनुमानक δ का माध्य चुकता त्रुटि (MSE) है

एमवीयूई निष्पक्ष अनुमानकर्ताओं के बीच एमएसई को कम करता है। कुछ मामलों में पक्षपाती आकलनकर्ताओं का MSE कम होता है क्योंकि उनके पास किसी भी निष्पक्ष अनुमानक की तुलना में छोटा प्रसरण होता है; अनुमानक पूर्वाग्रह देखें।

उदाहरण

डेटा को पूर्ण निरंतर यादृच्छिक चर से एकल अवलोकन होने पर विचार करें घनत्व के साथ

और हम इसका UMVU अनुमानक खोजना चाहते हैं

पहले हम पहचानते हैं कि घनत्व को इस प्रकार लिखा जा सकता है

जो पर्याप्त आँकड़ों वाला घातीय परिवार है . वास्तव में यह पूर्ण रैंक घातीय परिवार है, और इसलिए पूर्ण पर्याप्त है। घातीय परिवार देखें एक व्युत्पत्ति के लिए जो दिखाता है

इसलिए,

यहाँ हम MVUE प्राप्त करने के लिए लेहमन-शेफ़े प्रमेय का उपयोग करते हैं

स्पष्ट रूप से निष्पक्ष है और पूर्ण पर्याप्त है, इस प्रकार UMVU आकलनकर्ता है

यह उदाहरण दिखाता है कि पूर्ण पर्याप्त आँकड़ों का निष्पक्ष कार्य UMVU होगा, जैसा कि लेहमन-शेफ़े प्रमेय कहता है।

अन्य उदाहरण

  • अज्ञात माध्य और भिन्नता के साथ सामान्य वितरण के लिए, नमूना माध्य और (निष्पक्ष) नमूना भिन्नता जनसंख्या माध्य और जनसंख्या भिन्नता के लिए एमवीयूई हैं।
    हालांकि, जनसंख्या मानक विचलन के लिए नमूना मानक विचलन निष्पक्ष नहीं है - मानक विचलन का निष्पक्ष अनुमान देखें।
    इसके अलावा, अन्य वितरणों के लिए नमूना माध्य और नमूना भिन्नता सामान्य एमवीयूई में नहीं हैं - अज्ञात ऊपरी और निचली सीमाओं के साथ समान वितरण (निरंतर) के लिए, मध्य-श्रेणी जनसंख्या माध्य के लिए एमवीयूई है।
  • यदि अज्ञात ऊपरी बाउंड एन के साथ सेट {1, 2, ..., N} पर असतत समान वितरण से k उदाहरण चुने जाते हैं (प्रतिस्थापन के बिना), N के लिए MVUE है
जहाँ m नमूना अधिकतम है। यह नमूना अधिकतम का स्केल और स्थानांतरित (इतना निष्पक्ष) परिवर्तन है, जो पर्याप्त और पूर्ण आंकड़ा है। विवरण के लिए जर्मन टैंक समस्या देखें।

यह भी देखें

बायेसियन एनालॉग

  • बेयस अनुमानक
  • न्यूनतम औसत वर्ग त्रुटि (एमएमएसई)

संदर्भ

  1. Lee, A. J., 1946- (1990). U-statistics : theory and practice. New York: M. Dekker. ISBN 0824782534. OCLC 21523971.{{cite book}}: CS1 maint: multiple names: authors list (link)
  • Keener, Robert W. (2006). Statistical Theory: Notes for a Course in Theoretical Statistics. Springer. pp. 47–48, 57–58.
  • Voinov V. G., Nikulin M.S. (1993). Unbiased estimators and their applications, Vol.1: Univariate case. Kluwer Academic Publishers. pp. 521p.