अपरिवर्तनीय अनुमानक

सांख्यिकी में, एक अपरिवर्तनीय अनुमानक होने की अवधारणा एक मानदंड है जिसका उपयोग एक ही मात्रा के लिए विभिन्न अनुमानकों के गुणों की तुलना करने के लिए किया जा सकता है। यह इस विचार को औपचारिक रूप देने का एक तरीका है कि एक अनुमानकर्ता के पास कुछ सहज रूप से आकर्षक गुण होने चाहिए। कड़ाई से बोलते हुए, अपरिवर्तनीय का अर्थ यह होगा कि जब माप और पैरामीटर दोनों को संगत तरीके से बदल दिया जाता है तो अनुमान स्वयं अपरिवर्तित होते हैं, लेकिन ऐसे परिवर्तनों के साथ अनुमानों को उचित तरीकों से बदलने की अनुमति देने के लिए अर्थ बढ़ाया गया है। समतुल्य मानचित्र शब्द का उपयोग औपचारिक गणितीय संदर्भों में किया जाता है जिसमें डेटासेट और पैरामीटराइजेशन में परिवर्तन के जवाब में अनुमानक के बदलने के तरीके के संबंध का सटीक विवरण शामिल होता है: यह अधिक सामान्य गणित में इक्विवेरिएंट मानचित्र के उपयोग से मेल खाता है।

पृष्ठभूमि
सांख्यिकीय अनुमान में, अनुमान सिद्धांत के कई दृष्टिकोण हैं जिनका उपयोग तुरंत यह तय करने के लिए किया जा सकता है कि उन दृष्टिकोणों के अनुसार कौन से अनुमानकों का उपयोग किया जाना चाहिए। उदाहरण के लिए, बायेसियन अनुमान के विचार सीधे बायेसियन अनुमानकों तक ले जाएंगे। इसी तरह, शास्त्रीय सांख्यिकीय अनुमान का सिद्धांत कभी-कभी इस बारे में मजबूत निष्कर्ष निकाल सकता है कि किस अनुमानक का उपयोग किया जाना चाहिए। हालाँकि, इन सिद्धांतों की उपयोगिता पूरी तरह से निर्धारित सांख्यिकीय मॉडल पर निर्भर करती है और अनुमानक को निर्धारित करने के लिए प्रासंगिक हानि फ़ंक्शन पर भी निर्भर हो सकती है। इस प्रकार एक बायेसियन अनुमान लगाया जा सकता है, जिससे प्रासंगिक मापदंडों के लिए एक पश्च वितरण हो सकता है, लेकिन एक विशिष्ट उपयोगिता या हानि फ़ंक्शन का उपयोग अस्पष्ट हो सकता है। अपरिवर्तनीयता के विचारों को पश्च वितरण को सारांशित करने के कार्य पर लागू किया जा सकता है। अन्य मामलों में, सांख्यिकीय विश्लेषण पूरी तरह से परिभाषित सांख्यिकीय मॉडल के बिना किए जाते हैं या सांख्यिकीय अनुमान के शास्त्रीय सिद्धांत को आसानी से लागू नहीं किया जा सकता है क्योंकि जिन मॉडलों के परिवार पर विचार किया जा रहा है वे इस तरह के उपचार के लिए उत्तरदायी नहीं हैं। इन मामलों के अलावा, जहां सामान्य सिद्धांत एक अनुमानक को निर्धारित नहीं करता है, एक अनुमानक की अपरिवर्तनशीलता की अवधारणा को वैकल्पिक रूपों के अनुमानकों की तलाश करते समय लागू किया जा सकता है, या तो अनुमानक के आवेदन की सादगी के लिए या इसलिए कि अनुमानक मजबूत आँकड़े हैं।

अपरिवर्तनीयता की अवधारणा का उपयोग कभी-कभी अनुमानकर्ताओं के बीच चयन करने के तरीके के रूप में किया जाता है, लेकिन यह आवश्यक रूप से निश्चित नहीं है। उदाहरण के लिए, अपरिवर्तनीयता की आवश्यकता इस आवश्यकता के साथ असंगत हो सकती है कि एक अनुमानक का पूर्वाग्रह माध्य-निष्पक्ष हो; दूसरी ओर, माध्यिका#माध्यिका-निष्पक्ष अनुमानकों|माध्यिका-निष्पक्षता की कसौटी को अनुमानक के नमूना वितरण के संदर्भ में परिभाषित किया गया है और इसलिए यह कई परिवर्तनों के तहत अपरिवर्तनीय है।

अपरिवर्तनशीलता की अवधारणा का एक उपयोग वह है जहां आकलनकर्ताओं का एक वर्ग या परिवार प्रस्तावित किया जाता है और इनमें से एक विशेष सूत्रीकरण का चयन किया जाना चाहिए। एक प्रक्रिया प्रासंगिक अपरिवर्तनीय गुणों को लागू करना है और फिर इस वर्ग के भीतर उस फॉर्मूलेशन को ढूंढना है जिसमें सर्वोत्तम गुण हैं, जिससे इष्टतम अपरिवर्तनीय अनुमानक कहा जाता है।

अपरिवर्तनीय अनुमानकों के कुछ वर्ग
ऐसे कई प्रकार के परिवर्तन हैं जिन पर अपरिवर्तनीय अनुमानकों के साथ व्यवहार करते समय उपयोगी रूप से विचार किया जाता है। प्रत्येक आकलनकर्ताओं के एक वर्ग को जन्म देता है जो उन विशेष प्रकार के परिवर्तनों के लिए अपरिवर्तनीय हैं।
 * शिफ्ट इनवेरिएंस: सैद्धांतिक रूप से, किसी स्थान पैरामीटर का अनुमान डेटा मानों के सरल बदलावों के लिए अपरिवर्तनीय होना चाहिए। यदि सभी डेटा मान एक निश्चित राशि से बढ़ जाते हैं, तो अनुमान उसी राशि से बदलना चाहिए। भारित औसत का उपयोग करके अनुमान पर विचार करते समय, इस अपरिवर्तनीय आवश्यकता का तुरंत तात्पर्य यह है कि भार का योग एक होना चाहिए। जबकि समान परिणाम अक्सर निष्पक्षता की आवश्यकता से प्राप्त होता है, अपरिवर्तनीयता के उपयोग के लिए यह आवश्यक नहीं है कि कोई औसत मान मौजूद हो और किसी भी संभाव्यता वितरण का कोई उपयोग नहीं होता है।
 * स्केल अपरिवर्तनीयता: ध्यान दें कि अनुमानक स्केल पैरामीटर के इनवेरिएंस के बारे में इस विषय को समग्र गुणों (भौतिकी में) के तहत सिस्टम के व्यवहार के बारे में अधिक सामान्य पैमाने के इनवेरिएंस के साथ भ्रमित नहीं किया जाना चाहिए।
 * पैरामीटर-परिवर्तन अपरिवर्तनीयता: यहां, परिवर्तन अकेले पैरामीटर पर लागू होता है। यहां अवधारणा यह है कि अनिवार्य रूप से डेटा और पैरामीटर θ वाले मॉडल से एक ही अनुमान लगाया जाना चाहिए, जैसा कि उसी डेटा से बनाया जाएगा यदि मॉडल पैरामीटर φ का उपयोग करता है, जहां φ, θ, φ=h(θ) का एक-से-एक परिवर्तन है। इस प्रकार के अपरिवर्तनीयता के अनुसार, परिवर्तन-अपरिवर्तनीय अनुमानकों के परिणाम भी φ=h(θ) से संबंधित होने चाहिए। जब परिवर्तन मोनोटोनिक फ़ंक्शन होता है तो अधिकतम संभावना अनुमानकों के पास यह संपत्ति होती है। यद्यपि अनुमानक के स्पर्शोन्मुख गुण अपरिवर्तनीय हो सकते हैं, छोटे नमूना गुण भिन्न हो सकते हैं, और एक विशिष्ट वितरण प्राप्त करने की आवश्यकता होती है।
 * क्रमपरिवर्तन अपरिवर्तनीयता: जहां डेटा मानों के एक सेट को एक सांख्यिकीय मॉडल द्वारा दर्शाया जा सकता है कि वे स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के परिणाम हैं, यह आवश्यकता लागू करना उचित है कि सामान्य वितरण की किसी भी संपत्ति का कोई भी अनुमानक क्रमपरिवर्तन-अपरिवर्तनीय होना चाहिए: विशेष रूप से अनुमानक, डेटा-मूल्यों के सेट के एक फ़ंक्शन के रूप में माना जाता है, यदि डेटा की वस्तुओं को डेटासेट के भीतर स्वैप किया जाता है तो उसे बदलना नहीं चाहिए।

भारित औसत का उपयोग करके एक स्वतंत्र और समान रूप से वितरित डेटासेट से स्थान पैरामीटर का अनुमान लगाने के लिए क्रमपरिवर्तन अपरिवर्तनीयता और स्थान अपरिवर्तनीयता का संयोजन यह दर्शाता है कि वजन समान होना चाहिए और एक के बराबर होना चाहिए। बेशक, भारित औसत के अलावा अन्य अनुमानक बेहतर हो सकते हैं।

इष्टतम अपरिवर्तनीय अनुमानक
इस सेटिंग के अंतर्गत, हमें माप का एक सेट दिया जाता है $$x$$ जिसमें किसी अज्ञात पैरामीटर के बारे में जानकारी शामिल है $$\theta$$. माप $$x$$ संभाव्यता घनत्व फ़ंक्शन वाले एक यादृच्छिक वेक्टर के रूप में तैयार किया गया है $$f(x|\theta)$$ जो एक पैरामीटर वेक्टर पर निर्भर करता है $$\theta$$.

समस्या अनुमान लगाने की है $$\theta$$ दिया गया $$x$$. अनुमान, द्वारा निरूपित $$a$$, माप का एक कार्य है और एक सेट से संबंधित है $$A$$. परिणाम की गुणवत्ता हानि फ़ंक्शन द्वारा परिभाषित की जाती है $$L=L(a,\theta)$$ जो एक जोखिम कार्य को निर्धारित करता है $$R=R(a,\theta)=E[L(a,\theta)|\theta]$$. के संभावित मानों का समुच्चय $$x$$, $$\theta$$, और $$a$$ द्वारा निरूपित किये जाते हैं $$X$$, $$\Theta$$, और $$A$$, क्रमश।

वर्गीकरण में
सांख्यिकीय वर्गीकरण में, वह नियम जो एक नए डेटा-आइटम को एक वर्ग निर्दिष्ट करता है, उसे एक विशेष प्रकार का अनुमानक माना जा सकता है। पैटर्न पहचान के लिए पूर्व ज्ञान तैयार करने में कई अपरिवर्तन-प्रकार के विचारों को ध्यान में रखा जा सकता है।

परिभाषा
एक अपरिवर्तनीय अनुमानक एक अनुमानक है जो निम्नलिखित दो नियमों का पालन करता है:
 * 1) तर्कसंगत अपरिवर्तनशीलता का सिद्धांत: किसी निर्णय समस्या में की गई कार्रवाई उपयोग किए गए माप पर परिवर्तन पर निर्भर नहीं होनी चाहिए
 * 2) अपरिवर्तनशील सिद्धांत: यदि दो निर्णय समस्याओं की औपचारिक संरचना समान है (के संदर्भ में)। $$X$$, $$\Theta$$, $$f(x|\theta)$$ और $$L$$), तो प्रत्येक समस्या में समान निर्णय नियम का उपयोग किया जाना चाहिए।

एक अपरिवर्तनीय या समतुल्य अनुमानक को औपचारिक रूप से परिभाषित करने के लिए, पहले परिवर्तनों के समूहों से संबंधित कुछ परिभाषाओं की आवश्यकता होती है। होने देना $$X$$ संभावित डेटा-नमूनों के सेट को निरूपित करें। के परिवर्तनों का एक समूह $$X$$, द्वारा निरूपित किया जाना है $$G$$, (मापने योग्य) 1:1 और के परिवर्तनों का एक सेट है $$X$$ अपने आप में, जो निम्नलिखित शर्तों को पूरा करता है:


 * 1) अगर $$g_1\in G$$ और $$g_2\in G$$ तब $$g_1 g_2\in G \,$$
 * 2) अगर $$g\in G$$ तब $$g^{-1}\in G$$, कहाँ $$g^{-1}(g(x))=x \, .$$ (अर्थात, प्रत्येक परिवर्तन का समूह के भीतर एक व्युत्क्रम होता है।)
 * 3) $$e\in G$$ (अर्थात एक पहचान परिवर्तन है $$ e(x)=x \, $$)

डेटासेट $$x_1$$ और $$x_2$$ में $$X$$ यदि समतुल्य हैं $$x_1=g(x_2)$$ कुछ के लिए $$g\in G$$. सभी समतुल्य बिंदु एक समतुल्य वर्ग बनाते हैं। ऐसे तुल्यता वर्ग को कक्षा (समूह सिद्धांत) कहा जाता है $$X$$). $$x_0$$ h> कक्षा, $$X(x_0)$$, सेट है $$X(x_0)=\{g(x_0):g\in G\}$$. अगर $$X$$ तब इसमें एक ही कक्षा होती है $$g$$ सकर्मक कहा गया है।

घनत्व का एक परिवार $$F$$ समूह के अंतर्गत अपरिवर्तनीय कहा जाता है $$G$$ यदि, प्रत्येक के लिए $$g\in G$$ और $$\theta\in \Theta$$ वहाँ एक अनोखा अस्तित्व है $$\theta^*\in \Theta$$ ऐसा है कि $$Y=g(x)$$ घनत्व है $$f(y|\theta^*)$$. $$\theta^*$$ निरूपित किया जाएगा $$\bar{g}(\theta)$$.

अगर $$F$$ समूह के अंतर्गत अपरिवर्तनीय है $$G$$ फिर हानि फ़ंक्शन $$L(\theta,a)$$ के अंतर्गत अपरिवर्तनीय कहा गया है $$G$$ यदि प्रत्येक के लिए $$g\in G$$ और $$a\in A$$ वहाँ एक मौजूद है $$a^*\in A$$ ऐसा है कि $$L(\theta,a)=L(\bar{g}(\theta),a^*)$$ सभी के लिए $$\theta \in \Theta$$. परिवर्तित मूल्य $$a^*$$ द्वारा निरूपित किया जाएगा $$\tilde{g}(a)$$.

ऊपरोक्त में, $$\bar{G}=\{\bar{g}:g\in G\}$$ से परिवर्तनों का एक समूह है $$\Theta$$ अपने आप को और $$\tilde{G}=\{\tilde{g}: g \in G\}$$ से परिवर्तनों का एक समूह है $$A$$ खुद को।

एक अनुमान समस्या के अंतर्गत अपरिवर्तनीय (समतुल्य) है $$G$$ यदि तीन समूह मौजूद हैं $$G, \bar{G}, \tilde{G}$$ जैसा कि ऊपर परिभाषित किया गया है।

एक अनुमान समस्या के लिए जो अपरिवर्तनीय है $$G$$, अनुमानक $$\delta(x)$$ के अंतर्गत एक अपरिवर्तनीय अनुमानक है $$G$$ यदि, सभी के लिए $$x\in X$$ और $$g\in G$$,
 * $$\delta(g(x)) = \tilde{g}(\delta(x)).$$

गुण

 * 1) एक अपरिवर्तनीय अनुमानक का जोखिम कार्य, $$\delta$$, की कक्षाओं पर स्थिर है $$\Theta$$. इसके तुल्य $$R(\theta,\delta)=R(\bar{g}(\theta),\delta)$$ सभी के लिए $$\theta \in \Theta$$ और $$\bar{g}\in \bar{G}$$.
 * 2) संक्रमणीय के साथ एक अपरिवर्तनीय अनुमानक का जोखिम कार्य $$\bar{g}$$ स्थिर है.

किसी दी गई समस्या के लिए, सबसे कम जोखिम वाले अपरिवर्तनीय अनुमानक को सर्वोत्तम अपरिवर्तनीय अनुमानक कहा जाता है। सर्वोत्तम अपरिवर्तनीय अनुमानक हमेशा प्राप्त नहीं किया जा सकता। एक विशेष मामला जिसके लिए इसे हासिल किया जा सकता है वह है जब $$\bar{g}$$ सकर्मक है.

उदाहरण: स्थान पैरामीटर
कल्पना करना $$\theta$$ यदि घनत्व एक स्थान पैरामीटर है $$X$$ स्वरूप का है $$f(x-\theta)$$. के लिए $$ \Theta=A=\mathbb{R}^1 $$ और $$L=L(a-\theta)$$, के अंतर्गत समस्या अपरिवर्तनीय है $$g=\bar{g}=\tilde{g}=\{g_c:g_c(x)=x+c, c\in \mathbb{R}\}$$. इस मामले में अपरिवर्तनीय अनुमानक को संतुष्ट होना चाहिए
 * $$\delta(x+c)=\delta(x)+c, \text{ for all } c\in \mathbb{R},$$

इस प्रकार यह स्वरूप का है $$\delta(x)=x+K$$ ($$K\in \mathbb{R}$$). $$\bar{g}$$ पर सकर्मक है $$\Theta$$ इसलिए जोखिम भिन्न नहीं होता है $$\theta$$: वह है, $$R(\theta,\delta)=R(0,\delta)=\operatorname{E}[L(X+K)|\theta=0]$$. सबसे अच्छा अपरिवर्तनीय अनुमानक वह है जो जोखिम लाता है $$R(\theta,\delta)$$ न्यूनतम करने के लिए.

उस स्थिति में जब L वर्ग त्रुटि है $$\delta(x)=x-\operatorname{E}[X|\theta=0].$$

पिटमैन अनुमानक
अनुमान की समस्या यही है $$X=(X_1,\dots,X_n)$$ घनत्व है $$f(x_1-\theta,\dots,x_n-\theta)$$, जहां θ अनुमान लगाया जाने वाला एक पैरामीटर है, और जहां हानि फ़ंक्शन है $$L(|a-\theta|)$$. यह समस्या निम्नलिखित (योगात्मक) परिवर्तन समूहों के साथ अपरिवर्तनीय है:
 * $$G=\{g_c:g_c(x)=(x_1+c, \dots, x_n+c),c\in \mathbb{R}^1\},$$
 * $$\bar{G}=\{g_c:g_c(\theta)=\theta + c,c\in \mathbb{R}^1\},$$
 * $$\tilde{G}=\{g_c:g_c(a)=a + c,c\in \mathbb{R}^1\} .$$

सर्वोत्तम अपरिवर्तनीय अनुमानक $$\delta(x)$$ वह है जो न्यूनतम करता है
 * $$\frac{\int_{-\infty}^{\infty} L(\delta(x)-\theta)f(x_1-\theta,\dots,x_n-\theta)d\theta}{\int_{-\infty}^{\infty}f(x_1-\theta,\dots,x_n-\theta)d\theta},$$

और यह पिटमैन का अनुमानक (1939) है।

चुकता त्रुटि हानि मामले के लिए, परिणाम है
 * $$\delta(x)=\frac{\int_{-\infty}^{\infty} \theta f(x_1-\theta,\dots,x_n-\theta)d\theta}{\int_{-\infty}^{\infty}f(x_1-\theta,\dots,x_n-\theta)d\theta}.$$

अगर $$x \sim N(\theta 1_n,I)\,\!$$ (यानी स्वतंत्र, इकाई-विचरण घटकों के साथ एक बहुभिन्नरूपी सामान्य वितरण)।
 * $$\delta_{\text{Pitman}} = \delta_{ML}=\frac{\sum{x_i}}{n}.$$

अगर $$x \sim C(\theta 1_n,I \sigma^2)\,\!$$ (स्केल पैरामीटर σ के साथ कॉची वितरण वाले स्वतंत्र घटक) फिर $$\delta_{\text{Pitman}} \ne \delta_{ML}$$,. हालाँकि परिणाम है
 * $$\delta_{\text{Pitman}}=\sum_{k=1}^n{x_k\left[\frac{\text{Re}\{w_k\}}{\sum_{m=1}^{n}{\text{Re}\{w_k\}}}\right]}, \qquad n>1,$$

साथ
 * $$w_k = \prod_{j\ne k}\left[\frac{1}{(x_k-x_j)^2+4\sigma^2}\right]\left[1-\frac{2\sigma}{(x_k-x_j)}i\right].$$