अपरिवर्तनीय अनुमानक

आंकड़ों में, एक अपरिवर्तनीय अनुमानक होने की अवधारणा एक मानदंड है जिसका उपयोग एक ही मात्रा के लिए विभिन्न अनुमानकों के गुणों की तुलना करने के लिए किया जा सकता है। यह इस विचार को औपचारिक रूप देने का एक तरीका है कि एक अनुमानकर्ता के पास कुछ सहज रूप से आकर्षक गुण होने चाहिए। कड़ाई से बोलते हुए, "अपरिवर्तनीय" का अर्थ यह होगा कि जब माप और पैरामीटर दोनों को संगत विधियों से बदल दिया जाता है तो अनुमान स्वयं अपरिवर्तित होते हैं, किन्तु ऐसे परिवर्तनों के साथ अनुमानों को उचित विधियों से बदलने की अनुमति देने के लिए अर्थ बढ़ाया गया है। शब्द समतुल्य अनुमानक का उपयोग औपचारिक गणितीय संदर्भों में किया जाता है जिसमें डेटासेट और पैरामीटराइजेशन में परिवर्तन के जवाब में अनुमानक के परिवर्तन के विधियों के संबंध का सटीक विवरण शामिल होता है: यह अधिक सामान्य गणित में "समतुल्य" के उपयोग से मेल खाता है।

पृष्ठभूमि
सांख्यिकीय अनुमान में, अनुमान सिद्धांत के कई दृष्टिकोण हैं जिनका उपयोग तुरंत यह तय करने के लिए किया जा सकता है कि उन दृष्टिकोणों के अनुसार कौन से अनुमानकों का उपयोग किया जाना चाहिए। उदाहरण के लिए, बायेसियन अनुमान के विचार सीधे बायेसियन अनुमानकों तक ले जाएंगे। इसी प्रकार, पारंपरिक सांख्यिकीय अनुमान का सिद्धांत कभी-कभी इस बारे में मजबूत निष्कर्ष निकाल सकता है कि किस अनुमानक का उपयोग किया जाना चाहिए। चूँकि, इन सिद्धांतों की उपयोगिता पूरी तरह से निर्धारित सांख्यिकीय मॉडल पर निर्भर करती है और अनुमानक को निर्धारित करने के लिए प्रासंगिक हानि फ़ंक्शन पर भी निर्भर हो सकती है। इस प्रकार एक बायेसियन विश्लेषण किया जा सकता है, जिससे प्रासंगिक मापदंडों के लिए एक पश्च वितरण हो सकता है, लेकिन एक विशिष्ट उपयोगिता या हानि फ़ंक्शन का उपयोग अस्पष्ट हो सकता है। अपरिवर्तनीयता के विचारों को पश्च वितरण को सारांशित करने के कार्य पर लागू किया जा सकता है। अन्य स्थितियों में, सांख्यिकीय विश्लेषण पूरी तरह से परिभाषित सांख्यिकीय मॉडल के बिना किए जाते हैं या सांख्यिकीय अनुमान के पारंपरिक सिद्धांत को आसानी से लागू नहीं किया जा सकता है क्योंकि जिन मॉडलों के परिवार पर विचार किया जा रहा है वे इस प्रकार के उपचार के लिए उत्तरदायी नहीं हैं। इन स्थितियों के अतिरिक्त जहां सामान्य सिद्धांत एक अनुमानक को निर्धारित नहीं करता है, एक अनुमानक के अपरिवर्तनीयता की अवधारणा को वैकल्पिक रूपों के अनुमानकों की खोज करते समय लागू किया जा सकता है, या तो अनुमानक के आवेदन की सादगी के लिए या जिससे अनुमानक मजबूत आँकड़े हो।

अपरिवर्तनीयता की अवधारणा का उपयोग कभी-कभी अनुमानकर्ताओं के बीच चयन करने के विधियों के रूप में किया जाता है, किन्तु यह आवश्यक रूप से निश्चित नहीं है। उदाहरण के लिए, अपरिवर्तनीयता की आवश्यकता इस आवश्यकता के साथ असंगत हो सकती है कि अनुमानक का पूर्वाग्रह माध्य-निष्पक्ष हो; दूसरी ओर, मध्य-निष्पक्षता की कसौटी को अनुमानक के नमूना वितरण के संदर्भ में परिभाषित किया गया है और इसलिए यह कई परिवर्तनों के अनुसार अपरिवर्तनीय है।

अपरिवर्तनशीलता की अवधारणा का उपयोग वह है जहां आकलनकर्ताओं का वर्ग या परिवार प्रस्तावित किया जाता है और इनमें से विशेष सूत्रीकरण का चयन किया जाना चाहिए। प्रक्रिया प्रासंगिक अपरिवर्तनीय गुणों को लागू करना है और फिर इस वर्ग के अन्दर उस फॉर्मूलेशन को ढूंढना है जिसमें सर्वोत्तम गुण हैं, जिससे इष्टतम अपरिवर्तनीय अनुमानक कहा जाता है।

अपरिवर्तनीय अनुमानकों के कुछ वर्ग
ऐसे कई प्रकार के परिवर्तन हैं जिन पर अपरिवर्तनीय अनुमानकों के साथ व्यवहार करते समय उपयोगी रूप से विचार किया जाता है। प्रत्येक आकलनकर्ताओं के वर्ग को जन्म देता है जो उन विशेष प्रकार के परिवर्तनों के लिए अपरिवर्तनीय हैं।
 * शिफ्ट इनवेरिएंस: सैद्धांतिक रूप से, किसी स्थान पैरामीटर का अनुमान डेटा मानों के सरल बदलावों के लिए अपरिवर्तनीय होना चाहिए। यदि सभी डेटा मान निश्चित राशि से बढ़ जाते हैं, तो अनुमान उसी राशि से बदलना चाहिए। भारित औसत का उपयोग करके अनुमान पर विचार करते समय, इस अपरिवर्तनीय आवश्यकता का तुरंत तात्पर्य यह है कि भार का योग होना चाहिए। जबकि समान परिणाम अक्सर निष्पक्षता की आवश्यकता से प्राप्त होता है, अपरिवर्तनीयता के उपयोग के लिए यह आवश्यक नहीं है कि कोई औसत मान उपस्थित हो और किसी भी संभाव्यता वितरण का कोई उपयोग नहीं होता है।
 * स्केल अपरिवर्तनीयता: ध्यान दें कि अनुमानक स्केल पैरामीटर के इनवेरिएंस के बारे में इस विषय को समग्र गुणों (भौतिकी में) के अनुसार सिस्टम के व्यवहार के बारे में अधिक सामान्य पैमाने के इनवेरिएंस के साथ भ्रमित नहीं किया जाना चाहिए।
 * पैरामीटर-परिवर्तन अपरिवर्तनीयता: यहां, परिवर्तन अकेले पैरामीटर पर लागू होता है। यहां अवधारणा यह है कि अनिवार्य रूप से डेटा और पैरामीटर θ वाले मॉडल से ही अनुमान लगाया जाना चाहिए, जैसा कि उसी डेटा से बनाया जाएगा यदि मॉडल पैरामीटर φ का उपयोग करता है, जहां φ, θ, φ=h(θ) का एक-से-परिवर्तन है। इस प्रकार के अपरिवर्तनीयता के अनुसार, परिवर्तन-अपरिवर्तनीय अनुमानकों के परिणाम भी φ=h(θ) से संबंधित होने चाहिए। जब परिवर्तन मोनोटोनिक फ़ंक्शन होता है तो अधिकतम संभावना अनुमानकों के पास यह गुण होती है। यद्यपि अनुमानक के स्पर्शोन्मुख गुण अपरिवर्तनीय हो सकते हैं, छोटे नमूना गुण भिन्न हो सकते हैं, और विशिष्ट वितरण प्राप्त करने की आवश्यकता होती है।
 * क्रमपरिवर्तन अपरिवर्तनीयता: जहां डेटा मानों के सेट को सांख्यिकीय मॉडल द्वारा दर्शाया जा सकता है कि वे स्वतंत्र और समान रूप से वितरित यादृच्छिक चर के परिणाम हैं, यह आवश्यकता लागू करना उचित है कि सामान्य वितरण की किसी भी गुण का कोई भी अनुमानक क्रमपरिवर्तन-अपरिवर्तनीय होना चाहिए: विशेष रूप से अनुमानक, डेटा-मानों के सेट के फ़ंक्शन के रूप में माना जाता है, यदि डेटा की वस्तुओं को डेटासेट के अन्दर स्वैप किया जाता है तो उसे बदलना नहीं चाहिए।

भारित औसत का उपयोग करके स्वतंत्र और समान रूप से वितरित डेटासेट से स्थान पैरामीटर का अनुमान लगाने के लिए क्रमपरिवर्तन अपरिवर्तनीयता और स्थान अपरिवर्तनीयता का संयोजन यह दर्शाता है कि वजन समान होना चाहिए और के बराबर होना चाहिए। किन्तु, भारित औसत के अतिरिक्त अन्य अनुमानक बेहतर हो सकते हैं।

इष्टतम अपरिवर्तनीय अनुमानक
इस सेटिंग के तहत, हमें माप $$x$$ का एक सेट दिया जाता है जिसमें एक अज्ञात पैरामीटर $$\theta$$ के बारे में जानकारी होती है। माप $$x$$ को एक वेक्टर यादृच्छिक वेक्टर के रूप में तैयार किया गया है जिसमें संभाव्यता घनत्व फ़ंक्शन $$f(x|\theta)$$ है जो एक पैरामीटर वेक्टर $$\theta$$ पर निर्भर करता है।

समस्या दिए गए $$x$$ $$\theta$$ का अनुमान लगाना है। $$a$$ द्वारा दर्शाया गया अनुमान, माप का एक कार्य है और एक सेट $$A$$ से संबंधित है। परिणाम की गुणवत्ता एक हानि फ़ंक्शन $$L=L(a,\theta)$$ द्वारा परिभाषित की जाती है जो एक जोखिम फ़ंक्शन $$R=R(a,\theta)=E[L(a,\theta)|\theta]$$ निर्धारित करती है। $$x$$, $$\theta$$, और $$a$$ के संभावित मानों के सेट को क्रमशः $$X$$, $$\Theta$$, और $$A$$ द्वारा दर्शाया जाता है।

वर्गीकरण में
सांख्यिकीय वर्गीकरण में, वह नियम जो एक नए डेटा-आइटम को एक वर्ग निर्दिष्ट करता है, उसे एक विशेष प्रकार का अनुमानक माना जा सकता है। पैटर्न पहचान के लिए पूर्व ज्ञान तैयार करने में कई अपरिवर्तन-प्रकार के विचारों को ध्यान में रखा जा सकता है।

परिभाषा
अपरिवर्तनीय अनुमानक अनुमानक है जो निम्नलिखित दो नियमों का पालन करता है:
 * 1) तर्कसंगत अपरिवर्तनशीलता का सिद्धांत: किसी निर्णय समस्या में की गई कार्रवाई उपयोग किए गए माप पर परिवर्तन पर निर्भर नहीं होनी चाहिए
 * 2) अपरिवर्तनशील सिद्धांत: यदि दो निर्णय समस्याओं की औपचारिक संरचना ($$X$$, $$\Theta$$, $$f(x|\theta)$$ और $$L$$ के संदर्भ में) समान है, तो प्रत्येक समस्या में समान निर्णय नियम का उपयोग किया जाना चाहिए।

एक अपरिवर्तनीय या समतुल्य अनुमानक को औपचारिक रूप से परिभाषित करने के लिए, पहले परिवर्तनों के समूहों से संबंधित कुछ परिभाषाओं की आवश्यकता होती है। मान लीजिए कि $$X$$ संभावित डेटा-नमूनों के सेट को दर्शाता है। $$X$$ के परिवर्तनों का एक समूह, जिसे $$G$$, (मापने योग्य) द्वारा निरूपित किया जाता है, 1:1 का एक सेट है और स्वयं $$X$$ के परिवर्तनों पर आधारित है, जो निम्नलिखित शर्तों को पूरा करता है:


 * 1) यदि $$g_1\in G$$ और $$g_2\in G$$ तब $$g_1 g_2\in G \,$$
 * 2) यदि $$g\in G$$ तब $$g^{-1}\in G$$, कहाँ $$g^{-1}(g(x))=x \, .$$ (अर्थात, प्रत्येक परिवर्तन का समूह के अन्दर व्युत्क्रम होता है।)
 * 3) $$e\in G$$ (अर्थात पहचान परिवर्तन $$ e(x)=x \, $$ है)

यदि $$g\in G$$ के लिए $$x_1=g(x_2)$$ है तो X में डेटासेट $$x_1$$ और $$x_2$$ समतुल्य हैं। सभी समतुल्य बिंदु समतुल्य वर्ग बनाते हैं।

ऐसे तुल्यता वर्ग को कक्षा (समूह सिद्धांत) ($$X$$ में) कहा जाता है। ) $$x_0$$ कक्षा $$X(x_0)$$ समुच्चय $$X(x_0)=\{g(x_0):g\in G\}$$ है।

यदि $$X$$ में एक ही कक्षा है तो $$g$$ को संक्रमणीय कहा जाता है।

घनत्व $$F$$ के एक परिवार को समूह $$G$$ के अंतर्गत अपरिवर्तनीय कहा जाता है यदि, प्रत्येक $$g\in G$$ और $$\theta\in \Theta$$ के लिए एक अद्वितीय $$\theta^*\in \Theta$$ उपस्थित हो जैसे कि $$Y=g(x)$$ का घनत्व $$f(y|\theta^*)$$ है। $$\theta^*$$ को $$\bar{g}(\theta)$$ दर्शाया जाएगा।

यदि $$F$$ समूह $$G$$ के अंतर्गत अपरिवर्तनीय है फिर हानि फ़ंक्शन $$L(\theta,a)$$ को $$G$$ के अंतर्गत अपरिवर्तनीय कहा गया है यदि प्रत्येक $$g\in G$$ और $$a\in A$$  के लिए $$a^*\in A$$ उपस्थित होता है वह $$L(\theta,a)=L(\bar{g}(\theta),a^*)$$ सभी $$\theta \in \Theta$$ के लिए है। परिवर्तित मूल्य $$a^*$$ को $$\tilde{g}(a)$$ द्वारा निरूपित किया जाएगा.

ऊपरोक्त में, $$\bar{G}=\{\bar{g}:g\in G\}$$ से परिवर्तनों का समूह है $$\Theta$$ अपने आप को और $$\tilde{G}=\{\tilde{g}: g \in G\}$$ $$A$$ से स्वयं में परिवर्तनों का एक समूह है।

$$G$$ के अनुसार एक अनुमान समस्या अपरिवर्तनीय (समतुल्य) है यदि ऊपर परिभाषित अनुसार तीन समूह $$G, \bar{G}, \tilde{G}$$ उपस्थित हैं।

एक अनुमान समस्या के लिए जो $$G$$ के अंतर्गत अपरिवर्तनीय है, अनुमानक $$\delta(x)$$ $$G$$ के अंतर्गत एक अपरिवर्तनीय अनुमानक है यदि, सभी $$x\in X$$ और $$g\in G$$ के लिए,
 * $$\delta(g(x)) = \tilde{g}(\delta(x)).$$

गुण

 * 1) अपरिवर्तनीय अनुमानक का जोखिम कार्य, $$\delta$$, की कक्षाओं पर $$\Theta$$ स्थिर है। इसके तुल्य $$R(\theta,\delta)=R(\bar{g}(\theta),\delta)$$ सभी के लिए $$\theta \in \Theta$$ और $$\bar{g}\in \bar{G}$$ है।
 * 2) संक्रमणीय के साथ अपरिवर्तनीय अनुमानक का जोखिम कार्य $$\bar{g}$$ स्थिर है।

किसी दी गई समस्या के लिए, सबसे कम जोखिम वाले अपरिवर्तनीय अनुमानक को सर्वोत्तम अपरिवर्तनीय अनुमानक कहा जाता है। सर्वोत्तम अपरिवर्तनीय अनुमानक सदैव प्राप्त नहीं किया जा सकता। विशेष मामला जिसके लिए इसे हासिल किया जा सकता है वह है जब $$\bar{g}$$ सकर्मक है।

उदाहरण: स्थान पैरामीटर
कल्पना करना $$\theta$$ यदि घनत्व स्थान पैरामीटर है $$X$$ स्वरूप का है $$f(x-\theta)$$. के लिए $$ \Theta=A=\mathbb{R}^1 $$ और $$L=L(a-\theta)$$, के अंतर्गत समस्या अपरिवर्तनीय है $$g=\bar{g}=\tilde{g}=\{g_c:g_c(x)=x+c, c\in \mathbb{R}\}$$. इस स्थितियों में अपरिवर्तनीय अनुमानक को संतुष्ट होना चाहिए
 * $$\delta(x+c)=\delta(x)+c, \text{ for all } c\in \mathbb{R},$$

इस प्रकार यह डेल्टा $$\delta(x)=x+K$$ ($$K\in \mathbb{R}$$) के रूप का है। $$\bar{g}$$ $$\Theta$$ पर सकर्मक है इसलिए जोखिम $$\theta$$ के साथ भिन्न नहीं होता है: अर्थात, $$R(\theta,\delta)=R(0,\delta)=\operatorname{E}[L(X+K)|\theta=0]$$ है। सबसे अच्छा अपरिवर्तनीय अनुमानक वह है जो जोखिम $$R(\theta,\delta)$$ को न्यूनतम पर लाता है।

उस स्थिति में जब L वर्ग त्रुटि $$\delta(x)=x-\operatorname{E}[X|\theta=0]$$ है।

पिटमैन अनुमानक
अनुमान की समस्या यही है $$X=(X_1,\dots,X_n)$$ घनत्व है $$f(x_1-\theta,\dots,x_n-\theta)$$, जहां θ अनुमान लगाया जाने वाला पैरामीटर है, और जहां हानि फ़ंक्शन $$L(|a-\theta|)$$ है। यह समस्या निम्नलिखित (योगात्मक) परिवर्तन समूहों के साथ अपरिवर्तनीय है:
 * $$G=\{g_c:g_c(x)=(x_1+c, \dots, x_n+c),c\in \mathbb{R}^1\},$$
 * $$\bar{G}=\{g_c:g_c(\theta)=\theta + c,c\in \mathbb{R}^1\},$$
 * $$\tilde{G}=\{g_c:g_c(a)=a + c,c\in \mathbb{R}^1\} .$$

सर्वोत्तम अपरिवर्तनीय अनुमानक $$\delta(x)$$ वह है जो न्यूनतम करता है
 * $$\frac{\int_{-\infty}^{\infty} L(\delta(x)-\theta)f(x_1-\theta,\dots,x_n-\theta)d\theta}{\int_{-\infty}^{\infty}f(x_1-\theta,\dots,x_n-\theta)d\theta},$$

और यह पिटमैन का अनुमानक (1939) है।

चुकता त्रुटि हानि स्थितियों के लिए, परिणाम है
 * $$\delta(x)=\frac{\int_{-\infty}^{\infty} \theta f(x_1-\theta,\dots,x_n-\theta)d\theta}{\int_{-\infty}^{\infty}f(x_1-\theta,\dots,x_n-\theta)d\theta}.$$

यदि $$x \sim N(\theta 1_n,I)\,\!$$ (अर्थात् स्वतंत्र, इकाई-विचरण घटकों के साथ बहुभिन्नरूपी सामान्य वितरण)।
 * $$\delta_{\text{Pitman}} = \delta_{ML}=\frac{\sum{x_i}}{n}.$$

यदि $$x \sim C(\theta 1_n,I \sigma^2)\,\!$$ (स्केल पैरामीटर σ के साथ कॉची वितरण वाले स्वतंत्र घटक) फि

$$\delta_{\text{Pitman}} \ne \delta_{ML}$$,.

चूँकि परिणाम है
 * $$\delta_{\text{Pitman}}=\sum_{k=1}^n{x_k\left[\frac{\text{Re}\{w_k\}}{\sum_{m=1}^{n}{\text{Re}\{w_k\}}}\right]}, \qquad n>1,$$

साथ
 * $$w_k = \prod_{j\ne k}\left[\frac{1}{(x_k-x_j)^2+4\sigma^2}\right]\left[1-\frac{2\sigma}{(x_k-x_j)}i\right].$$