सहायक आँकड़ा

एक सहायक आँकड़ा एक नमूने (सांख्यिकी) का एक आँकड़ा है जिसका नमूना वितरण (या जिसकी संभाव्यता द्रव्यमान फ़ंक्शन या संभाव्यता घनत्व फ़ंक्शन) मॉडल के सांख्यिकीय पैरामीटर पर निर्भर नहीं करता है। एक सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतरालों के निर्माण के लिए सहायक आँकड़ों का उपयोग किया जा सकता है। इनका उपयोग सांख्यिकी के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है। यह अवधारणा पहली बार 1920 के दशक में रोनाल्ड फिशर द्वारा प्रस्तुत की गई थी, लेकिन इसकी औपचारिक परिभाषा केवल 1964 में देबा बी एट अल. बस  द्वारा प्रदान की गई थी।

उदाहरण
मान लीजिए एक्स1, ..., एक्सn स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात अपेक्षित मूल्य μ और ज्ञात भिन्नता 1 के साथ सामान्य वितरण हैं।


 * $$\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}$$

अंकगणित माध्य हो.

नमूने के फैलाव के निम्नलिखित सांख्यिकीय उपाय
 * रेंज (सांख्यिकी): अधिकतम(एक्स1, ..., एक्सn) - मिनट(एक्स1, ..., एक्सn)
 * अंतरचतुर्थक सीमा: Q3 − प्र1
 * नमूना विचरण:
 * $$\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}$$

सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: फैलाव के ये उपाय स्थान पर निर्भर नहीं करते हैं।

इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात प्रसरण σ के साथ सामान्य चर2, नमूना माध्य $$\overline{X}$$ विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1,σ) है2/n), जो σ पर निर्भर करता है 2 – स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) फैलाव पर निर्भर करता है।

स्थान-स्तरीय परिवारों में
एक स्थान परिवार में, $$(X_1 - X_n, X_2 - X_n, \dots, X_{n-1} - X_n)$$ एक सहायक आँकड़ा है.

एक स्केल परिवार में, $$(\frac{X_1}{X_n}, \frac{X_2}{X_n}, \dots, \frac{X_{n-1}}{X_n})$$ एक सहायक आँकड़ा है.

स्थान-पैमाने पर वितरण के परिवार|स्थान-पैमाने पर परिवार में, $$(\frac{X_1 - X_n}{S}, \frac{X_2 - X_n}{S}, \dots, \frac{X_{n - 1} - X_n}{S})$$, कहाँ $$S^2$$ नमूना विचरण है, एक सहायक आँकड़ा है।

जानकारी की पुनर्प्राप्ति में
यह पता चला है कि, अगर $$T_1$$ एक गैर-पर्याप्त आँकड़ा है और $$T_2$$ सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी जानकारी पुनर्प्राप्त कर सकता है $$T_1$$ के प्रेक्षित मूल्य पर कंडीशनिंग करते समय $$T_2$$. इसे सशर्त अनुमान के रूप में जाना जाता है।

उदाहरण के लिए, मान लीजिये $$X_1, X_2$$ का पीछा करो $$N(\theta, 1)$$ वितरण कहां $$\theta$$ अज्ञात है। हालाँकि, ध्यान दें $$X_1$$ के लिए पर्याप्त नहीं है $$\theta$$ (चूंकि इसकी फिशर जानकारी 1 है, जबकि फिशर जानकारी पूर्ण आँकड़ा है $$\overline{X}$$ 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके $$X_1 - X_2$$, कोई फिशर जानकारी 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।

सहायक पूरक
एक आँकड़ा टी दिया गया है जो पर्याप्तता (सांख्यिकी) नहीं है, एक 'सहायक पूरक' एक आँकड़ा यू है जो सहायक है और ऐसा है कि (टी, यू) पर्याप्त है। सहज रूप से, एक सहायक पूरक छूटी हुई जानकारी को जोड़ता है (बिना किसी नकल के)।

यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई टी को अधिकतम संभावना अनुमानक मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को टी की फिशर सूचना सामग्री को टी का सीमांत नहीं मानना ​​चाहिए, बल्कि टी का सशर्त वितरण, दिया गया यू: कितनी जानकारी है टी जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता मौजूद नहीं है, और यदि कोई मौजूद है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक मौजूद है।

उदाहरण
बेसबॉल में, मान लीजिए कि एक स्काउट एन एट-बैट में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर एन को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की सांख्यिकीय स्वतंत्रता है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं. अंतिम डेटा एट-बैट की संख्या एन और हिट की संख्या एक्स है: डेटा (एक्स, एन) एक पर्याप्त आँकड़ा है। देखा गया बल्लेबाजी औसत (बेसबॉल) चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास पैदा नहीं करता है)। एट-बैट की संख्या एन एक सहायक आँकड़ा है क्योंकि यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक 'सहायक पूरक' है, अर्थात, बल्लेबाजी औसत एन के साथ मिलकर यह पर्याप्त हो जाता है।
 * यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
 * इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।

यह भी देखें

 * बसु का प्रमेय
 * भविष्यवाणी अंतराल
 * समूह परिवार
 * सशर्तता सिद्धांत

टिप्पणियाँ
[Category:Statistical theo