सहायक आँकड़ा

एक सहायक आँकड़ा एक नमूने का एक माप है जिसका वितरण (या जिसका पीएमएफ या पीडीएफ) मॉडल के मापदंडों पर निर्भर नहीं करता है। सहायक आँकड़ा एक निर्णायक मात्रा है जो एक आँकड़ा भी है। पूर्वानुमान अंतराल के निर्माण के लिए सहायक सांख्यिकी का उपयोग किया जा सकता है। इनका उपयोग आंकड़ों के बीच स्वतंत्रता सिद्ध करने के लिए बसु के प्रमेय के संबंध में भी किया जाता है।

यह अवधारणा पहली बार 1920 के दशक में रोनाल्ड फिशर द्वारा प्रस्तुत की गई थी, लेकिन इसकी औपचारिक परिभाषा केवल 1964 में देबा बी एट अल. बस द्वारा प्रदान की गई थी।

उदाहरण
मान लीजिए X1, ..., Xn स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं, और अज्ञात अपेक्षित मूल्य μ और ज्ञात भिन्नता 1 के साथ सामान्य वितरण हैं।


 * $$\overline{X}_n = \frac{X_1+\,\cdots\,+X_n}{n}$$

अंकगणित माध्य हो.

नमूने के प्रसार के निम्नलिखित सांख्यिकीय उपाय
 * रेंज (सांख्यिकी): अधिकतम (X1, ..., Xn) - मिनट (X1, ..., Xn)
 * अंतरचतुर्थक सीमा: Q3 − Q1
 * नमूना विचरण:
 * $$\hat{\sigma}^2:=\,\frac{\sum \left(X_i-\overline{X}\right)^2}{n}$$

सभी सहायक आँकड़े हैं, क्योंकि उनके नमूना वितरण μ परिवर्तन के रूप में नहीं बदलते हैं। कम्प्यूटेशनल रूप से, ऐसा इसलिए है क्योंकि, सूत्रों में, μ शब्द रद्द हो जाते हैं - एक वितरण (और सभी नमूनों) में एक निरंतर संख्या जोड़ने से इसका नमूना अधिकतम और न्यूनतम एक ही मात्रा में बदल जाता है, इसलिए यह उनके अंतर को नहीं बदलता है, और इसी तरह दूसरों के लिए भी: प्रसार के ये उपाय स्थान पर निर्भर नहीं करते हैं।

इसके विपरीत, आई.आई.डी. ज्ञात माध्य 1 और अज्ञात विचरण σ2 के साथ सामान्य चर, नमूना माध्य $$\overline{X}$$ विचरण का सहायक आँकड़ा नहीं है, क्योंकि नमूना माध्य का नमूना वितरण N(1, σ2/n) है, जो σ2 पर निर्भर करता है - स्थान का यह माप (विशेष रूप से, इसकी मानक त्रुटि) विचरण पर निर्भर करता है।

स्थान-स्तरीय फॅमिली में
एक स्थान फॅमिली में, $$(X_1 - X_n, X_2 - X_n, \dots, X_{n-1} - X_n)$$ एक सहायक आँकड़ा है.

एक स्केल फॅमिली में, $$(\frac{X_1}{X_n}, \frac{X_2}{X_n}, \dots, \frac{X_{n-1}}{X_n})$$ एक सहायक आँकड़ा है.

स्थान-पैमाने पर वितरण के फॅमिली स्थान-पैमाने पर फॅमिली में, $$(\frac{X_1 - X_n}{S}, \frac{X_2 - X_n}{S}, \dots, \frac{X_{n - 1} - X_n}{S})$$, कहाँ $$S^2$$ नमूना विचरण है, एक सहायक आँकड़ा है।

सूचना की पुनर्प्राप्ति में
यह पता चला है कि, यदि $$T_1$$ एक गैर-पर्याप्त आँकड़ा है और $$T_2$$ सहायक है, कोई भी कभी-कभी रिपोर्टिंग द्वारा संपूर्ण डेटा में निहित अज्ञात पैरामीटर के बारे में सारी सूचना पुनर्प्राप्त कर सकता है $$T_1$$ के प्रेक्षित मूल्य पर अनुकूलन करते समय $$T_2$$. इसे सशर्त अनुमान के रूप में जाना जाता है।

उदाहरण के लिए, मान लीजिये $$X_1, X_2$$ का पीछा करो $$N(\theta, 1)$$ वितरण कहां $$\theta$$ अज्ञात है। हालाँकि, ध्यान दें $$X_1$$ के लिए पर्याप्त नहीं है $$\theta$$ (चूंकि इसकी फिशर सूचना 1 है, जबकि फिशर सूचना पूर्ण आँकड़ा है $$\overline{X}$$ 2 है), अतिरिक्त रूप से सहायक आँकड़ा रिपोर्ट करके $$X_1 - X_2$$, कोई फिशर सूचना 2 के साथ एक सम्मिलित वितरण प्राप्त करता है।

सहायक पूरक
एक आँकड़ा T दिया गया है जो पर्याप्तता (सांख्यिकी) नहीं है, एक 'सहायक पूरक ' एक आँकड़ा U है जो सहायक है और ऐसा है कि (T, U) पर्याप्त है। सहज रूप से, एक सहायक पूरक T हुई (बिना किसी नकल के) सूचना को जोड़ता है ।

यह आँकड़ा विशेष रूप से उपयोगी है यदि कोई T को अधिकतम संभावना अनुमानक मानता है, जो सामान्य तौर पर पर्याप्त नहीं होगा; तो कोई सहायक पूरक मांग सकता है। इस मामले में, फिशर का तर्क है कि किसी को सूचना सामग्री निर्धारित करने के लिए एक सहायक पूरक पर शर्त लगानी चाहिए: किसी को T की फिशर सूचना सामग्री को T का सीमांत नहीं मानना ​​चाहिए, बल्कि T का सशर्त वितरण, दिया गया U सूचना है जिसे T जोड़ें? यह सामान्य रूप से संभव नहीं है, क्योंकि किसी सहायक पूरक की आवश्यकता उपस्थित नहीं है, और यदि कोई उपस्थित है, तो उसे अद्वितीय होने की आवश्यकता नहीं है, न ही अधिकतम सहायक पूरक उपस्थित है।

उदाहरण
बेसबॉल में, मान लीजिए कि एक स्काउट N एट-बैट (N at-bats) में एक बल्लेबाज को देखता है। मान लीजिए (अवास्तविक रूप से) कि नंबर N को कुछ यादृच्छिक प्रक्रिया द्वारा चुना जाता है जो बल्लेबाज की क्षमता की सांख्यिकीय स्वतंत्रता है - मान लें कि प्रत्येक बल्लेबाजी के बाद एक सिक्का उछाला जाता है और परिणाम यह निर्धारित करता है कि स्काउट बल्लेबाज की अगली बल्लेबाजी को देखने के लिए रुकेगा या नहीं. अंतिम डेटा एट-बैट की संख्या N और हिट की संख्या एक्स है: डेटा (X/N एक पर्याप्त आँकड़ा है। देखा गया बल्लेबाजी औसत (बेसबॉल) चैंपियन, केवल पांच एट-बैट पर आधारित 100 एट-बैट पर आधारित 0.400 औसत की तुलना में खिलाड़ी की क्षमता में कहीं भी उतना आत्मविश्वास उत्पन्न नहीं करता है)। एट-बैट की संख्या N एक सहायक आँकड़ा है क्योंकि यह सहायक आँकड़ा प्रेक्षित बल्लेबाजी औसत X/N के लिए एक 'सहायक पूरक ' है, अर्थात, बल्लेबाजी औसत N के साथ मिलकर यह पर्याप्त हो जाता है।
 * यह अवलोकन योग्य डेटा का एक हिस्सा है (यह एक आँकड़ा है), और
 * इसका संभाव्यता वितरण बल्लेबाज की क्षमता पर निर्भर नहीं करता है, क्योंकि इसे बल्लेबाज की क्षमता से स्वतंत्र एक यादृच्छिक प्रक्रिया द्वारा चुना गया था।

यह भी देखें

 * बसु का प्रमेय
 * भविष्यवाणी अंतराल
 * समूह फॅमिली
 * सशर्तता सिद्धांत

टिप्पणियाँ
[Category:Statistical theo