सांख्यिकीय अनुमिति

सांख्यिकीय अनुमिति एक अंतर्निहित संभाव्यता वितरण के गुणों का अनुमान लगाने के लिए आंकड़े विश्लेषण का उपयोग करने की प्रक्रिया है। आनुमानिक सांख्यिकीय विश्लेषण एक सांख्यिकीय आबादी के गुणों की अनुमान लगाता है, उदाहरण के लिए परिकल्पनाओं का परीक्षण करके और अनुमान प्राप्त करके। यह माना जाता है कि देखे गए आंकड़े समुच्चय एक बड़ी आबादी का नमूनाकरण (सांख्यिकी) है।

अनुमानात्मक सांख्यिकी की तुलना वर्णनात्मक सांख्यिकी से की जा सकती है। वर्णनात्मक आँकड़े केवल देखे गए आंकड़ों के गुणों से संबंधित हैं, और यह इस अनुमान पर आधारित नहीं है कि आंकड़ा एक बड़ी आबादी से आता है। यंत्र अधिगम में, शब्द निष्कर्ष का उपयोग कभी-कभी पहले से प्रशिक्षित प्रतिरूप का मूल्यांकन करके भविष्यवाणी करने के लिए किया जाता है; इस संदर्भ में प्रतिरूप के गुणों का उल्लेख प्रशिक्षण या सीखने (अनुमान के बजाय) के रूप में किया जाता है, और भविष्यवाणी के लिए एक प्रतिरूप का उपयोग करने के लिए अनुमान (भविष्यवाणी के बजाय) के रूप में संदर्भित किया जाता है; भविष्यसूचक अनुमान भी देखें।

परिचय
सांख्यिकीय अनुमिति जनसंख्या के किसी प्रकार के नमूने (सांख्यिकी) के साथ जनसंख्या से प्राप्त आंकड़ों का उपयोग करके जनसंख्या के बारे में प्रस्ताव बनाता है। आबादी के बारे में एक परिकल्पना को देखते हुए, जिसके लिए हम अनुमान लगाना चाहते हैं, सांख्यिकीय अनुमिति में (पहले) प्रतिरूप चयन प्रक्रिया का एक सांख्यिकीय प्रतिरूप होता है जो आंकड़े उत्पन्न करता है और (दूसरा) प्रतिरूप से प्रस्तावों को घटाता है।

कोनिशी और कितागावा ने स्पष्ट किया कि, सांख्यिकीय अनुमिति में अधिकांश समस्याओं को सांख्यिकीय प्रतिरूपण से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, डेविड कॉक्स (सांख्यिकीविद्) ने कहा है, विषय-वस्तु समस्या से सांख्यिकीय प्रतिरूप में अनुवाद कैसे किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण हिस्सा होता है।

एक सांख्यिकीय अनुमिति का तार्किक परिणाम एक सांख्यिकीय प्रस्ताव है। सांख्यिकीय प्रस्ताव के कुछ सामान्य रूप निम्नलिखित हैं:
 * एक बिंदु अनुमान, यानी एक विशेष मूल्य जो हित के कुछ मापदण्ड का सबसे अच्छा अनुमान लगाता है;
 * एक अंतराल अनुमान, उदा। एक विश्वास्यता अंतराल (या निर्धारित आकलन), यानी एक आबादी से तैयार किए गए आंकड़े सम्मुच्चय का उपयोग करके बनाया गया एक अंतराल, ताकि ऐसे आंकड़े सम्मुच्चय के बार-बार नमूने के तहत, ऐसे अंतराल में बताए गए  विश्वस्यता स्तर पर आवृति प्रायिकता के साथ सही मापदण्ड मान हो;
 * एक विश्वसनीय अंतराल, यानी मूल्यों का एक सम्मुच्चय जिसमें उदाहरण के लिए, पश्च विश्वास का 95% हो;
 * एक सांख्यिकीय परिकल्पना परीक्षण की अस्वीकृति;
 * समूहों में आंकड़े बिंदुओं का झुण्ड विश्लेषण या सांख्यिकीय वर्गीकरण।

प्रतिरूप और अनुमानएँ
किसी भी सांख्यिकीय अनुमिति के लिए कुछ मान्यताओं की आवश्यकता होती है। एक सांख्यिकीय प्रतिरूप देखे गए आंकड़े और समान आंकड़ों की पीढ़ी से संबंधित मान्यताओं का एक समूह है। सांख्यिकीय प्रतिरूप के विवरण सामान्यतः हित की जनसंख्या मात्रा की उस भूमिका पर जोर देता है, जिसके बारे में हम अनुमान लगाना चाहते हैं। अधिक औपचारिक निष्कर्ष निकाले जाने से पहले वर्णनात्मक आँकड़े सामान्यतः प्रारंभिक चरण के रूप में उपयोग किए जाते हैं।

प्रतिरूप/अनुमानओं की घात
सांख्यिकीविद् प्रतिरूपण मान्यताओं के तीन स्तरों के बीच अंतर करते हैं;
 * प्राचलिक प्रतिरूप: आंकड़े -जनन प्रक्रिया का वर्णन करने वाले प्रायिकता वितरण को संभाव्यता वितरण के एक परिवार द्वारा पूरी तरह से वर्णित माना जाता है जिसमें केवल अज्ञात मापदण्ड सम्मिलित होते हैं। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या मूल्यों का वितरण वास्तव में सामान्य है, अज्ञात माध्य और विचरण के साथ है, और यह कि आंकड़े सम्मुच्चय 'सरल' यादृच्छिक नमूनाकरण द्वारा उत्पन्न होते हैं। सामान्यीकृत रैखिक घटकों का परिवार प्राचलिक प्रतिरूप का व्यापक रूप से उपयोग किया जाने वाला और लचीला वर्ग है।
 * गैर-प्राचलिक: आंकड़े उत्पन्न करने की प्रक्रिया के बारे में अनुमान प्राचलिक आंकड़ों की तुलना में बहुत कम है और न्यूनतम हो सकती है। [9] उदाहरण के लिए, प्रत्येक निरंतर संभाव्यता वितरण में एक माध्यिका होती है, जिसका अनुमान नमूना माध्यिका या हॉजेस-लेहमन-सेन अनुमानक का उपयोग करके लगाया जा सकता है, जब डेटा सरल यादृच्छिक नमूनाकरण से उत्पन्न होता है तो इसमें अच्छे गुण होते हैं ।
 * अल्प-प्राचलिक: यह शब्द सामान्यतः 'बीच में' पूरी तरह से और गैर-प्राचलिक दृष्टिकोणों की अनुमानओं को दर्शाता है। उदाहरण के लिए, कोई यह मान सकता है कि जनसंख्या वितरण का एक परिमित माध्य है। इसके अलावा, कोई यह मान सकता है कि जनसंख्या में औसत प्रतिक्रिया स्तर कुछ सहसंयोजक (एक प्राचलिक अनुमान) पर वास्तव में रैखिक तरीके से निर्भर करता है, लेकिन उस माध्य के आसपास के विचरण का वर्णन करने वाला कोई प्राचलिक अनुमान नहीं बनाता है (अर्थात किसी विषमलैंगिकता की उपस्थिति या संभावित रूप के बारे में) अधिक सामान्यतः, अर्ध-प्राचलिक प्रतिरूप को प्रायः 'संरचनात्मक' और 'यादृच्छिक भिन्नता' घटकों में अलग किया जा सकता है। एक घटक को प्राचलिक रूप से और दूसरे को गैर-प्राचलिक रूप से व्यवहार किया जाता है। प्रसिद्ध कॉक्स प्रतिरूप अर्ध-प्राचलिक मान्यताओं का एक समूह है।

मान्य प्रतिरूप/अनुमानओं का महत्व
जिस भी स्तर का अनुमान लगाया जाता है, सामान्य रूप से सही ढंग से व्यवस्थित अनुमान होते हैं, इन अनुमानों को सही होने की आवश्यकता होती है; यानी कि आंकड़े -उत्पादक प्रक्रिया को वास्तव में सही ढंग से निर्दिष्ट किया गया है।

' सरल 'यादृच्छिक नमूनाकरण सांख्यिकीय अनुमिति को अमान्य कर सकता है। अधिक जटिल अर्ध- और पूरी तरह से प्राचलिक अनुमानएं भी चिंता का कारण हैं। उदाहरण के लिए, गलत तरीके से कॉक्स प्रतिरूप को मानने से कुछ मामलों में गलत निष्कर्ष निकल सकते हैं। जनसंख्या में सामान्यता की गलत अनुमानएं प्रतिगमन-आधारित अनुमान के कुछ रूपों को भी अमान्य कर देती हैं। किसी भी प्राचलिक प्रतिरूप के उपयोग को मानव जनसंख्या के नमूने लेने में अधिकांश विशेषज्ञों द्वारा संशय की दृष्टि से देखा जाता है: अधिकांश सांख्यिकीविद नमूने, जब विश्वास्यता अंतराल से निपटते हैं, तो खुद को बहुत बड़े नमूनों के आधार पर [अनुमानकों] के बारे में बयानों तक सीमित रखते हैं, जहां केंद्रीय सीमा प्रमेय सुनिश्चित करता है। कि इन [अनुमानकों] के वितरण लगभग सामान्य होंगे। विशेष रूप से, एक सामान्य वितरण पूरी तरह से अवास्तविक और भयावह रूप से नासमझ अनुमान होगी यदि हम किसी भी प्रकार की आर्थिक आबादी के साथ काम कर रहे हों। यहां, केंद्रीय सीमा प्रमेय बताता है कि बहुत बड़े नमूनों के लिए नमूना माध्य का वितरण लगभग सामान्य रूप से वितरित किया जाता है, यदि वितरण भारी-सपुच्छ वाला नहीं है।

अनुमानित वितरण
नमूना आँकड़ों के सटीक वितरण को निर्दिष्ट करने में कठिनाई को देखते हुए, इनकी अनुमान लगाने के लिए कई तरीके विकसित किए गए हैं।

परिमित नमूनों के साथ, सन्निकटन सिद्धांत यह मापता है कि एक सीमित वितरण आँकड़ों के नमूना वितरण के कितने करीब है: उदाहरण के लिए, 10,000 स्वतंत्र नमूनों के साथ, बेरी-एस्सेन प्रमेय द्वारा, सामान्य वितरण अनुमानित (सटीकता के दो अंकों तक) कई जनसंख्या वितरणों के लिए नमूना माध्य का वितरण है। फिर भी कई व्यावहारिक उद्देश्यों के लिए, अनुकरण अध्ययन और सांख्यिकीविदों के अनुभव के अनुसार, 10 (या अधिक) स्वतंत्र नमूने होने पर सामान्य सन्निकटन नमूना-माध्य के वितरण के लिए एक अच्छा सन्निकटन प्रदान करता है। 1950 के दशक में कोलमोगोरोव के काम के बाद, उन्नत सांख्यिकी सन्निकटन की त्रुटि को निर्धारित करने के लिए सन्निकटन सिद्धांत और कार्यात्मक विश्लेषण का उपयोग करती है। इस दृष्टिकोण में, प्रायिकता वितरण की मापीय ज्यामिति का अध्ययन किया जाता है; यह दृष्टिकोण अनुमानित त्रुटि को मापता है, उदाहरण के लिए, कुल्बैक-लीब्लर विचलन, ब्रैगमैन विचलन, और हेलिंगर दूरी।

अनिश्चित रूप से बड़े नमूनों के साथ, स्पर्शोन्मुख सिद्धांत (सांख्यिकी) केंद्रीय सीमा प्रमेय की तरह नमूना आँकड़ों के सीमित वितरण का वर्णन करता है, यदि कोई मौजूद है। सीमित परिणाम परिमित नमूनों के बारे में कथन नहीं हैं, और वास्तव में परिमित नमूनों के लिए अप्रासंगिक हैं।  हालांकि, परिमित नमूनों के साथ काम करने के लिए वितरण को सीमित करने के स्पर्शोन्मुख सिद्धांत को प्रायः लागू किया जाता है। उदाहरण के लिए, सीमित परिणाम प्रायः क्षणों की सामान्यीकृत विधि और सामान्यीकृत अनुमान समीकरणों के उपयोग को सही ठहराने के लिए लागू होते हैं, जो कि अर्थमिति और जैव-सांख्यिकी में लोकप्रिय हैं। सीमित वितरण और वास्तविक वितरण (औपचारिक रूप से, सन्निकटन की 'त्रुटि') के बीच अंतर के परिमाण का मूल्यांकन अनुकरण का उपयोग करके किया जा सकता है। परिमित नमूनों के परिणामों को सीमित करने का अनुमानी अनुप्रयोग कई अनुप्रयोगों में आम चलन है, विशेष रूप से लॉग-अवतल संभावना वाले कम-आयामी प्रतिरूप के साथ (जैसे कि एक- मापदण्ड घातीय परिवारों के साथ)।

यादृच्छिकीकरण आधारित प्रतिरूप
किसी दिए गए आंकड़े सम्मुच्चय के लिए जो एक यादृच्छिककरण अभिकल्पना द्वारा निर्मित किया गया था, एक सांख्यिकीय (शून्य-परिकल्पना के तहत) के यादृच्छिककरण वितरण को सभी योजनाओं के लिए परीक्षण आंकड़े का मूल्यांकन करके परिभाषित किया गया है जो कि यादृच्छिककरण अभिकल्पना द्वारा उत्पन्न किया जा सकता था। बारंबारतावादी अनुमान में, यादृच्छिककरण एक व्यक्तिपरक प्रतिरूप के बजाय यादृच्छिककरण वितरण पर आधारित होने की अनुमति देता है, और यह विशेष रूप से सर्वेक्षण नमूनाकरण और प्रयोगों के अभिकल्पना में महत्वपूर्ण है। यादृच्छिक अध्ययन से सांख्यिकीय निष्कर्ष भी कई अन्य स्थितियों की तुलना में अधिक सीधा है।  बायेसियन अनुमान में, यादृच्छिककरण भी महत्वपूर्ण है: सर्वेक्षण नमूनाकरण में, प्रतिस्थापन के बिना नमूने का उपयोग जनसंख्या के साथ नमूने की विनिमयशीलता सुनिश्चित करता है; यादृच्छिक प्रयोगों में, यादृच्छिककरण सहविचर जानकारी के लिए यादृच्छिक अनुमान पर लापता होने का वारंट करता है। वस्तुनिष्ठ यादृच्छिककरण ठीक से आगमनात्मक प्रक्रियाओं की अनुमति देता है। कई सांख्यिकीविद् आंकड़ों के यादृच्छिककरण-आधारित विश्लेषण को पसंद करते हैं जो कि अच्छी तरह से परिभाषित यादृच्छिकीकरण प्रक्रियाओं द्वारा उत्पन्न किया गया था। (हालांकि, यह सच है कि विज्ञान के क्षेत्रों में विकसित सैद्धांतिक ज्ञान और प्रयोगात्मक नियंत्रण के साथ, यादृच्छिक प्रयोग अनुमानों की गुणवत्ता में सुधार किए बिना प्रयोग की लागत बढ़ा सकते हैं। )

इसी तरह, प्रमुख सांख्यिकीय अधिकारियों द्वारा यादृच्छिक प्रयोगों के परिणामों की अनुशंसा की जाती है क्योंकि समान घटनाओं के अवलोकन संबंधी अध्ययनों की तुलना में अधिक विश्वसनीयता वाले अनुमानों की अनुमति होती है।

हालांकि, एक अच्छा अवलोकन संबंधी अध्ययन एक खराब यादृच्छिक प्रयोग से बेहतर हो सकता है।

एक यादृच्छिक प्रयोग का सांख्यिकीय विश्लेषण प्रायोगिक विज्ञप्ति में वर्णित यादृच्छिकीकरण योजना पर आधारित हो सकता है और इसके लिए व्यक्तिपरक प्रतिरूप की आवश्यकता नहीं होती है।

हालाँकि, किसी भी समय, कुछ परिकल्पनाओं का वस्तुनिष्ठ सांख्यिकीय प्रतिरूप का उपयोग करके परीक्षण नहीं किया जा सकता है, जो यादृच्छिक प्रयोगों या यादृच्छिक नमूनों का सटीक वर्णन करते हैं। कुछ मामलों में, ऐसे यादृच्छिक अध्ययन असंवैधानिक या अनैतिक हैं।

यादृच्छिक प्रयोगों का प्रतिरूप-आधारित विश्लेषण
यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करते समय एक सांख्यिकीय प्रतिरूप, उदाहरण के लिए, एक रैखिक या रसद प्रतिरूप को संदर्भित करना मानक अभ्यास है। हालाँकि, यादृच्छिककरण योजना एक सांख्यिकीय प्रतिरूप की पसंद का मार्गदर्शन करती है। यादृच्छिकीकरण योजना को जाने बिना उपयुक्त प्रतिरूप का चयन करना संभव नहीं है। प्रयोगात्मक विज्ञप्ति की अनदेखी करते हुए यादृच्छिक प्रयोगों से आंकड़ों का विश्लेषण करके गंभीर रूप से भ्रामक परिणाम प्राप्त किए जा सकते हैं; सामान्य गलतियों में एक प्रयोग में उपयोग किए गए अवरोधन को भूल जाना और एक ही प्रायोगिक इकाई पर बार-बार माप को अलग-अलग प्रायोगिक इकाइयों पर लागू उपचार की स्वतंत्र प्रतिकृति के साथ भ्रमित करना सम्मिलित है।

प्रतिरूप-मुक्त यादृच्छिककरण अनुमान
प्रतिरूप-मुक्त तकनीकें प्रतिरूप-आधारित विधियों का पूरक प्रदान करती हैं, जो वास्तविकता-सरलीकरण की न्यूनीकरणवादी रणनीतियों को नियोजित करती हैं। पूर्व संयोजन, विकास, पहनावा और कलन विधि को गतिशील रूप से एक प्रक्रिया के प्रासंगिक समानता के अनुकूल बनाने और टिप्पणियों की आंतरिक विशेषताओं को सीखने के लिए नियोजित करती हैं।

उदाहरण के लिए, प्रतिरूप-मुक्त सरल रेखीय प्रतिगमन निम्न पर आधारित है।
 * एक यादृच्छिक अभिकल्पना, जहां टिप्पणियों के जोड़े $$(X_1,Y_1), (X_2,Y_2), \cdots, (X_n,Y_n)$$ स्वतंत्र और समान रूप से वितरित (iid) हैं, या
 * एक नियतात्मक अभिकल्पना, जहां चर $$X_1, X_2, \cdots, X_n$$ नियतात्मक हैं, लेकिन संबंधित प्रतिक्रिया चर $$Y_1,Y_2, \cdots, Y_n$$ एक सामान्य सशर्त वितरण के साथ यादृच्छिक और स्वतंत्र हैं, अर्थात, $$P\left (Y_j \leq y | X_j =x\right ) = D_x(y)$$, जो सूचकांक $$j$$ से स्वतंत्र है।

किसी भी मामले में, सामान्य सशर्त वितरण की सुविधाओं के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान $$D_x(.)$$ कुछ नियमितता स्थितियों पर निर्भर करता है, उदा। कार्यात्मक सहजता। उदाहरण के लिए, जनसंख्या सुविधा सशर्त माध्य के लिए प्रतिरूप-मुक्त यादृच्छिककरण अनुमान, $$\mu(x)=E(Y | X = x)$$, अनुमान के तहत स्थानीय औसत या स्थानीय बहुपद उपयुक्त के माध्यम से लगातार अनुमान लगाई जा सकती है कि $$\mu(x)$$निर्बाध है। इसके अलावा, स्पर्शोन्मुख सामान्यता या पुनरुत्पादन पर भरोसा करते हुए, हम जनसंख्या विशेषता के लिए विश्वास अंतराल का निर्माण कर सकते हैं, इस मामले में, सशर्त माध्य, $$\mu(x)$$ है।

अनुमान के प्रतिमान
सांख्यिकीय अनुमिति के विभिन्न विद्यालय स्थापित हो गए हैं। ये विद्यालय-या प्रतिमान-पारस्परिक रूप से अनन्य नहीं हैं, और जो तरीके एक प्रतिमान के तहत अच्छी तरह से काम करते हैं, उनकी प्रायः अन्य प्रतिमानों के तहत आकर्षक व्याख्या होती है।

बंद्योपाध्याय और फोस्टर चार प्रतिमानों का वर्णन करते हैं: पारम्परिक (या आवृत्तिवादी अनुमान) प्रतिमान, बायेसियन अनुमान प्रतिमान, संभावनावाद प्रतिमान, और एकाइके सूचना मानदंड| अकाइकेन-सूचना मानदंड-आधारित प्रतिमान।

आवृत्तिवादी अनुमान
यह प्रतिमान हाथ में एक के समान आंकड़े सम्मुच्चय बनाने के लिए जनसंख्या वितरण के बार-बार नमूने पर विचार करके प्रस्तावों की संभाव्यता को जांचता है। दोहराए गए नमूने के तहत आंकड़े सम्मुच्चय की विशेषताओं पर विचार करके, एक सांख्यिकीय प्रस्ताव के आवृत्तिवादी गुणों को परिमाणित किया जा सकता है - हालांकि व्यवहार में यह परिमाणीकरण चुनौतीपूर्ण हो सकता है।

आवृत्तिवादी अनुमान के उदाहरण

 * p- मूल्य
 * निराकरणीय परिकल्पना अंतराल
 * अशक्त परिकल्पना महत्व परीक्षण

आवृत्तिवादी अनुमान, वस्तुनिष्ठता और निर्णय सिद्धांत
बारंबारतावादी अनुमान (या शास्त्रीय अनुमान) की एक व्याख्या यह है कि यह केवल आवृत्ति संभावना के संदर्भ में लागू होता है; यानी, किसी आबादी से बार-बार नमूने लेने के संदर्भ में। हालांकि, नेमन का दृष्टिकोण पूर्व-प्रयोग संभावनाओं के संदर्भ में इन प्रक्रियाओं को विकसित करता है। अर्थात्, एक प्रयोग करने से पहले, एक निष्कर्ष पर आने के लिए एक नियम तय करता है जैसे कि सही होने की संभावना को एक उपयुक्त तरीके से नियंत्रित किया जाता है: इस तरह की संभावना को बारंबारतावादी या बार-बार नमूना व्याख्या की आवश्यकता नहीं होती है। इसके विपरीत, बायेसियन अनुमान सशर्त संभावनाओं के संदर्भ में काम करता है (अर्थात देखे गए आंकड़े पर सशर्त संभावनाएं), सीमांत (लेकिन अज्ञात मापदंडों पर सशर्त) संभावनाओं की तुलना में लगातार दृष्टिकोण में उपयोग किया जाता है।

उपयोगिता कार्यों के संबंध में महत्व परीक्षण और विश्वास अंतराल की लगातार प्रक्रियाओं का निर्माण किया जा सकता है। हालाँकि, आवृत्तिवादी सांख्यिकी के कुछ तत्व, जैसे कि सांख्यिकीय निर्णय सिद्धांत, उपयोगिता कार्यों को सम्मिलित करते हैं। विशेष रूप से, इष्टतम अनुमान (जैसे न्यूनतम-विचरण निष्पक्ष अनुमानक, या समान रूप से सबसे शक्तिशाली परीक्षण) के लगातार विकास हानि कार्यों का उपयोग करते हैं, जो (नकारात्मक) उपयोगिता कार्यों की भूमिका निभाते हैं। सांख्यिकीय सिद्धांतकारों को यह साबित करने के लिए हानि कार्यों को स्पष्ट रूप से नहीं बताया जाना चाहिए कि एक सांख्यिकीय प्रक्रिया में इष्टतमता संपत्ति है। हालांकि, नुकसान-प्रकार्य प्रायः इष्टतम गुणों को बताते हुए उपयोगी होते हैं: उदाहरण के लिए, औसत-निष्पक्ष अनुमानक पूर्ण मूल्य हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित हानि को कम करते हैं, और कम से कम वर्ग अनुमानक वर्ग त्रुटि हानि कार्यों के तहत इष्टतम होते हैं, जिसमें वे अपेक्षित नुकसान को कम करें।

जबकि बारंबारतावादी अनुमान का उपयोग करने वाले सांख्यिकीविदों को स्वयं के लिए रुचि के मापदंडों का चयन करना चाहिए, और उपयोग किए जाने वाले अनुमानक/परीक्षण आंकड़े, स्पष्ट रूप से स्पष्ट उपयोगिताओं और पूर्व वितरण की अनुपस्थिति ने आवृत्तिवादी प्रक्रियाओं को व्यापक रूप से 'उद्देश्य' के रूप में देखने में मदद की है।

बेजअनुमिति
बायेसियन कलन संभाव्यता की 'भाषा' का उपयोग करके विश्वास की घात का वर्णन करता है; विश्वास सकारात्मक हैं, एक में एकीकृत होते हैं, और संभाव्यता स्वयंसिद्धों का पालन करते हैं। बायेसियन अनुमान सांख्यिकीय प्रस्ताव बनाने के आधार के रूप में उपलब्ध पश्च विश्वासों का उपयोग करता है। बायेसियन दृष्टिकोण का उपयोग करने के लिए कई अलग-अलग औचित्य हैं।

बायेसियन अनुमान के उदाहरण

 * अंतराल अनुमान के लिए विश्वसनीय अंतराल
 * प्रतिरूप तुलना के लिए बेयस कारक

बायेसियन अनुमान, व्यक्तिपरकता और निर्णय सिद्धांत
कई अनौपचारिक बायेसियन संदर्भ पश्च के सहज रूप से उचित सारांश पर आधारित हैं। उदाहरण के लिए, पश्च माध्य, मध्य और विधा, उच्चतम पश्च घनत्व अंतराल, और बेयस कारक सभी इस तरह से प्रेरित हो सकते हैं। हालांकि इस प्रकार के अनुमान के लिए एक उपयोगकर्ता के उपयोगिता कार्य को बताने की आवश्यकता नहीं है, ये सारांश पहले बताए गए विश्वासों पर निर्भर करते हैं (कुछ हद तक), और सामान्यतः व्यक्तिपरक निष्कर्ष के रूप में देखे जाते हैं। (पूर्व निर्माण की विधियाँ जिनमें बाहरी  निविष्ट की आवश्यकता नहीं होती है बायेसियन संभाव्यता और पूर्ववर्ती  निर्माण के लिए वस्तुनिष्ठ विधियाँ हैं लेकिन अभी तक पूरी तरह से विकसित नहीं हुई हैं।)

औपचारिक रूप से, बायेसियन निष्कष को स्पष्ट रूप से बताई गई उपयोगिता, या हानि प्रकार्य के संदर्भ में व्यवस्थित किया जाता है; 'बेयस नियम' वह है जो अपेक्षित उपयोगिता को अधिकतम करता है, पश्च अनिश्चितता पर औसत किये हुए। इसलिए औपचारिक बायेसियन अनुमान स्वचालित रूप से एक निर्णय सिद्धांत अर्थ में इष्टतम निर्णय प्रदान करता है। मान्यताओं, आंकड़ों और उपयोगिता को देखते हुए, बायेसियन अनुमान अनिवार्य रूप से किसी भी समस्या के लिए बनाया जा सकता है, हालांकि हर सांख्यिकीय अनुमिति की बायेसियन व्याख्या की आवश्यकता नहीं है। विश्लेषण जो औपचारिक रूप से बायेसियन नहीं हैं (तार्किक रूप से) सुसंगतता (सांख्यिकी) हो सकते हैं; बायेसियन प्रक्रियाओं की एक विशेषता जो उचित पुरोहितों का उपयोग करती है (अर्थात वे जो एक के लिए पूर्णांक हैं) यह है कि उन्हें सुसंगतता (सांख्यिकी) होने की प्रत्याभुति दी जाती है। बायेसियन अनुमान के कुछ पैरोकार दावा करते हैं कि इस निर्णय-सैद्धांतिक ढांचे में अनुमान लगाया जाना चाहिए, और बायेसियन अनुमान को बाद के विश्वासों के मूल्यांकन और सारांश के साथ समाप्त नहीं करना चाहिए।

संभावना आधारित अनुमान
संभावना प्रकार्य का उपयोग करके संभावनावाद आंकड़ों तक पहुंचता है। कुछ संभाव्यवादी आँकड़ों को साक्ष्य से केवल संगणना समर्थन के रूप में मानते हुए, अनुमान को अस्वीकार करते हैं। अन्य, हालांकि, संभावना प्रकार्य के आधार पर अनुमान का प्रस्ताव करते हैं, जिनमें से सबसे प्रसिद्ध अधिकतम संभावना अनुमान है।

AIC आधारित अनुमान
एकैके सूचना मानदंड (AIC) आंकड़ों के दिए गए सम्मुच्चय के लिए सांख्यिकीय प्रतिरूप की सापेक्ष गुणवत्ता का एक अनुमानक है। आंकड़ों के लिए प्रतिरूपों के संग्रह को देखते हुए, प्रत्येक अन्य प्रतिरूप के सापेक्ष AIC प्रत्येक प्रतिरूप की गुणवत्ता की अनुमान लगाता है। इस प्रकार, AIC प्रतिरूप चयन के लिए एक साधन प्रदान करता है।

AIC सूचना सिद्धांत पर आधारित है: यह आंकड़े उत्पन्न करने वाली प्रक्रिया का प्रतिनिधित्व करने के लिए दिए गए प्रतिरूप का उपयोग करते समय खोई हुई सापेक्ष जानकारी का अनुमान प्रदान करता है। (ऐसा करने में, यह प्रतिरूप के फिट होने की अच्छाई और प्रतिरूप की सादगी के बीच व्यापार-बंद से संबंधित है।)

न्यूनतम विवरण लंबाई
सूचना सिद्धांत [48] और कोलमोगोरोव जटिलता के सिद्धांत में विचारों से न्यूनतम विवरण लंबाई (MDL) सिद्धांत विकसित किया गया है।(MDL) सिद्धांत सांख्यिकीय प्रतिरूप का चयन करता है जो आंकड़े को अधिकतम रूप से संपीड़ित करता है; आंकड़ों के लिए प्रतितथ्यात्मक या गैर-मिथ्या आंकड़े -उत्पादक तंत्र या संभाव्यता प्रतिरूप को ग्रहण किए बिना अनुमान आगे बढ़ती है, जैसा कि आवृत्तिवादी या बायेसियन दृष्टिकोणों में किया जा सकता है।

हालांकि, यदि कोई आंकड़े उत्पादक तंत्र वास्तविकता में मौजूद है, तो क्लाउड शैनन के स्रोत कूटलेखन प्रमेय के अनुसार यह आंकड़े  MDL का औसत और विषम रूप से विवरण प्रदान करता है।  विवरण लंबाई (या वर्णनात्मक जटिलता) को कम करने में,  MDL अनुमान अधिकतम संभावना अनुमान और अधिकतम पोस्टरियरी अनुमान के समान है (अधिकतम परिक्षय संभाव्यता वितरण का उपयोग करके। अधिकतम) -परिक्षय बायेसियन प्रायिकता)। हालाँकि, MDL यह मानने से बचता है कि अंतर्निहित संभावना प्रतिरूप ज्ञात है; MDL सिद्धांत को बिना किसी अनुमान के भी लागू किया जा सकता है, जैसे आंकड़े  स्वतंत्र नमूने से उत्पन्न हुआ। MDL सिद्धांत संचार- कूटलेखन सिद्धांत में सूचना सिद्धांत में, रैखिक प्रतिगमन में और आंकड़े  माइनिंग में लागू किया गया है।

MDL-आधारित अनुमानित प्रक्रियाओं का मूल्यांकन प्रायः संगणनात्मक जटिलता सिद्धांत से तकनीकों या मानदंडों का उपयोग करता है।

प्रत्ययी अनुमान
प्रत्ययी अनुमान, प्रत्ययी संभाव्यता पर आधारित सांख्यिकीय अनुमिति के लिए एक दृष्टिकोण था, जिसे प्रत्ययी वितरण के रूप में भी जाना जाता है। बाद के काम में, इस दृष्टिकोण को खराब परिभाषित, प्रयोज्यता में बेहद सीमित और यहां तक ​​कि भ्रामक कहा गया है। हालाँकि यह तर्क वही है जो दिखाता है कि एक तथाकथित आत्मविश्वास वितरण एक वैध प्रायिकता वितरण नहीं है और चूंकि इसने विश्वास्यता अंतराल के आवेदन को अमान्य नहीं किया है, यह आवश्यक रूप से विश्वस्त तर्कों से निकाले गए निष्कर्षों को अमान्य नहीं करता है। ऊपरी और निचली संभावनाओं का उपयोग करते हुए एक अनुमान सिद्धांत के एक विशेष मामले के रूप में फिशर की फिदुकियल संभावना के शुरुआती कार्य की पुनर्व्याख्या करने का प्रयास किया गया था।

संरचनात्मक अनुमान
1938 से 1939 तक फिशर और पिटमैन के विचारों का विकास करते हुए, जॉर्ज ए बरनार्ड ने संरचनात्मक अनुमान या निर्णायक अनुमान, समूह परिवार पर निश्चर संभावनाओं का उपयोग कर एक दृष्टिकोण विकसित किया। बरनार्ड ने प्रतिरूपों के एक प्रतिबंधित वर्ग पर प्रत्ययी अनुमान के पीछे के तर्कों को सुधारा, जिस पर प्रत्ययी प्रक्रियाएं अच्छी तरह से परिभाषित और उपयोगी होंगी। डोनाल्ड ए एस फ्रेजर ने संरचनात्मक अनुमान के लिए एक सामान्य सिद्धांत विकसित किया समूह सिद्धांत के आधार पर और इसे रैखिक प्रतिरूप पर लागू किया। फ्रेजर द्वारा तैयार किए गए सिद्धांत में निर्णय सिद्धांत और बायेसियन सांख्यिकी के निकट संबंध हैं और यदि वे मौजूद हैं तो इष्टतम आवृत्तिवादी निर्णय नियम प्रदान कर सकते हैं।

निष्कर्ष विषय
नीचे दिए गए विषयों को सामान्यतः सांख्यिकीय अनुमिति के क्षेत्र में सम्मिलित किया जाता है।
 * 1) सांख्यिकीय अनुमानएँ
 * 2) सांख्यिकीय निर्णय सिद्धांत
 * 3) अनुमान सिद्धांत
 * 4) सांख्यिकीय परिकल्पना परीक्षण
 * 5) आंकड़ों में राय संशोधित करना
 * 6) प्रयोगों का अभिकल्पना, विचरण का विश्लेषण और प्रतिगमन विश्लेषण
 * 7) सर्वेक्षण प्रतिदर्श
 * 8) सांख्यिकीय आंकड़ों का सारांश

भविष्यसूचक अनुमान
भविष्यसूचक निष्कर्ष सांख्यिकीय अनुमिति के लिए एक दृष्टिकोण है जो पिछले टिप्पणियों के आधार पर भविष्य की टिप्पणियों की भविष्यवाणी पर जोर देता है।

प्रारंभ में, भविष्यसूचक अनुमान अवलोकन योग्य मापदंडों पर आधारित था और इसका संभाव्यता का अध्ययन करने का मुख्य उद्देश्य था, लेकिन 20वीं शताब्दी में ब्रूनो डी फिनेची द्वारा पेश किए गए एक नए प्राचलिक दृष्टिकोण के कारण यह समर्थन से बाहर हो गया। त्रुटि के साथ देखी गई भौतिक प्रणाली के रूप में दृष्टिकोण ने घटना को प्रतिरूपित किया (उदाहरण के लिए, आकाशीय यांत्रिकी)। डि फिनेटी का विनिमेयता का विचार - कि भविष्य की टिप्पणियों को पिछली टिप्पणियों की तरह व्यवहार करना चाहिए - उनके 1937 के लेख के 1974 फ़्रांसीसी से अनुवाद के साथ अंग्रेजी बोलने वाली दुनिया का ध्यान आया, और तब से सीमोर गीजर जैसे सांख्यिकीविदों द्वारा प्रतिपादित किया गया है।

यह भी देखें

 * कलन विधि निष्कर्ष
 * प्रेरण (दर्शन)
 * अनौपचारिक अनुमान तर्क
 * सूचना क्षेत्र सिद्धांत
 * जनसंख्या अनुपात
 * सांख्यिकी का सिद्धांत
 * प्रागुक्‍ति अंतराल
 * भविष्यसूचक विश्लेषणविद्या
 * भविष्यसूचक प्रतिरूपण
 * शैलीमिति

स्रोत

 * डेविड आर कॉक्स | कॉक्स, डी आर (2006)। सांख्यिकीय निष्कर्ष के सिद्धांत, कैम्ब्रिज यूनिवर्सिटी प्रेस। ISBN 0-521-68567-2.
 * रोनाल्ड ए. फिशर|फिशर, आर.ए. (1955), स्टैटिस्टिकल मेथड्स एंड साइंटिफिक इंडक्शन, रॉयल स्टैटिस्टिकल सोसाइटी का जर्नल, सीरीज बी, 17, 69-78। (जॉर्ज नेमन और अब्राहम का जन्म हुआ के सांख्यिकीय सिद्धांतों की आलोचना)
 * डेविड ए. फ्रीडमैन | फ्रीडमैन, डी. ए. (2010)। सांख्यिकीय मॉडल और आकस्मिक निष्कर्ष: सामाजिक विज्ञान के साथ एक संवाद (डेविड कोलियर (राजनीतिक वैज्ञानिक), जसजीत एस. सेखों और फिलिप बी. स्टार्क द्वारा संपादित), कैम्ब्रिज यूनिवर्सिटी प्रेस।
 * के रूप में पुनर्मुद्रित
 * कोनिशी एस., कितागावा जी. (2008), इंफॉर्मेशन क्राइटेरिया एंड स्टैटिस्टिकल मॉडलिंग, स्प्रिंगर।
 * लुसिएन ले कैम|ले कैम, लुसियान। (1986) एसिम्प्टोटिक मेथड्स ऑफ स्टैटिस्टिकल डिसीजन थ्योरी, स्प्रिंगर। ISBN 0-387-96307-3
 * डेविड एस. मूर|मूर, डी.एस.; मैककेबे, जी.पी.; क्रेग, बी.ए. (2015), सांख्यिकी के अभ्यास का परिचय, आठवां संस्करण, मैकमिलन।
 * (फिशर 1955 का उत्तर)
 * चार्ल्स सैंडर्स पियर्स|पियर्स, सी. एस. (1877-1878), इलस्ट्रेशन्स ऑफ़ लॉजिक ऑफ़ साइंस (सीरीज़), लोकप्रिय विज्ञान मासिक, वॉल्यूम। 12-13। प्रासंगिक व्यक्तिगत कागजात:
 * (1878 मार्च), द डॉक्ट्रिन ऑफ चांस, पॉपुलर साइंस मंथली, वी. 12, मार्च अंक, पीपी. 604-615। इंटरनेट आर्काइव Eprint।
 * (1878 अप्रैल), द प्रोबेबिलिटी ऑफ इंडक्शन, पॉपुलर साइंस मंथली, वी. 12, पीपी. 705–718. इंटरनेट आर्काइव Eprint।
 * (1878 जून), द ऑर्डर ऑफ नेचर, पॉपुलर साइंस मंथली, वी. 13, पीपी. 203–217.इंटरनेट आर्काइव [https: //archive.org/stream/popularsciencemo13newy#page/203/mode/1up Eprint]।
 * (1878 अगस्त), डिडक्शन, इंडक्शन और हाइपोथीसिस, पॉपुलर साइंस मंथली, वी. 13, पीपी. 470-482। इंटरनेट आर्काइव Eprint।
 * चार्ल्स सैंडर्स पियर्स | पियर्स, सी.एस. (1883), संभावित अनुमान का सिद्धांत, तर्कशास्त्र में अध्ययन, पीपी। कंपनी। (1983 में पुनर्मुद्रित, जॉन बेंजामिन पब्लिशिंग कंपनी, ISBN 90-272-3271-7)
 * (फिशर 1955 का उत्तर)
 * चार्ल्स सैंडर्स पियर्स|पियर्स, सी. एस. (1877-1878), इलस्ट्रेशन्स ऑफ़ लॉजिक ऑफ़ साइंस (सीरीज़), लोकप्रिय विज्ञान मासिक, वॉल्यूम। 12-13। प्रासंगिक व्यक्तिगत कागजात:
 * (1878 मार्च), द डॉक्ट्रिन ऑफ चांस, पॉपुलर साइंस मंथली, वी. 12, मार्च अंक, पीपी. 604-615। इंटरनेट आर्काइव Eprint।
 * (1878 अप्रैल), द प्रोबेबिलिटी ऑफ इंडक्शन, पॉपुलर साइंस मंथली, वी. 12, पीपी. 705–718. इंटरनेट आर्काइव Eprint।
 * (1878 जून), द ऑर्डर ऑफ नेचर, पॉपुलर साइंस मंथली, वी. 13, पीपी. 203–217.इंटरनेट आर्काइव [https: //archive.org/stream/popularsciencemo13newy#page/203/mode/1up Eprint]।
 * (1878 अगस्त), डिडक्शन, इंडक्शन और हाइपोथीसिस, पॉपुलर साइंस मंथली, वी. 13, पीपी. 470-482। इंटरनेट आर्काइव Eprint।
 * चार्ल्स सैंडर्स पियर्स | पियर्स, सी.एस. (1883), संभावित अनुमान का सिद्धांत, तर्कशास्त्र में अध्ययन, पीपी। कंपनी। (1983 में पुनर्मुद्रित, जॉन बेंजामिन पब्लिशिंग कंपनी, ISBN 90-272-3271-7)

अग्रिम पठन

 * Casella, G., Berger, R. L. (2002). Statistical Inference. Duxbury Press. ISBN 0-534-24312-6
 * Held L., Bové D.S. (2014). Applied Statistical Inference—Likelihood and Bayes (Springer).
 * Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics ( Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
 * Sagitov, Serik (2022). "Statistical Inference". Wikibooks. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8
 * Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics ( Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
 * Sagitov, Serik (2022). "Statistical Inference". Wikibooks. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8
 * Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8

बाहरी संबंध

 * Statistical Inference lecture on the MIT OpenCourseWare platform
 * Statistical Inference lecture by the National Programme on Technology Enhanced Learning